
Plan de Continuidad
de Negocio
1. Objetivos Clave
-
RTO (Recovery Time Objective): ≤ 4 horas para incidentes críticos.
-
RPO (Recovery Point Objective): Cercano a cero (replicación continua en Azure).
-
Disponibilidad Garantizada: 99.5% mensual (excluyendo mantenimientos programados o causas externas).
2. Infraestructura y Estrategia de Continuidad
Arquitectura en Microsoft Azure
-
BaaS (Backend-as-a-Service): Polaris opera sobre Azure, utilizando servicios administrados como:
-
Azure SQL Database (alta disponibilidad con replicación en tiempo real).
-
Azure Blob Storage (almacenamiento redundante en zonas de disponibilidad).
-
Azure Backup: Copias diarias con retención configurable (mínimo 30 días).
-
Azure Defender: Servicio de seguridad integrada
-
Redundancia Geográfica:
-
Los datos se replican en dos regiones de Azure (ej: Sureste de USA y Este de USA).
-
El cliente puede contratar zonas alternas en caso de necesidad.
-
En caso de desastre regional, el failover se activa automáticamente a la región secundaria.
3. Gestión de Incidentes
Clasificación de Incidentes:
-
Crítico
-
Definición: Caída total del servicio o pérdida de datos.
-
Respuesta: Activación inmediata del plan de recuperación.
-
-
Mayor
-
Definición: Funcionalidades clave de bajo impacto operativo
-
Respuesta: Resolución en ≤ 8 horas.
-
-
Menor
-
Definición: Errores parciales sin impacto operativo inmediato.
-
Respuesta: Resolución en ≤ 72 horas.
-
Proceso de Recuperación
-
Detección y Notificación:
-
Monitoreo 24/7 con servicios integrados de monitoreo de Azure / servicios de terceros y herramientas propias de Polaris.
-
Alertas automáticas al equipo de ForTech y al cliente (vía email/SMS).
-
-
Failover Automatizado (ASR):
-
Para incidentes críticos: Los servicios se redirigen a la región de respaldo.
-
Datos replicados: Garantía de sincronización continua (RPO cercano a cero).
-
-
Restauración de Backups (Azure Backup):
-
Recuperación de datos en ≤ 4 horas para pérdidas no cubiertas por replicación.
-
4. Roles y Responsabilidades
Roles:
-
Equipo ForTech
-
Responsabilidad: Ejecutar el failover, validar integridad de datos y notificar al cliente.
-
Respnsabilidad: Soporte técnico prioritario para incidentes críticos (SLA de respuesta ≤ 2 hora).
-
-
Cliente
-
Responsabilidad: Proporcionar contacto clave para autorizaciones y validar funcionalidad post-recuperación.
-
5. Comunicación Durante Incidentes
-
Canal Principal: Notificaciones en tiempo real mediante el portal de Polaris y correo electrónico.
-
Actualizaciones Periódicas: Cada 30 minutos durante incidentes críticos.
-
Post-Incidente: Informe detallado con causas, acciones tomadas y medidas preventivas.
6. Pruebas y Mantenimiento
-
Simulacros Trimestrales: Ejecución de failover y restauración de backups para validar el plan.
-
Actualizaciones Automatizadas: Parches de seguridad aplicados en ventanas de mantenimiento programadas.
7. Documentación y Acceso
-
Repositorio Central: Disponible en el portal de Polaris