Especificación de Status Page
Documento técnico-operativo. Define los requerimientos para la página de estado pública de Lawra. Una status page transparente reduce el volumen de soporte durante incidentes y construye confianza con los usuarios. Versión: 1.0.
1. Propósito y URL
URL objetivo: status.lawra.io
La status page es la fuente de verdad pública sobre el estado operativo de la plataforma Lawra. Debe ser accesible siempre, incluyendo cuando la plataforma principal esté caída (hosted externamente o en infraestructura independiente).
2. Componentes a Monitorear
| Componente | Descripción | SLA Objetivo |
|---|---|---|
| Plataforma Web | lawra.io — carga de página, autenticación | 99.9% uptime |
| Ask Lawra (AI Chat) | Disponibilidad del chat con Gemini | 99.5% uptime |
| Trial Simulator | Simulador de juicio | 99.5% uptime |
| Council of Jurists | Panel de juristas | 99.5% uptime |
| Herramientas de Práctica | 9 herramientas generativas | 99.5% uptime |
| Autenticación (Firebase Auth) | Login Google + email + anónimo | 99.9% uptime |
| Firestore / Base de datos | Likes, submissions, conversaciones | 99.9% uptime |
| Pagefind Search | Búsqueda en sitio | 99% uptime |
| API Gemini / Google AI | Dependencia externa principal | Reportar degradación si detectada |
| GitHub Pages / Deploy | Hosting del sitio estático | Reportar si hay problemas de deploy |
3. Estados de Componente
| Estado | Color | Descripción |
|---|---|---|
| Operational | Verde | Funcionando dentro de parámetros normales |
| Degraded Performance | Amarillo | Funciona pero más lento de lo normal o con errores intermitentes |
| Partial Outage | Naranja | Parte de los usuarios afectados |
| Major Outage | Rojo | La mayoría o todos los usuarios afectados; funcionalidad no disponible |
| Under Maintenance | Azul | Mantenimiento programado en curso |
4. Niveles de Incidente
Nivel 1 — Degradación Menor
- Impacto: < 5% de usuarios; respuestas lentas; errores intermitentes
- Comunicación: actualizar status page; no es necesario email a usuarios
- Tiempo de resolución objetivo: 2 horas
Nivel 2 — Degradación Significativa
- Impacto: 5–30% de usuarios o funcionalidad importante degradada
- Comunicación: actualizar status page con descripción; tweet/post si aplica
- Tiempo de resolución objetivo: 4 horas
Nivel 3 — Interrupción Mayor
- Impacto: > 30% de usuarios afectados o plataforma completamente caída
- Comunicación: actualizar status page inmediatamente; email a todos los usuarios activos dentro de 30 min; update cada 30 min durante el incidente
- Tiempo de resolución objetivo: 8 horas
5. Plantillas de Comunicación de Incidentes
Plantilla — Inicio del Incidente
[NOMBRE_COMPONENTE] — [Degraded / Partial Outage / Major Outage]
Hemos identificado un problema que afecta a [nombre del componente]. Nuestro equipo está investigando activamente.
- Inicio del incidente: [hora y fecha UTC/ET]
- Usuarios afectados: [descripción general]
- Síntomas: [qué puede estar experimentando el usuario]
- Próxima actualización: en [30/60] minutos
Plantilla — Actualización en Curso
[NOMBRE_COMPONENTE] — Actualización [#N]
Continuamos investigando [/trabajando en la resolución de] el incidente que afecta [nombre del componente].
- Estado actual: [breve descripción técnica sin exceso de jerga]
- Causa raíz tentativa: [si se ha identificado]
- Acciones en curso: [qué está haciendo el equipo]
- Próxima actualización: en [30/60] minutos
Plantilla — Resolución
[NOMBRE_COMPONENTE] — Resuelto
El incidente ha sido resuelto. Todos los sistemas están operando con normalidad.
- Duración total: [X horas Y minutos]
- Causa raíz: [explicación breve y honesta]
- Acción correctiva: [qué se hizo para resolver y prevenir recurrencia]
Pedimos disculpas por cualquier inconveniente causado. Si experimentas algún problema residual, contáctanos en [soporte@lawra.io].
6. Herramientas Recomendadas
| Herramienta | Plan | Costo | Notas |
|---|---|---|---|
| Statuspage.io (Atlassian) | Starter | USD 29/mes | Estándar de industria; integra con PagerDuty |
| Better Uptime | Basic | USD 20/mes | Incluye monitoreo + status page + on-call |
| Instatus | Startup | USD 20/mes | Moderno, API-first, buen UI |
| UptimeRobot + Status Page | Free/Pro | USD 0–7/mes | Básico pero funcional para etapa Seed |
| Freshstatus (Freshworks) | Free | USD 0 | Opción gratuita con funciones limitadas |
Recomendación para etapa Seed: Better Uptime o Instatus ofrecen monitoreo + status page en un solo producto a precio razonable. Statuspage.io es la opción profesional para cuando haya inversores institucionales o clientes Enterprise.
7. Monitoreo Técnico
Configurar alertas automáticas para:
- Uptime: ping cada 1 minuto a endpoints críticos (homepage, /api/health si existe, Firebase Auth endpoint)
- Tiempo de respuesta: alerta si > 3 segundos (degraded) o > 10 segundos (outage)
- SSL: alerta 30 días antes de vencimiento de certificado
- Gemini API: monitorear rate limit errors en logs de Firebase; escalar si error rate > 1%
- Deploy: notificación de fallo en GitHub Actions workflow
8. SLA Formal (para contratos Enterprise)
| Nivel de Servicio | Uptime Garantizado | Crédito por Incumplimiento |
|---|---|---|
| Standard (Basic/Optimum) | 99.5%/mes | Crédito de 1 día por hora de downtime > SLA |
| Enterprise | 99.9%/mes | Crédito de 3 días por hora de downtime > SLA |
Los créditos de SLA no aplican a: mantenimientos programados notificados con 48h de anticipación, fuerza mayor, incidentes causados por el usuario, o interrupciones de proveedores de infraestructura (Firebase/Google) fuera del control de Lawra.
Versión 1.0 — Aprobado por la Asamblea en [__]. Responsable técnico: CTO (Luishy Medina). Implementar en status.lawra.io antes del primer contrato Enterprise. Próxima revisión: anual o ante cambios de infraestructura.
Comments
Loading comments...