Explicación docente: decisión por decisión
Guía para presentar la aplicación en una clase de 2 horas y conectar cada módulo con Big Data.
| Componente | Decisión tomada | Por qué | Problema que soluciona | Concepto Big Data | Qué explicar | Mejora real |
|---|---|---|---|---|---|---|
| Uso de PHP | Se implementó la lógica con PHP 8 procedural modular. | Es común en entornos educativos y servidores XAMPP/Laragon. | Permite procesar datos sin infraestructura compleja. | Procesamiento server-side | PHP recibe el CSV, consume API, calcula KPIs y genera vistas. | Migrar a arquitectura MVC, API REST o microservicios. |
| Uso de CSV | El CSV es la fuente principal de ventas internas. | Es portable, simple y exportable desde Excel, ERP o POS. | Facilita enseñar ingesta de datos estructurados. | Variedad e ingesta | Un CSV representa una extracción operacional inicial. | Reemplazar por base de datos, data lake o conexión directa al ERP. |
| Uso de API real | Se consume mindicador.cl con cURL. | Aporta datos económicos chilenos actuales. | Enriquece la mirada comercial con contexto externo. | Integración heterogénea | Las empresas combinan datos internos y externos. | Persistir indicadores históricos en tabla de dimensión económica. |
| Datos de respaldo | Se usa JSON local cuando la API falla. | Una clase no debe depender de conectividad perfecta. | Mantiene operativo el dashboard. | Tolerancia a fallos | Toda integración externa requiere plan de contingencia. | Implementar caché, colas, reintentos y observabilidad. |
| Validación de archivos | Se revisa extensión, MIME, tamaño, encabezados y columnas. | Evita datos inválidos y errores de procesamiento. | Mejora calidad y seguridad básica. | Calidad de datos | No todo dato recibido es confiable. | Crear reglas de calidad, perfilamiento y rechazo controlado. |
| Limpieza básica | Los números se normalizan antes del cálculo. | CSV puede traer separadores, símbolos o espacios. | Permite cálculos consistentes. | Preparación de datos | Antes de analizar hay que limpiar. | Usar pipelines ETL/ELT y reglas documentadas. |
| KPIs | Se calculan ventas, utilidad, margen, ticket y líderes. | La gerencia necesita indicadores resumidos. | Convierte datos en información accionable. | Métricas de negocio | Un KPI debe medir algo que apoye decisiones. | Definir gobierno de métricas y diccionario de indicadores. |
| Dashboard | Se visualizan KPIs y gráficos ejecutivos. | Reduce complejidad y permite comparar rápido. | Apoya monitoreo y priorización. | Visualización analítica | Un dashboard responde preguntas frecuentes. | Conectar a BI, refresco automático y filtros por rol. |
| Análisis exploratorio | Se calculan estadísticas numéricas y frecuencias. | Antes de decidir se debe entender el dataset. | Detecta patrones, nulos y sesgos. | EDA | Explorar evita conclusiones apresuradas. | Automatizar perfilamiento y detección de anomalías. |
| Modelo multidimensional | El usuario elige dimensión, medida y agregación. | Simula consultas OLAP de forma didáctica. | Permite analizar ventas desde varias perspectivas. | OLAP y cubos | Dimensión agrupa, medida cuantifica, agregación resume. | Diseñar modelo estrella con tablas de hechos y dimensiones. |
| Gráficos | Se usa Chart.js para barras, dona y línea. | Es liviano y fácil de entender. | Comunica patrones de forma visual. | Storytelling de datos | El gráfico correcto depende de la pregunta. | Usar herramientas BI y capas semánticas certificadas. |
| Reporte ejecutivo | Se genera HTML imprimible como PDF. | Un proyecto de datos debe terminar en comunicación. | Entrega hallazgos, conclusiones y recomendaciones. | Data storytelling | El valor no está solo en calcular, sino en explicar. | Generar reportes programados y trazables. |
| Manejo de errores | Se muestran mensajes claros y fallback de API. | Los fallos deben ser comprensibles para usuarios. | Evita interrupciones en la demostración. | Resiliencia | Un sistema de datos debe anticipar fallos. | Logs centralizados, alertas y gestión de incidentes. |
| Separación de archivos | Includes, assets, data y páginas están separados. | Facilita explicar responsabilidades por módulo. | Mejora mantenibilidad. | Arquitectura modular | Separar responsabilidades reduce acoplamiento. | Adoptar MVC, namespaces, Composer y pruebas. |
| Diseño responsivo | Bootstrap 5 y CSS propio adaptan la interfaz. | El dashboard debe funcionar en distintos dispositivos. | Mejora la presentación en aula. | Acceso ubicuo | La visualización debe ser legible y usable. | Aplicar design system y pruebas responsive. |
| Seguridad básica | Se sanitiza salida y se restringen uploads. | Archivos cargados pueden ser riesgosos. | Reduce XSS y ejecución accidental. | Gobierno y seguridad | La analítica también debe proteger datos. | Autenticación, autorización, auditoría y cifrado. |
- ¿Qué problema empresarial resuelve esta aplicación?
- ¿Qué diferencia existe entre dato, información e indicador?
- ¿Por qué la empresa usa un CSV en este prototipo?
- ¿Qué valor agrega integrar una API externa?
- ¿Qué riesgos existen al depender de una API pública?
- ¿Qué KPI sería más relevante para la gerencia y por qué?
- ¿Qué dimensión elegirían para analizar ventas?
- ¿Qué medida usarían para evaluar desempeño comercial?
- ¿Qué gráfico comunica mejor los resultados?
- ¿Qué decisión concreta podría tomar la empresa con estos datos?
- ¿Qué limitaciones tiene el prototipo?
- ¿Cómo se escalaría esta solución con una base de datos real?
- ¿Cómo se conectaría con un data warehouse?
- ¿Cómo se relaciona con cubos OLAP?
- ¿Qué mejoras aplicarían para hacerlo más profesional?
Esta aplicación no intenta reemplazar una plataforma BI empresarial; muestra, de forma funcional y explicable, el camino desde datos crudos hasta decisiones: ingesta, validación, limpieza, integración, indicadores, exploración, agregación multidimensional, visualización y reporte.
Para escalarla se usarían conectores a ERP/CRM, procesos ETL programados, almacenamiento histórico, modelo estrella con tabla de hechos de ventas y dimensiones de tiempo, producto, cliente, canal y geografía, además de gobierno de datos, seguridad, auditoría y procesamiento distribuido cuando el volumen lo justifique.