16/06/2026 17:12  |  Big Data · Semana 16 · Actividad 3.7 Sin datos cargados

Explicación docente: decisión por decisión

Guía para presentar la aplicación en una clase de 2 horas y conectar cada módulo con Big Data.

Tabla de decisiones técnicas y pedagógicas
Componente Decisión tomada Por qué Problema que soluciona Concepto Big Data Qué explicar Mejora real
Uso de PHPSe implementó la lógica con PHP 8 procedural modular.Es común en entornos educativos y servidores XAMPP/Laragon.Permite procesar datos sin infraestructura compleja.Procesamiento server-sidePHP recibe el CSV, consume API, calcula KPIs y genera vistas.Migrar a arquitectura MVC, API REST o microservicios.
Uso de CSVEl CSV es la fuente principal de ventas internas.Es portable, simple y exportable desde Excel, ERP o POS.Facilita enseñar ingesta de datos estructurados.Variedad e ingestaUn CSV representa una extracción operacional inicial.Reemplazar por base de datos, data lake o conexión directa al ERP.
Uso de API realSe consume mindicador.cl con cURL.Aporta datos económicos chilenos actuales.Enriquece la mirada comercial con contexto externo.Integración heterogéneaLas empresas combinan datos internos y externos.Persistir indicadores históricos en tabla de dimensión económica.
Datos de respaldoSe usa JSON local cuando la API falla.Una clase no debe depender de conectividad perfecta.Mantiene operativo el dashboard.Tolerancia a fallosToda integración externa requiere plan de contingencia.Implementar caché, colas, reintentos y observabilidad.
Validación de archivosSe revisa extensión, MIME, tamaño, encabezados y columnas.Evita datos inválidos y errores de procesamiento.Mejora calidad y seguridad básica.Calidad de datosNo todo dato recibido es confiable.Crear reglas de calidad, perfilamiento y rechazo controlado.
Limpieza básicaLos números se normalizan antes del cálculo.CSV puede traer separadores, símbolos o espacios.Permite cálculos consistentes.Preparación de datosAntes de analizar hay que limpiar.Usar pipelines ETL/ELT y reglas documentadas.
KPIsSe calculan ventas, utilidad, margen, ticket y líderes.La gerencia necesita indicadores resumidos.Convierte datos en información accionable.Métricas de negocioUn KPI debe medir algo que apoye decisiones.Definir gobierno de métricas y diccionario de indicadores.
DashboardSe visualizan KPIs y gráficos ejecutivos.Reduce complejidad y permite comparar rápido.Apoya monitoreo y priorización.Visualización analíticaUn dashboard responde preguntas frecuentes.Conectar a BI, refresco automático y filtros por rol.
Análisis exploratorioSe calculan estadísticas numéricas y frecuencias.Antes de decidir se debe entender el dataset.Detecta patrones, nulos y sesgos.EDAExplorar evita conclusiones apresuradas.Automatizar perfilamiento y detección de anomalías.
Modelo multidimensionalEl usuario elige dimensión, medida y agregación.Simula consultas OLAP de forma didáctica.Permite analizar ventas desde varias perspectivas.OLAP y cubosDimensión agrupa, medida cuantifica, agregación resume.Diseñar modelo estrella con tablas de hechos y dimensiones.
GráficosSe usa Chart.js para barras, dona y línea.Es liviano y fácil de entender.Comunica patrones de forma visual.Storytelling de datosEl gráfico correcto depende de la pregunta.Usar herramientas BI y capas semánticas certificadas.
Reporte ejecutivoSe genera HTML imprimible como PDF.Un proyecto de datos debe terminar en comunicación.Entrega hallazgos, conclusiones y recomendaciones.Data storytellingEl valor no está solo en calcular, sino en explicar.Generar reportes programados y trazables.
Manejo de erroresSe muestran mensajes claros y fallback de API.Los fallos deben ser comprensibles para usuarios.Evita interrupciones en la demostración.ResilienciaUn sistema de datos debe anticipar fallos.Logs centralizados, alertas y gestión de incidentes.
Separación de archivosIncludes, assets, data y páginas están separados.Facilita explicar responsabilidades por módulo.Mejora mantenibilidad.Arquitectura modularSeparar responsabilidades reduce acoplamiento.Adoptar MVC, namespaces, Composer y pruebas.
Diseño responsivoBootstrap 5 y CSS propio adaptan la interfaz.El dashboard debe funcionar en distintos dispositivos.Mejora la presentación en aula.Acceso ubicuoLa visualización debe ser legible y usable.Aplicar design system y pruebas responsive.
Seguridad básicaSe sanitiza salida y se restringen uploads.Archivos cargados pueden ser riesgosos.Reduce XSS y ejecución accidental.Gobierno y seguridadLa analítica también debe proteger datos.Autenticación, autorización, auditoría y cifrado.
Guion docente para 2 horas
00:00-00:10
Inicio
Presentar el problema empresarial, la actividad 3.7 y el aprendizaje esperado: aplicar modelos multidimensionales para soluciones Big Data.
00:10-00:25
Página inicial
Mostrar objetivo, fuentes y flujo de datos. Preguntar qué decisiones necesita tomar una gerencia comercial.
00:25-00:40
CSV interno
Cargar el dataset, revisar encabezados, validaciones y vista previa. Explicar por qué CSV sirve para prototipado.
00:40-00:55
API externa
Mostrar indicadores económicos, endpoint, estado de conexión y respaldo. Discutir riesgos de depender de APIs.
00:55-01:15
Dashboard
Interpretar KPIs y gráficos. Relacionar cada indicador con una decisión gerencial concreta.
01:15-01:35
Análisis exploratorio
Revisar estadísticas numéricas, frecuencias y hallazgos. Conversar sobre nulos, outliers y patrones.
01:35-01:50
Modelo multidimensional
Construir consultas por región, categoría, vendedor o canal. Explicar dimensión, medida y agregación.
01:50-02:00
Reporte y cierre
Generar reporte, revisar conclusiones, preguntar mejoras y conectar con data warehouse, ETL y cubos OLAP.
Preguntas para estudiantes
  1. ¿Qué problema empresarial resuelve esta aplicación?
  2. ¿Qué diferencia existe entre dato, información e indicador?
  3. ¿Por qué la empresa usa un CSV en este prototipo?
  4. ¿Qué valor agrega integrar una API externa?
  5. ¿Qué riesgos existen al depender de una API pública?
  6. ¿Qué KPI sería más relevante para la gerencia y por qué?
  7. ¿Qué dimensión elegirían para analizar ventas?
  8. ¿Qué medida usarían para evaluar desempeño comercial?
  9. ¿Qué gráfico comunica mejor los resultados?
  10. ¿Qué decisión concreta podría tomar la empresa con estos datos?
  11. ¿Qué limitaciones tiene el prototipo?
  12. ¿Cómo se escalaría esta solución con una base de datos real?
  13. ¿Cómo se conectaría con un data warehouse?
  14. ¿Cómo se relaciona con cubos OLAP?
  15. ¿Qué mejoras aplicarían para hacerlo más profesional?
Cómo explicar la integración de datos
CSV ventas internas
+
API indicadores externos
Procesamiento PHP
Dashboard
Reporte
Idea clave: no todos los datos deben vivir en el mismo archivo. El CSV contiene la operación interna y la API agrega contexto externo. En una empresa real este flujo se implementaría con ETL/ELT, base de datos, data warehouse, modelo estrella y herramientas BI.
Conclusión y escalamiento a Big Data

Esta aplicación no intenta reemplazar una plataforma BI empresarial; muestra, de forma funcional y explicable, el camino desde datos crudos hasta decisiones: ingesta, validación, limpieza, integración, indicadores, exploración, agregación multidimensional, visualización y reporte.

Para escalarla se usarían conectores a ERP/CRM, procesos ETL programados, almacenamiento histórico, modelo estrella con tabla de hechos de ventas y dimensiones de tiempo, producto, cliente, canal y geografía, además de gobierno de datos, seguridad, auditoría y procesamiento distribuido cuando el volumen lo justifique.