Business Intelligence (BI) y cómo explicarselo a los niños

 No  soy el champion de la Inteligencia de Negocios (Business Intelligence o BI), pero como sé que ésta es un área que nos es ajena a varios arquitectos de software (remarco que no dije todos), al menos quiero contar lo más destacado del último Architect Forum que hicimos en Microsoft Chile
 
Antes de responder la pregunta fundamental, qué es, una introducción al tema. Normalmente cuando pensamos en los datos de la organización, lo primero que viene a la mente es la base o las bases de datos de la compañía. Sin embargo, siendo que nosotros somos techies y por ende no dedicamos cabeza a notar este hecho, los datos van aumentando de relevancia según la forma en que se organicen para presentarse. Cuando dejan de ser meros registros para tabularse en un reporte, tabla pivote o mismo en el resultado de una query SQL, esos mismos datos pasan a ser información. Esa información se transforma en conocimiento cuando desde ella se calculan determinados indicadores que nos permitan hacer análisis sobre el negocio. Visión a futuro es el máximo grado de relevancia de los datos, y es aquel que hace posible clasificar oportunidades, segmentar clientes, predecir resultados en base a tendencias observadas
 
Ahora sí, entonces, definamos Inteligencia de Negocios como la transformación de datos (meros registros, archivos XML, etc) en información estratégica que facilite la toma temprana de decisiones de negocio. Surge como una forma de poner fin al caos de información proveniente de diversos sistemas y consolidada a mano, con balances que no cuadran con los reportes detallados
 
El problema clásico que impedía lograr Inteligencia de Negocios era que los sistemas transaccionales corrientes (a los que en la jerga de BI se los llama On Line Transaction Processing, u OLTP) suelen dedicar la mayor parte de su ejecución a almacenar grandes volúmenes de datos y no tanto a hacer análisis de los mismos, ya que están destinados primariamente a automatizar procesos de negocio. Pero no es que estén mal planteados: es esa automatización de procesos su principal función, la mejora de productividad de los usuarios. Agregarles mayor responsabilidad sería complejizarlos, encarecer su mantenibilidad
 
Lo que pasaba, y eso constituía un problema, era que la transformación de datos en visión a futuro se hacía en forma batch por procesos costosísimos tanto en uso de CPU como en mantenibilidad y administración. Me acuerdo todavía llegar al trabajo en una compañía de telefonía móvil, donde manejaba el área de soporte a usuarios y con cierta frecuencia ocurría que durante las primeras horas el on line estaba seriamente comprometido porque los procesos nocturnos de análisis de datos no habían aún terminado. Sin embargo a nivel gerencial era impensable no contar con esos resultados ya que para la dirección de la compañía era como avanzar sin un mapa. Como resultado de esto surgieron los sistemas de Procesamiento de Análisis en Línea (On Line Analysis Processing u OLAP). Los mismos permiten obtener Inteligencia de Negocios en cualquier momento. Normalmente corren en servidores dedicados para no interferir con producción
 
Un detalle que se debe considerar antes de comenzar a encarar un proceso de BI es determinar cuáles son las fuentes confiables de datos (además de las bases de datos de las aplicaciones, el ERP, el CRM, el proceso contable…). Confiables hace referencia a si son completas y correctas. Una vez detectadas esas fuentes, existen a grandes rasgos dos técnicas para organizar los datos: almacenes (data warehouses) y centros comerciales (data marts)
 
Los data warehouses son puntos de consolidación de datos desde diversos sistemas de producción. Estos datos entonces son producidos indirectamente por sistemas OLTP para ser consumidos por sistemas OLAP, no por usuarios finales. A este proceso se lo conoce como Extraer, Transformar y Cargar (Extract, Transform and Load o ETL). Uno de los objetivos primarios es el de la creación de un Modelo de Datos Empresariales (Enterprise Data Model o EDM). Podría decirse que en esa misión quimérica terminan fracasando en proveer información útil en tiempo y forma. Como contrapartida, los data marts son consolidaciones de granularidad más fina, apuntando a comunidades específicas y especialmente a los requerimientos informacionales de usuarios finales. Entonces tendremos el data mart de ventas, el data mart de clientes, y así. En cierto sentido son más legibles que los data warehouses
 
Hoy por hoy ambas técnicas juegan en forma combinada, no son antagónicas realmente. Sugiero leer un viejo pero excelente artículo: Building the Data Mart, de Marc Demarest. Existen hoy dos modelos de arquitectura de información para análisis: el relacional de Inmon y el dimensional de Kimball. No voy a ahondar acá de los detalles de ambos pero un buen artículo que los compara se puede ver acá
 
A partir de estos almacenes o data marts, la información se presenta en cubos multidimensionales. Qué son esas multidimensiones? Supongamos que tenemos datos rankeables por varias columnas (comuna, sexo, edad, ingreso anual, etc) y necesitamos consolidar la información por diferentes combinaciones de esos rangos (por sexo y luego por edad; por comuna, luego por edad y luego por ingreso anual; por ingreso anual y luego por comuna; etc). Cada uno de estos rangos es una dimensión. La combinación de varios es una organización multidimensional de los datos. Un sistema de Inteligencia de Negocios posilita la creación y mantención de estas organizaciones multidimensionales en una forma que eficientice el uso de los recursos y maximice la disponibilidad de estos así llamados cubos
 
Otra manera de agrupar información es en la forma de tableros de control (scorecards o balanced scorecards). Estos son conjuntos de indicadores de gestión predefinidos (Key Performance Indicators o KPI’s). Cada KPI se puede entender como una tupla con
  • Valor actual
  • Meta
  • Estado actual
  • Tendencia
Graficamente hablando, los tableros de control puede ser planillas excel donde las celdas con resultados adoptan automaticamente colores verde, amarillo o rojo según criterios (estado actual o tendencia, por ejemplo). El modelo más tradicional de tablero de control es el de Norton y Kaplan (Universidad de Harvard). Recomendable visitar The Balanced Scorecard Institute
 
Lo visto hasta acá no está completo si no destacamos las técnicas para clasificar, estimar y predecir. Estas técnicas se conocen popularmente como técnicas de minado de datos (data mining). Las técnicas son útiles según el contexto de negocios. Hay un ejemplo exótico para contar: una empresa de supermercados usaba la técnica de análisis del carrito de compras (market basket analysis) y allí determinó que los fines de semana aquellos clientes que compraban cerveza, compraban frecuentemente pañales descartables. Qué era lo que ocurría? Se trataba de padres de familia que el fin de semana se quedaban a ver deportes por televisión con amigos (de allí las cervezas) y como en ese instante no le iban a dedicar tiempo a la familia, al menos como compensación se encargaban de proveer pañales para los niños menores. De allí que esta cadena de supermercados comenzó a acomodar los pañales cerca de las cervezas, para facilitar así la visita de este segmento de clientes
 
Otra técnica, análisis de mercado (market analysis) segmenta a los clientes o potenciales clientes (prospectos o prospects) en forma automática. Analiza tendencias de estos segmentos y en base a eso decide campañas de marketing. No voy a profundizar acá sobre técnicas, sólo contar que existen suites de minado de datos que ya las traen incorporadas. Para profundizar más sobre conceptos de minado de datos recomiendo dos artículos: uno de StatSoft y la visión de de Microsoft con sus herramientas Analysis ServicesIntegration Services. Ambas dentro de SQL Server 2005
 
La dura, es todo cuanto conozco (hoy) del tema. En lo que a Inteligencia de Negocios respecta, yo mucho de Negocios no puedo opinar (bueno, y ya que salió el tema, en lo pertinente a Inteligencia… mejor disimulemos…) Espero, no obstante, haberte aclarado puntos que no conocías y haberlo hecho en forma sencilla y amena
Esta entrada fue publicada en Software Architecture. Guarda el enlace permanente.

Una respuesta a Business Intelligence (BI) y cómo explicarselo a los niños

  1. Luis dijo:

    Hola!!! Gracias por el articulo, estuvo muy claro. Ahora me siento capaz de explicarle a mis hijos como es que me gano la vida =DEspero sigas agregando articulos. Saludos!

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión / Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión / Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión / Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión / Cambiar )

Conectando a %s