Prefacio
El análisis de canastas o de cesta de compra (en inglés es conocido como Market Basket Analysis o simplemente por la sigla MBA) es una herramienta poderosa en el mercadeo. Permite entender mejor el comportamiento y los hábitos de compra de los clientes cuando se cuenta con datos transaccionales. En especial, el MBA encuentra reglas de asociación que permiten identificar qué productos suelen comprarse juntos. Como se discutirá en esta obra, las reglas de asociación son útiles, por ejemplo, para desarrollar estrategias de ventas cruzadas y promociones personalizadas.
Este libro está dirigido a dos roles en el mundo del business analytics: el científico de datos y el analytics translator. Normalmente, detrás del proceso de transformar datos en insights para la toma de decisiones existe un equipo con profesionales con diferentes roles y competencias. En estos equipos son pieza clave el científico de datos y el analytics translator. El científico de datos estima y entrena modelos estadísticos y de inteligencia artificial para resolver las preguntas de negocio planteadas.
El analytics translator facilita la comunicación entre el equipo de científicos de datos, los tomadores de decisiones, así como con los stakeholders del proyecto. Su rol principal es traducir el lenguaje técnico del científico de datos a un lenguaje comprensible para los tomadores de decisiones. Además, el analytics translator se encarga de identificar las necesidades y objetivos del negocio, para asegurarse de que el trabajo del científico de datos esté alineado con ellos. De esta manera, el analytics translator juega un papel fundamental en el éxito de un proyecto de análisis de datos, garantizando una comunicación clara y efectiva entre el equipo técnico realizando los cálculos y las personas tomando las decisiones.
En este orden de ideas, el Capítulo 1 discute qué es el MBA, para qué es útil y cómo encaja este tipo de análisis en las tareas y tipos de analítica. Así mismo, este capítulo presenta una historia mítica que da origen a este campo de estudio. El Capítulo 1 está escrito tanto para científicos de datos como para analytics translators. En este se discuten conceptos importantes de mercadeo que emplean los tomadores de decisiones; conceptos que deberían conocer los científicos de datos.
El Capítulo 2 presenta los conceptos que se emplean en el MBA, como regla de asociación, las métricas y el algoritmo Apriori. Para lograr esto, a lo largo del capítulo, se emplea un ejemplo sencillo que termina con una discusión de cómo se pueden emplear los resultados para la toma de decisiones. Este capítulo le permitirá a científicos de datos y analytics translators establecer un lenguaje común y una comprensión del MBA que les facilitará establecer una comunicación fluida.
El Capítulo 3 desarrolla un ejemplo de análisis de canasta de inicio a fin empleando una base de datos extensa de una empresa de comercio electrónico con sede en el Reino Unido. Se muestra cómo emplear R para llevar a cabo el análisis que se presentó en el Capítulo 2. Si bien este capítulo está escrito principalmente para científicos de datos que emplean R, puede ser útil para el rol de analytics translators (sin necesidad de todo el detalle técnico) los pasos que deben realizar los científicos de datos para obtener reglas de decisión a partir del MBA.
El entender la creación de las reglas de asociación le permitirá al analytics translator tener una mayor comprensión del tiempo y el trabajo involucrado en un análisis de canasta. Como parte de un equipo, es importante que cada uno de los miembros tenga un conocimiento general de los conceptos (esto lo logra el Capítulo 2) y procesos involucrados en el MBA (esto lo logra el Capítulo 3). El conocimiento mutuo de los roles facilitará la colaboración y la comprensión dentro del equipo.
El Capítulo 4 muestra diferentes alternativas para visualizar y presentar los resultados de un MBA. El científico de datos construirá las visualizaciones y el analytics translator las empleará para comunicar los resultados a las personas que toman decisiones. Así mismo, las tablas con las reglas de decisión serán una herramienta importante para los tomadores de decisiones. De esta manera, tanto el científico de datos como el analytics translator deberán acordar la mejor forma de presentar y visualizar los resultados del MBA para garantizar una comunicación clara y efectiva. Este capítulo le permite a ambos roles conocer qué tipo de visualización y presentación de resultados están disponibles, a la vez que le muestra a los científicos de datos cómo construir dichas visualizaciones.
Finalmente, el Capítulo 5 presenta un segundo ejemplo más elaborado de un MBA empleando datos de una panadería en línea de Edimburgo. Este ejemplo le permitirá tanto al rol de científicos de datos como al de analytics translator explorar con mayor profundidad cómo el MBA puede ser empleado sobre diferentes segmentos de los consumidores para brindar insights al negocio que lleven a decisiones accionables.
El libro está construido de tal manera que sea útil tanto para el rol de científico de datos como para el de analytics translator. Los lectores con el rol de analytics translator podrán saltar el detalle técnico del código en R en los capítulos 3 y 4 sin miedo a perder la continuidad del texto.
Para los lectores en el rol de científico de datos, es importante mencionar que este libro supone un uso intermedio de R. Si crees que necesitas algún refuerzo en R, recomendamos tres libros. Alonso & Ocampo (2022) presenta una breve introducción para iniciar a usar R. Ese primer libro discute cómo instalar R y RStudio y paquetes, cómo cargar diferentes bases de datos y cómo realizar operaciones aritméticas y lógicas con objetos. En Alonso y Ocampo (2022) también se discuten las clases esenciales de objetos sencillos y compuestos. No dudes en consultar ese primer libro si aún no has iniciado tu camino por el universo de R.
El segundo libro de la serie (Alonso, 2022), presenta una breve introducción al paquete para dplyr (Wickham et al., 2021) que permite manipular objetos que contengan datos. En ese libro se discute cómo filtrar observaciones, crear nuevas variables y combinar objetos con datos. Es recomendable tener un conocimiento de ese paquete antes de leer esta obra. Consulta ese segundo libro si aún no has tenido alguna experiencia manipulando objetos con datos con dplyr.
Finalmente, recomendamos (Alonso & Largo, 2023), en el que se presenta una introducción a la creación de visualizaciones con el paquete ggplot2 (Wickham, 2016). En esta obra trabajaremos en visualizaciones empleando el paquete ggplot2. Así, este libro asume un manejo intermedio de R y de los paquetes dplyr y ggplot2.
Esta obra recoge nuestra experiencia trabajando con R y el MBA para la transformación de datos en conclusiones que faciliten la toma de decisiones en organizaciones privadas y públicas. ¡Esperamos encuentres esta obra útil y la compartas con otros! Si tienes alguna sugerencia del libro o corrección, no dudes en escribirnos. Esta es una obra en constante construcción.