domingo, 12 de febrero de 2012

La Minería de Datos,  Proceso y Patrones


Todo software construido para la minería de datos posee un proceso que tiene como objetivo captar información y conocimientos valiosos para el negocio a partir de los datos. Este proceso lo podemos dividir en seis pasos:


1. Selección del conjunto datos: Consiste en escoger el grupo de variables que se someterán a análisis 
2. Análisis de las propiedades de los datos: Se evalúan las propiedades en histogramas y diagramas de  dispersión, se detectan los valores típicos y atípicos, los valores nulos entre otras propiedades.
3. Transformación del conjunto de datos de entrada: Teniendo las propiedades de los datos, estos se preparan en forma, formato o significado para hacer el procesamiento que provee la técnica de minería.
4. Seleccionar y aplicar la técnica de minería de datos: Aquí se realiza el modelo predictivo de clasificación o segmentación que permite obtener la información  relevante según las necesidades del negocio.
5. Extracción de conocimiento: Una vez se tiene la técnica de minería de datos, se prepara  un modelo de conocimiento cuya función es representar los patrones de comportamiento que arrojan los valores de las variables o las relaciones ente ellas. 
6. Interpretación y evaluación de datos: Finalmente con el conocimiento extraído se procede a evaluar la información y a presentar interpretaciones apropiadas y relevantes al negocio.

Patrones


Un método de minería de datos muy útil en la industria y el mercado es la minería de datos por patrones. Esta técnica Involucra la búsqueda de patrones repetitivos en los datos, esto permite encontrar reglas de asociación muy útiles a la hora de formular juicios predictivos. 

Dos asombrosos ejemplos de esto se exponen a continuación. 






Hábitos de compra en supermercados
El ejemplo clásico pero que tiene mucho éxito es el de los supermercados. En ellos los patrones sirven para realizar la distribución de los productos detectando la relación de compra que existe entre ellos. El ejemplo citado es:

“Un estudio muy citado detectó que los viernes había una cantidad inusualmente elevada de clientes que adquirían a la vez pañales y cerveza. Se detectó que se debía a que dicho día solían acudir al supermercado padres jóvenes cuya perspectiva para el fin de semana consistía en quedarse en casa cuidando de su hijo y viendo la televisión con una cerveza en la mano. El supermercado pudo incrementar sus ventas de cerveza colocándolas próximas a los pañales para fomentar las ventas compulsivas”   





Criminales
Otra aplicación de este método es la identificación de las redes o bandas criminales, sus líderes o integrantes clave y las relaciones entre ellos. Primero se construye una red de sospechosos que, por medio de los vínculos entre ellos en acciones y eventos y, teniendo en cuenta la periodicidad y otros factores patronales, se identifica al líder de la organización.  







Referencias
Licenciatura en Informática de la Universidad de Morón, Centro de Ingeniería de Software e Ingeniería del Conocimiento de la Escuela de Postgrado ITBA, Laboratorio de Sistemas Inteligentes de la Facultad de Ingeniería de la Universidad de Buenos Aires. Minería de Datos Aplicada a la Detección de Patrones Delictivos
en Argentina
http://www.itba.edu.ar/archivos/secciones/98JIISIC-08-31-39.pdf
(12 de Febrero de 2012)

Wikipedia. (11 de Febrero de 2012).Minería de datos.
http://es.wikipedia.org/wiki/Miner%C3%ADa_de_datos#cite_note-0
(12 de Febrero de 2012)

Wikipedia. (12 de Febrero de 2012). Data Mining.
http://en.wikipedia.org/wiki/Data_mining
(12 de Febrero de 2012)