Cualquier proyecto de Minería de Datos, independiente de su enfoque y de las técnicas de extracción utilizadas al transcurso del proceso, debe atravesar por una serie de fases que hace que el proceso sea exitoso desde que inicia hasta que culmina. Dando así un análisis completo y efectivo para tomar una decisión correcta.
Las siguientes son las fases que normalmente abarca un proyecto de Minería de Datos:
- Filtrado de Datos.
- Selección de Variables.
- Extracción de Conocimiento.
- Interpretación y Evaluación.
Imagen 1: Fases dentro de un proyecto de Minería de Datos
- Filtrado de Datos
En muchos casos el formato de los datos fuente no son adecuadamente ligeros para ser tratados en estos procesos, por tal motivo el objetivo en esta fase, es filtrar los datos de tal manera que se eliminen todos los valores incorrectos, todos los valores no validos y desconocidos, reduciendo así el número de valores posibles para ser tratados en un proceso como lo es el proceso de Data Mining.
- Selección de Variables.
Para reducir el tamaño de los datos elegidos, se deben establecer las características correspondientes y necesarias para ser aplicadas a la selección correcta de los datos. Asi tener las variables que influyen con mas fuerza en el problema a solucionar; los métodos utilizados para la selección de las características son los siguientes:
- Aquellos basados en la eleción de los mejores atributos del problema.
- Aquellos que buscan variables independientes mediante pruebas de sensibilidad, algoritmos de distancia.
- Extracción de Conocimiento
"Mediante una técnica de minería de datos, se obtiene un modelo de conocimiento,
que representa patrones de comportamiento observados en los valores de las variables del problema o relaciones de asociación entre dichas variables".
- Interpretación y Evaluación
Luego de obtener el modelo final, se debe validar las conclusiones obtenidas al finalizaar el proceso de extracción. Se debe comprobar que las conclusiones arrojadas son validas, suficientes y satisfactorias.
Podemos tener el caso, en el que nos resulten dos o mas modelos, utilizando distintas técnicas de extracción. En estos casos se comprobaran los modelos en busca del que solucione mejor el problema y en caso en que ninguno de los modelos obtenidos de la solución adecuada al problema, se debe alterar uno de los anteriores pasos.
Referencias:
- http://exa.unne.edu.ar/depar/areas/informatica/SistemasOperativos/MineriaDatosBressan.htm#Algoritmos%20de%20Miner%C3%ADa%20de%20Datos
- http://exa.unne.edu.ar/depar/areas/informatica/SistemasOperativos/Mineria_DatosVallejos.pdf