lunes, 5 de marzo de 2012


El Valor de los Datos que Transitan Internet




La minería Web (Web Mining o Webmining) es la metodología de recolección de información en la WEB. Por medio de minería de datos, se extrae información del contenido de las páginas, de los enlaces y de los registros de navegación.





En ésta, la era de la información la minería de datos en la WEB se hace protagonista.

Al cierre del 2011 se alcanza la gigantesca cifra de 2.1 mil millones de usuarios de internet en el mundo, además los usuarios de internet en los diferentes continentes son entre el 11% y el 78% de la población total y ahora con el auge del internet móvil, esta cifra sigue subiendo. Cada uno de estos usuarios día a día van dejando un rastro importante de datos que se convierten, para muchos, en el oro del momento.    

  
Las empresas que mejor convierten los datos en información relevante para el negocio y ésta a su vez en conocimiento útil para la innovación, son las empresas que lideran los mercados. Cada día, muchos sitios de internet están recogiendo datos, haciendo clasificaciones y encontrando patrones por medio de técnicas de minería de datos (WEB Mining), sacando provecho de la información implícita que dejamos. Hay tres objetivos claves en la minería WEB:


Minería del uso de la Web
Es el proceso mediante el cual se extrae información del historial de los registros del servidor con el fin de descubrir cómo y para qué usa la web e identificar lo que los usuarios buscan en Internet.
Minería del contenido de la Web
Con este método se extraen e integran los datos útiles, información y conocimiento de los contenidos de la Web tales como imágenes, audio, texto, video, etc.
Minería de la estructura de la Web
En este proceso se utiliza la teoría de grafos para analizar el nodo y las estructuras de conexión de un sitio web.


Empresas poderosas por la información que poseen, como Google, FaceBook, Micosoft, Yahoo, Apple entre otros, hacen uso de la minería Web; esto les permite, por ejemplo, mejorar el acierto en la publicidad que aparece en las páginas al clasificar a los usuarios de acuerdo las características encontradas por medio de sus datos; identificar preferencias u opiniones de los clientes oportunamente a través del reconocimiento de patrones en las búsquedas o compras. En internet es fácil encontrar datos generales como la ubicación o la hora que pueden ayudar a crear estadísticas relevantes a los negocios.

Toda esta información, en un alto porcentaje, es usada para encontrar clientes potenciales en internet para todo tipo de productos y servicios.

Ventajas
Muchas son las ventajas que provee esta tecnología, influye en que aumenten los volúmenes en el comercio, aporta en la aparición de nuevas iniciativas, productos y servicios, provoca mas innovación, permite un mejor servicio al cliente, apoya el control de la autoridades por medio de la predicción de actividades delictivas. En líneas generales, si los datos y la información son “el oro del momento”, la minería Web es la herramienta para extraerlo.

Polémicas
Como todo no es color de rosa, cabe mencionar que entre todo este bum de la información en internet, hay algunas polémicas que surgen del manejo que se le da a la información. La que más ruido hace es la que se refiere a la información personal y al derecho a la privacidad. Existen empresas que se dedican a crear y vender a terceros clasificaciones y bases con los datos de los usuarios que inocentemente transitan en internet.  Mucha de la información personal de los usuarios de internet se encuentra suelta y sin restricciones,  ¿Hasta qué punto será que es tolerable su uso?

Referencias
Wikipedia. (4 de Marzo de 2012). Web Mining
(4 de Marzo de 2012)
NAP. Comportamiento del trafico NAP en Colombia
(4 de Marzo de 2012)

Pingdom. (17 de Enero de 2012).  Internet 2011 in numbers
(4 de Marzo de 2012)
Jorge Enrique Mújica, LC. (13 de Septiembre de 2010). El negocio de la información personal en Internet
(4 de Marzo de 2012)

Jessica E. Vascellaro. (12 de Agosto de 2010). La publicidad personalizada y el dilema de Google sobre privacidad
(4 de Marzo de 2012)
Time Magazine. Joel Stain(10 de Marzo de 2011). How Companies Now Know Everything About You
(4 de Marzo de 2012)