tag:blogger.com,1999:blog-81467281429515801362023-11-16T02:15:05.755-05:00Soluciones De Software - Data Mining SoftwareEl objetivo principal de este blog es dar a conocer las diferentes técnicas y/o herramientas que son de vital importancia para la definición adecuada de una Solución de Software, al momento de hablar sobre MINERIA DE DATOS.aljurepastranmorenohttp://www.blogger.com/profile/17032234509937787478noreply@blogger.comBlogger17125tag:blogger.com,1999:blog-8146728142951580136.post-46222968951240519272012-05-06T16:23:00.002-05:002012-05-06T16:27:40.673-05:00<br />
<div class="MsoNormal" style="text-align: center;">
</div>
<div class="MsoNormal" style="text-align: center;">
<span lang="ES-CO">NUESTRA ÚLTIMA
PUBLICACIÓN – LA NASA Y LA MINERÍA DE DATOS EN FAVOR DE LA AVIACIÓN<o:p></o:p></span></div>
<br />
<div class="MsoNormal" style="text-align: justify;">
<span lang="ES-CO"><br /></span></div>
<div class="MsoNormal" style="text-align: justify;">
<a href="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEgNODuuhLWmeNOPr67uj2DhrCcQTNgqFTD2TxJEeERNkYFSHpADyv92cz18YffvVjcwfZKMq-L09KQhp0Nh2alXJX5ougQsNmQ9oHFrSBqBQ0CDGe3QmUtHX-onK_-dHOsXD5oenxF_F44/s1600/AVION.jpg" imageanchor="1" style="clear: left; float: left; margin-bottom: 1em; margin-right: 1em;"><img border="0" height="142" src="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEgNODuuhLWmeNOPr67uj2DhrCcQTNgqFTD2TxJEeERNkYFSHpADyv92cz18YffvVjcwfZKMq-L09KQhp0Nh2alXJX5ougQsNmQ9oHFrSBqBQ0CDGe3QmUtHX-onK_-dHOsXD5oenxF_F44/s200/AVION.jpg" width="200" /></a><span lang="ES-CO">Como bien hemos
hablado durante la vigencia de este blog, los software de minería de datos son
herramientas muy útiles al servicio de los negocios y la sociedad que entregan
ventajas competitivas y de anticipación. <o:p></o:p></span></div>
<div class="MsoNormal" style="text-align: justify;">
<span lang="ES-CO"><br /></span></div>
<div class="MsoNormal" style="text-align: justify;">
<span lang="ES-CO"><br /></span></div>
<div class="MsoNormal" style="text-align: justify;">
<a href="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEhZmJW6sBatIyVeXiS8UnQM-2VR-57fwU-okUZH9jKmcXLeAWoYqKoATt6BEv40rwt6e8wbMC2yzAzycGuelIiqU8pR7J2Wb6TQ8ovNfAfYF98l8zFjHuf7AQbEm8zG2g8pwk8L8hzYhwo/s1600/nasa.jpg" imageanchor="1" style="clear: right; float: right; margin-bottom: 1em; margin-left: 1em;"><img border="0" height="166" src="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEhZmJW6sBatIyVeXiS8UnQM-2VR-57fwU-okUZH9jKmcXLeAWoYqKoATt6BEv40rwt6e8wbMC2yzAzycGuelIiqU8pR7J2Wb6TQ8ovNfAfYF98l8zFjHuf7AQbEm8zG2g8pwk8L8hzYhwo/s200/nasa.jpg" width="200" /></a><span lang="ES-CO">La NASA está investigando cómo, por medio de la minería
de datos, se pueden prever problemas aeronáuticos en pro de la aviación segura.
Las aeronaves modernas producen volúmenes enormes de datos y la NASA está buscando formas de encontrar información
entre todos esos datos que permita prevenir accidentes. Actual mente se usa la minería
de datos en aviación pero aún hay trabajo por hacer, hoy cuando cae un avión,
por medio de la caja negra y otras fuentes de almacenamiento de datos es
posible encontrar las causas que produjeron el accidente, es por eso que se le
ve potencial a este programa para encontrar automática y oportunamente
problemas solucionables a través de la minería de la detección de anomalías, para
evitar desastres y hacer más seguro el transporte aéreo.<o:p></o:p></span></div>
<div class="MsoNormal" style="text-align: justify;">
<span lang="ES-CO"><br /></span></div>
<div class="MsoNormal" style="text-align: justify;">
<span lang="ES-CO"><br /></span></div>
<div class="separator" style="clear: both; text-align: center;">
<a href="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEgUfUSIcJPQj3_KN8i0tog9pvFOa5vJVpTZHwuo1FuGyh6a47NKmlgEM8YJAZgP1nOsn_E1LZkhEieqiGcZHli-Gr7eB-yY2f34znlC-q1Ghyyu9UZP-_ndT-cqcfN5Wu2r6mWJ8UULddI/s1600/Caja-negra.jpg" imageanchor="1" style="margin-left: 1em; margin-right: 1em;"><img border="0" height="150" src="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEgUfUSIcJPQj3_KN8i0tog9pvFOa5vJVpTZHwuo1FuGyh6a47NKmlgEM8YJAZgP1nOsn_E1LZkhEieqiGcZHli-Gr7eB-yY2f34znlC-q1Ghyyu9UZP-_ndT-cqcfN5Wu2r6mWJ8UULddI/s200/Caja-negra.jpg" width="200" /></a><a href="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEjKcRbrnUnq5RfTTHNoZAJzmzPISo_N2dFE1YzCfik_4F8cK1hx4TMoL7QTA2dZnxI385rIjjKDZ4w-3Q7V0CNwsWkxczv5LlOWG1PIMC_2PxUlljSvbqYvt5Ng2EDpRBrYsenOg60Z-ns/s1600/datos.png" imageanchor="1" style="margin-left: 1em; margin-right: 1em;"><img border="0" height="125" src="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEjKcRbrnUnq5RfTTHNoZAJzmzPISo_N2dFE1YzCfik_4F8cK1hx4TMoL7QTA2dZnxI385rIjjKDZ4w-3Q7V0CNwsWkxczv5LlOWG1PIMC_2PxUlljSvbqYvt5Ng2EDpRBrYsenOg60Z-ns/s200/datos.png" width="200" /></a></div>
<div class="MsoNormal" style="text-align: justify;">
<span lang="ES-CO"><br /></span></div>
<div class="MsoNormal" style="text-align: justify;">
Aquí les dejo un
video de un programa documental que desglosa el tema.</div>
<div class="MsoNormal" style="text-align: justify;">
<span lang="ES-CO"><br /></span></div>
<div class="MsoNormal" style="text-align: justify;">
Disclose.tv. (Mar 29 de 2012). The Leading Edge: Nasa Data Mining
Aviation Data</div>
<div class="MsoNormal" style="text-align: justify;">
<span lang="ES-CO"><a href="http://www.disclose.tv/action/viewvideo/92261/The_Leading_Edge__Nasa_Data_Mining_Aviation_Data/"><span lang="EN-US">http://www.disclose.tv/action/viewvideo/92261/The_Leading_Edge__Nasa_Data_Mining_Aviation_Data/</span><o:p></o:p></a></span></div>
<div class="MsoNormal" style="text-align: justify;">
<span lang="ES-CO"><br /></span></div>
<div class="MsoNormal" style="text-align: justify;">
(Mayo 06 de 2012).<o:p></o:p><br />
<br /></div>
<div class="separator" style="clear: both; text-align: center;">
<iframe allowfullscreen='allowfullscreen' webkitallowfullscreen='webkitallowfullscreen' mozallowfullscreen='mozallowfullscreen' width='320' height='266' src='https://www.youtube.com/embed/kxH5z8YsKuo?feature=player_embedded' frameborder='0'></iframe></div>
<br />
<br />
<span style="text-align: justify;">Agradecemos a
nuestros visitantes por seguirnos durante este viaje a través de la minería de
datos, sus características, bondades y curiosidades.</span><br />
<div class="MsoNormal" style="text-align: justify;">
<span lang="ES-CO"><br /></span></div>
<div class="MsoNormal" style="text-align: justify;">
<span lang="ES-CO">Agradecemos al
grupo de Soluciones de Software de la facultad de Ingeniería de Sistemas de la
Escuela Colombiana de Ingeniería Julio Garavito y el Ingeniero Mauricio Martínez
Franki. <o:p></o:p></span></div>aljurepastranmorenohttp://www.blogger.com/profile/17032234509937787478noreply@blogger.com0tag:blogger.com,1999:blog-8146728142951580136.post-41030498036807195852012-04-29T23:26:00.001-05:002012-04-30T07:59:27.254-05:00<span style="font-size: x-large;">
R como una herramienta para la minería de datos.</span><br />
<span style="font-size: x-large;"><br /></span><br />
<div class="separator" style="clear: both; text-align: center;">
<a href="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEiyzHHCi4da3CIfo4yBWhzeu7oP9PBPbyNPXFXRiFZGePnI9q819otZ_7gtD2LEHwYPtWEx00LP3OJlBGlniL9i5cOFuCoxyK2rRdZ6a55opFZXL7fo0AeygoaS5zK4lq1KvWuqbI39aCU/s1600/Rlogo.png" imageanchor="1" style="clear: left; float: left; margin-bottom: 1em; margin-right: 1em;"><img border="0" height="243" src="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEiyzHHCi4da3CIfo4yBWhzeu7oP9PBPbyNPXFXRiFZGePnI9q819otZ_7gtD2LEHwYPtWEx00LP3OJlBGlniL9i5cOFuCoxyK2rRdZ6a55opFZXL7fo0AeygoaS5zK4lq1KvWuqbI39aCU/s320/Rlogo.png" width="320" /></a></div>
<span class="" lang="es"><span class="hps"><br /></span></span><br />
<span class="" lang="es"><span class="hps"><br /></span></span><br />
<span class="" lang="es"><span class="hps"><br /></span></span><br />
<span class="" lang="es"><span class="hps"><br /></span></span><br />
<span class="" lang="es"><span class="hps"><br /></span></span><br />
<span class="" lang="es"><span class="hps"><br /></span></span><br />
<span class="" lang="es"><span class="hps"><br /></span></span><br />
<span class="" id="result_box" lang="es"><span class="hps">Es</span> <span class="hps">una de las herramientas</span> <span class="hps">más utilizadas</span> <span class="hps">de minería de datos</span> <span class="hps">en</span> <span class="hps">aplicaciones científicas</span> <span class="hps">y empresariales</span>, <span class="hps">entre las decenas de</span> <span class="hps">software de minería</span> <span class="hps">comercial y</span> <span class="hps">de código abierto</span> <span class="hps">de datos.</span> <span class="hps">Es gratuito y</span> <span class="hps">ampliable. E</span></span><span class="hps">s</span> <span class="hps">parte del proyecto</span> <span class="hps">GNU y su </span><span class="hps">código fuente </span><span class="hps">está escrito principalmente en</span> <span class="hps">C. E</span><span class="hps">stá disponible libremente bajo</span> <span class="hps">la Licencia</span> <span class="hps">Pública General de GNU y </span><span class="hps">utiliza</span> <span class="hps">una interfaz de</span> <span class="hps">línea de comandos</span><span class="">, sin embargo,</span> <span class="hps">varias</span> <span class="hps">interfaces gráficas de usuario</span> <span class="hps">están disponibles</span> <span class="hps">para su uso</span><span class="hps">.</span><br />
<span class="hps"><br /></span><br />
<span class="hps"><span class="" id="result_box" lang="es"><span class="hps">Lo que hace</span> <span class="hps">tan útil</span> a <span class="hps">R</span> <span class="hps">y lo que ayuda con la explicación de</span> <span class="hps">su rápida aceptación, </span><span class="hps">es que</span> <span class="hps">los estadísticos</span><span class="">, ingenieros y científicos</span> <span class="hps">pueden mejorar</span> <span class="hps">el código</span> <span class="hps">del software</span> <span class="hps">o escribir</span> <span class="hps">variaciones</span> <span class="hps">para tareas específicas.</span> </span></span><br />
<span class="hps"><span class="" lang="es"><span class="" lang="es"><span class="hps"><br /></span></span></span></span><br />
<span class="hps"><span class="" lang="es"><span class="" id="result_box" lang="es"><span class="hps">Cerca de</span> <span class="hps">1.600</span> <span class="hps">paquetes</span> <span class="hps">diferentes, residen </span><span class="hps">en</span> <span class="hps">uno de</span> <span class="hps">los</span> <span class="hps">muchos sitios web</span> <span class="hps">dedicados</span><span class="">,</span> aumentando su cantidad<span class="hps"> de manera exponencial</span>. Por ejemplo u<span class="hps">no de los paquetes encontrados en la web</span><span class="">, es el paquete llamado</span> <span class="hps"><b>BiodiversityR</b></span><span class="">,</span> que nos <span class="hps">ofrece una interfaz gráfica</span> <span class="hps">destinada a</span> <span class="hps">realizar los cálculos</span> <span class="hps">de</span> <span class="hps">las tendencias ambientales</span> <span class="hps">con mayor facilidad. Aparte de análisis de estados ambientales, R nos ofrece una gran variedad de áreas en las que se puede utilizar con el fin de obtener tendencias o información importante de los diversos datos obtenidos, almacenados y analizados. Entre estas áreas se pueden encontrar las que siguen:</span></span></span></span><br />
<span class="" lang="es"><span class="hps"><br /></span></span><br />
<span class="hps">*</span> Finanzas<br />
<span class="hps">*</span> <span class="hps">Venta al por menor</span><br />
<span class="hps">* Seguros</span><br />
<span class="hps">* Telecomunicaciones</span><br />
<span class="hps">*</span> <span class="hps">Gobierno</span><br />
<span class="hps">*</span> <span class="hps">Crimen y</span> <span class="hps">Seguridad</span><br />
<span class="hps">*</span> <span class="hps">Mercado de Valores</span><br />
<span class="hps">*</span> <span class="hps">Bienestar Social</span><br />
<span class="hps">*</span> <span class="hps">Medios de Comunicación Social</span><br />
<span class="hps">* Deportes</span><br />
<span class="hps">*</span> <span class="hps">Medicina y Salud</span><br />
<span class="hps">*</span> <span class="hps">Educación</span><br />
<span class="hps">*</span> <span class="hps">Transporte</span><br />
<span class="hps">*</span> <span class="hps">Meteorología</span><br />
<span class="hps">* Medio ambiente</span><br />
<span class="hps">*</span> <span class="hps">Fabricación</span><br />
<span class="hps">*</span> <span class="hps">Análisis de Datos</span> <span class="hps">Espaciales</span><br />
<span class="hps">*</span> <span class="hps">Computación Científica</span><br />
<br />
<br />
<div>
<br /></div>
<div>
Paginas de referencia:</div>
<div>
<br />
<ul>
<li>http://www.rdatamining.com/books/book2</li>
<li>http://en.wikipedia.org/wiki/Data_mining</li>
<li>http://en.wikipedia.org/wiki/R_%28programming_language%29</li>
</ul>
</div>aljurepastranmorenohttp://www.blogger.com/profile/17032234509937787478noreply@blogger.com0tag:blogger.com,1999:blog-8146728142951580136.post-17583895042800384892012-04-22T22:52:00.000-05:002012-04-22T23:02:27.813-05:00La importancia del contexto empresarial y tecnológico. Ejemplo: Pentaho Business Analytics.<div class="separator" style="clear: both; text-align: center;">
<br /></div>
<a href="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEjnp1msodwVhpNaPYR_r7WwyzOgMt4fWG8cYDrCQGphLGtypvrOT8nfFTftp5UenwQz8vhsJ1QDaqYkRxGFxiBDtG16XCWZ181MjjaaYkaKn99rEUTvTOSzemfIBWSTYi_wZ9WqqXsHy3U/s1600/ph03.png" imageanchor="1" style="clear: left; float: left; margin-bottom: 1em; margin-right: 1em;"><img border="0" height="200" src="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEjnp1msodwVhpNaPYR_r7WwyzOgMt4fWG8cYDrCQGphLGtypvrOT8nfFTftp5UenwQz8vhsJ1QDaqYkRxGFxiBDtG16XCWZ181MjjaaYkaKn99rEUTvTOSzemfIBWSTYi_wZ9WqqXsHy3U/s200/ph03.png" width="161" /></a><a href="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEgbLmeu_zbkCuRpE1JQKz93fBg9Yts8lDJxFOHET6LFT1AOM40sLm8O2fbW8im4AINSi7p4wiw8s6_iAmCzsAaDTIWncl6KPNsQZJ4Vkn0CXdOaLpI18Zrn_-mssAsxwblbUIjjSBz0r3Y/s1600/ph01.png" imageanchor="1" style="clear: right; float: right; font-weight: normal; margin-bottom: 1em; margin-left: 1em; text-align: center;"><br /></a><a href="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEhFSAfSVSolLnfEPl2ePF9pPHbzsGl8eSNs4B6ZEhUqrWvnCXaemwxqGJqt5D9YARlSAgjiFzfdrKFuXpGwMIuPgRLm0eQOMpgL2U_DZccNXf6TsP_x4Mq9NT3aFYUVFBysDpZwkiwGEyY/s1600/ph02.png" imageanchor="1" style="clear: left; float: left; font-family: 'Times New Roman'; font-size: medium; margin-bottom: 1em; margin-right: 1em; text-align: center; white-space: normal;"><br /></a><a href="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEj9EcGM0eUaP9eCAdmHU121D2tu3X5r6Ua26_DIeoGf1Pw-LVFdnxjtJthOU4nzPjpUVRANAhtf3UjlHkA9eOiSHkje73o8HGDebEutcG9FMg0kzqIBHgZzPz8JPzNqUHEfubdhBqbAyKQ/s1600/ph03.png" imageanchor="1" style="clear: right; float: right; font-weight: normal; margin-bottom: 1em; margin-left: 1em;"><br /></a><a href="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEj9EcGM0eUaP9eCAdmHU121D2tu3X5r6Ua26_DIeoGf1Pw-LVFdnxjtJthOU4nzPjpUVRANAhtf3UjlHkA9eOiSHkje73o8HGDebEutcG9FMg0kzqIBHgZzPz8JPzNqUHEfubdhBqbAyKQ/s1600/ph03.png" imageanchor="1" style="clear: right; float: right; margin-bottom: 1em; margin-left: 1em;"><br /></a><b id="internal-source-marker_0.7861501586157829"><span style="font-family: Arial; font-size: 15px; font-weight: normal; vertical-align: baseline; white-space: pre-wrap;">Antes de presentar esta herramienta que por muchas razones es hoy famosa, quisiéramos dejar una reflexión respecto a la minería de datos en el contexto empresarial: ¿por qué es conveniente utilizarla?, ¿le sirve a todas las empresas?, ¿qué se gana al “minar” los datos?, ¿y cómo se diseña un proceso de minería de datos? </span><br /><span style="font-family: Arial; font-size: 15px; font-weight: normal; vertical-align: baseline; white-space: pre-wrap;"></span><span style="font-family: Arial; font-size: 15px; font-weight: normal; vertical-align: baseline; white-space: pre-wrap;">
Un primer acercamiento a estos interrogantes que justifican el estudio de esta solución de software es precisamente pensar si usted conoce realmente las necesidades de su organización. La minería de datos, por sí sola, no constituye una ganancia, y su utilidad estará dada en la medida en que se utilice de manera ajustada a la empresa, pues la inversión en tiempo y recursos de todo tipo puede ser realmente alta.</span>
<br /><span style="font-family: Arial; font-size: 15px; font-weight: normal; vertical-align: baseline; white-space: pre-wrap;">
Una parte importante de la selección es también pensar que la solución adquirida sea útil de acuerdo a las posibles tendencias tecnológicas. Basándonos en esto, y en<a href="http://www.pcworld.com.mx/Articulos/19396.htm" target="_blank"> las tendencias tecnológicas sugeridas por Gartner Inc.</a>, sugerimos que sería útil que las aplicaciones soporten el manejo de grandes cantidades de información (Big Data), que tengan integración en dispositivos móviles, que funcionen también en la nube, y por supuesto, que apoyen los análisis de próxima generación. </span></b><br />
<br />
<div style="text-align: right;">
<a href="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEgbLmeu_zbkCuRpE1JQKz93fBg9Yts8lDJxFOHET6LFT1AOM40sLm8O2fbW8im4AINSi7p4wiw8s6_iAmCzsAaDTIWncl6KPNsQZJ4Vkn0CXdOaLpI18Zrn_-mssAsxwblbUIjjSBz0r3Y/s1600/ph01.png" imageanchor="1" style="clear: right; float: right; font-weight: normal; margin-bottom: 1em; margin-left: 1em; text-align: center;"><img border="0" height="147" src="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEgbLmeu_zbkCuRpE1JQKz93fBg9Yts8lDJxFOHET6LFT1AOM40sLm8O2fbW8im4AINSi7p4wiw8s6_iAmCzsAaDTIWncl6KPNsQZJ4Vkn0CXdOaLpI18Zrn_-mssAsxwblbUIjjSBz0r3Y/s200/ph01.png" width="200" /></a><b> </b></div>
<b><span style="font-family: Arial; font-size: 15px; font-weight: normal; vertical-align: baseline; white-space: pre-wrap;"></span><br /><span style="font-family: Arial; font-size: 15px; font-weight: normal; vertical-align: baseline; white-space: pre-wrap;">Dicho esto, presentamos hoy una aplicación que integra diversos aspectos para analizar el negocio en general, y que podría estar a la vanguardia en temas tecnológicos si nos regimos por las ideas mencionadas: <a href="http://www.pentaho.com/explore/pentaho-business-analytics/" target="_blank">Pentaho Business Analytics</a>, una interesante herramienta que permite hacer todo tipo de reportes, tableros de mando, análisis / minería de datos, soporte para iPad, integración y calidad de los datos, administración centralizada y despliegue en la nube. Todo esto, con un entorno bastante amigable, y disponible en diferentes versiones según las necesidades de su empresa. A continuación, se presenta el video que muestra las características de este software, que si bien va más allá de la minería de datos como solución única, se acerca de manera integral al contexto empresarial y abre paso a la inteligencia de negocios.</span></b>
<br />
<b><span style="font-family: Arial; font-size: 15px; font-weight: normal; vertical-align: baseline; white-space: pre-wrap;"><br /></span></b><br />
<div class="separator" style="clear: both; text-align: center;">
<iframe allowfullscreen='allowfullscreen' webkitallowfullscreen='webkitallowfullscreen' mozallowfullscreen='mozallowfullscreen' width='320' height='266' src='https://www.youtube.com/embed/7mooV0gBuOk?feature=player_embedded' frameborder='0'></iframe></div>
<b><span style="font-family: Arial; font-size: 15px; font-weight: normal; vertical-align: baseline; white-space: pre-wrap;"><br /></span></b><br />
<b><span style="font-family: Arial; font-size: 15px; font-weight: normal; vertical-align: baseline; white-space: pre-wrap;"><br /></span></b><br />
<b><span style="font-family: Arial; font-size: 15px; font-weight: normal; vertical-align: baseline; white-space: pre-wrap;"><br /></span></b><br />
<b><span style="font-family: Arial; font-size: 15px; vertical-align: baseline; white-space: pre-wrap;">Referencias:</span></b><br />
<b><span style="font-family: Arial; font-size: 15px; font-weight: normal; vertical-align: baseline; white-space: pre-wrap;"><br /></span></b><br />
<b><span style="font-family: Arial; font-size: 15px; font-weight: normal; vertical-align: baseline; white-space: pre-wrap;">Notas de Clase. </span></b><b><span style="font-family: Arial; font-size: 15px; font-weight: normal; vertical-align: baseline; white-space: pre-wrap;">Profesor Mauricio Martínez, Soluciones de Software, Escuela Colombiana de Ingeniería, abril de 2012.</span></b><br />
<b><span style="font-family: Arial; font-size: 15px; font-weight: normal; vertical-align: baseline; white-space: pre-wrap;"><br /></span></b><br />
<b><span style="font-family: Arial; font-size: 15px; font-weight: normal; vertical-align: baseline; white-space: pre-wrap;">Pentaho Business Analytics. </span></b><a href="http://www.pentaho.com/explore/pentaho-business-analytics/">http://www.pentaho.com/explore/pentaho-business-analytics/</a><br />
<br />
<b><span style="font-family: Arial; font-size: 15px; font-weight: normal; vertical-align: baseline; white-space: pre-wrap;">PcWorld. Tendencias Estratégicas para el 2012 por Gartner Inc. </span></b><a href="http://www.pcworld.com.mx/Articulos/19396.htm">http://www.pcworld.com.mx/Articulos/19396.htm</a>aljurepastranmorenohttp://www.blogger.com/profile/17032234509937787478noreply@blogger.com0tag:blogger.com,1999:blog-8146728142951580136.post-18227565597472473882012-04-15T14:12:00.000-05:002012-04-15T17:35:33.530-05:00<br />
<div style="text-align: center;">
<b><span style="color: #9fc5e8;">EMPECEMOS A MINAR DATOS DE VERDAD VERDAD</span></b></div>
<br />
<div style="border-bottom: medium none; border-left: medium none; border-right: medium none; border-top: medium none;">
<div style="border-bottom: medium none; border-left: medium none; border-right: medium none; border-top: medium none; text-align: justify;">
<a href="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEiLFxV096RBfdj5SQb9exQYEI0FUHwcnkaeThPjGJUOge6EkbPyLXtb8m3MBnA0efc0qwkfku5a7Z51au1XlmosL3-Q8k8F2ryme2-koCIuNJsm7WJpBuRvTwDY-1eWFDB5UYWikLcs3dw/s1600/mercado+virtual.png" imageanchor="1" style="clear: right; cssfloat: right; float: right; margin-bottom: 1em; margin-left: 1em;"><img border="0" height="200" nda="true" src="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEiLFxV096RBfdj5SQb9exQYEI0FUHwcnkaeThPjGJUOge6EkbPyLXtb8m3MBnA0efc0qwkfku5a7Z51au1XlmosL3-Q8k8F2ryme2-koCIuNJsm7WJpBuRvTwDY-1eWFDB5UYWikLcs3dw/s200/mercado+virtual.png" width="189" /></a>Con el aumento de los usuarios de Internet en todo el mundo en los últimos años, también ha aumentado el mercado virtual, es decir que cada vez hay más personas que compran por Internet y así mismo más tiendas virtuales que ofrecen más productos. Por lo anterior, el tema de la optimización automática de precios en el comercio electrónico está creciendo en importancia. Esto se debe en particular al hecho de que se pueden lograr aumentos significativos en los márgenes de utilidad utilizando estrategias inteligentes para adjudicar precios. Además de los algoritmos estándar diseñados y utilizados básicamente para la optimización de los precios de cada producto en las tiendas en línea, también se desarrollan algoritmos especiales que se utilizan para asuntos tales como la venta de los productos combinados o de la venta rápida de bienes perecederos.</div>
<div style="border-bottom: medium none; border-left: medium none; border-right: medium none; border-top: medium none;">
<br /></div>
<div class="separator" style="clear: both; text-align: center;">
<a href="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEhB0qSi7Uq108hdqTt3l885ayPBFVzBx-rwAef_wGwqRUyXLZXlnEqZi9hk9eJYaIw92WS78Xc_yvFE9njQrJZfqMatU42ITM4XkVG05AvTshjb_vlw6nTZ4ZINKwNqQ7b8xjiAMBReTAI/s1600/usuarios+de+internet.png" imageanchor="1" style="margin-left: 1em; margin-right: 1em;"><img border="0" height="171" nda="true" src="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEhB0qSi7Uq108hdqTt3l885ayPBFVzBx-rwAef_wGwqRUyXLZXlnEqZi9hk9eJYaIw92WS78Xc_yvFE9njQrJZfqMatU42ITM4XkVG05AvTshjb_vlw6nTZ4ZINKwNqQ7b8xjiAMBReTAI/s320/usuarios+de+internet.png" width="320" /></a></div>
<div style="border-bottom: medium none; border-left: medium none; border-right: medium none; border-top: medium none;">
<br /></div>
</div>
<div style="border-bottom: medium none; border-left: medium none; border-right: medium none; border-top: medium none;">
<br />
<br />
<br /> </div>
<div style="border-bottom: medium none; border-left: medium none; border-right: medium none; border-top: medium none;">
<div style="border-bottom: medium none; border-left: medium none; border-right: medium none; border-top: medium none; text-align: justify;">
<a href="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEjCfIAz4T98uOhARu_0Ds43nnNCdvMhgSueK10unrBN6Xm6Qc88UhPi5xXJsS7L37JHCoKbOb5PhnflmfP8JntFymyURXgFIMH3iF7eUej7zi_NJt9XmZr57fSIRwBpIAqnATimIaqHtmk/s1600/bandera+de+Alemania.png" imageanchor="1" style="clear: left; cssfloat: left; float: left; margin-bottom: 1em; margin-right: 1em;"><img border="0" height="125" nda="true" src="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEjCfIAz4T98uOhARu_0Ds43nnNCdvMhgSueK10unrBN6Xm6Qc88UhPi5xXJsS7L37JHCoKbOb5PhnflmfP8JntFymyURXgFIMH3iF7eUej7zi_NJt9XmZr57fSIRwBpIAqnATimIaqHtmk/s200/bandera+de+Alemania.png" width="200" /></a>Desde el 2002 se viene realizando un certamen anual en Alemania (<a href="http://www.data-mining-cup.de/en" target="_blank">Data Mining Cup</a>) que premia al mejor grupo de estudiantes desarrolladores de minería de datos. Este evento da oportunidades para foguearse en la práctica de minar datos reales y aplicar sus beneficios en un ejercicio real. Este año el concurso tiene algunos objetivos principales: la descripción de dependencias entre datos, la predicción de ítems de venta y la optimización de beneficios de un portal de ventas en línea. En el año en curso abrieron el registro de participantes el 01 de marzo, comenzó la competencia con la publicación de las tareas el 03 de abril, la competencia esta en curso y se espera la presentación de los resultados el 15 de mayo, fecha en la que se da por terminado el concurso. La premiación tendrá lugar en Berlín junto con una conferencia internacional de temas de Data Mining durante los días 26 y 27 de junio. Los premios van de 500 a 2000 euros y viajes para algunos de los integrantes de equipos finalistas a la ceremonia de premiación.</div>
<div style="border-bottom: medium none; border-left: medium none; border-right: medium none; border-top: medium none;">
<br /></div>
</div>
<div class="separator" style="clear: both; text-align: center;">
<a href="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEjnhBu1Eq1Ct7uVUGX_FRC9L5biVweIltOKd8O729jUTRI0BdWLV7yTfzB0lYy0iCRhTa_9SPzK-zQikyXTFKxW7kBbAc83L2f1CAXClrmVhvkpkjlyjvC1ynPiL2Xui52OP-0XKwOlpRc/s1600/ganadores+concurso.png" imageanchor="1" style="margin-left: 1em; margin-right: 1em;"><img border="0" height="212" nda="true" src="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEjnhBu1Eq1Ct7uVUGX_FRC9L5biVweIltOKd8O729jUTRI0BdWLV7yTfzB0lYy0iCRhTa_9SPzK-zQikyXTFKxW7kBbAc83L2f1CAXClrmVhvkpkjlyjvC1ynPiL2Xui52OP-0XKwOlpRc/s320/ganadores+concurso.png" width="320" /></a></div>
<div style="border-bottom: medium none; border-left: medium none; border-right: medium none; border-top: medium none; text-align: justify;">
<br /></div>
<br />
<div style="text-align: justify;">
Los organizadores ofrecen la información del ejercicio de la competencia, por lo cual, si estos temas le son de interés y desea realizar el ejercicio por su cuenta, en este <a href="http://www.data-mining-cup.de/en/dmc-competition/task/" target="_blank">link </a>puede encontrar la especificación.</div>
<br />
<div class="separator" style="clear: both; text-align: center;">
<a href="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEgCGitM0c-Qd0FK7zcwHgZD0FkQ1VK8bhvQiSv4ENH85EDEFYo-nX3E_rxtasZLVoUuhMfrDnSl_G3erxet5o-VIDMQteeWITjnnFT4vO8Ps0dCf-KxmQ4sCy5jkmogXC6Wledp1Bg7ekk/s1600/Patrocinadores.png" imageanchor="1" style="margin-left: 1em; margin-right: 1em;"><img border="0" height="127" nda="true" src="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEgCGitM0c-Qd0FK7zcwHgZD0FkQ1VK8bhvQiSv4ENH85EDEFYo-nX3E_rxtasZLVoUuhMfrDnSl_G3erxet5o-VIDMQteeWITjnnFT4vO8Ps0dCf-KxmQ4sCy5jkmogXC6Wledp1Bg7ekk/s320/Patrocinadores.png" width="320" /></a></div>
<div style="text-align: justify;">
<br /></div>
<div style="text-align: justify;">
<br /></div>
<div style="text-align: justify;">
Por la trayectoria del campeonato y las empresas que participan y lo respaldan, hacer parte puede ser importante tanto como vitrina como medio de aprendizaje y experiencia, por eso merece pertenecer a las consideraciones para el año que viene.</div>
<br />
<div style="text-align: justify;">
Referencias</div>
<div style="text-align: justify;">
<br /></div>
<div style="text-align: justify;">
Pagina oficial del concurso Data Mining Cup.</div>
<div style="text-align: justify;">
<a href="http://www.data-mining-cup.de/en">http://www.data-mining-cup.de/en</a></div>
<div style="text-align: justify;">
(15 de abril de 2012)</div>
<br />
<br />
<div>
<div class="separator" style="border-bottom: medium none; border-left: medium none; border-right: medium none; border-top: medium none; clear: both; text-align: center;">
</div>
<br />
<div style="border-bottom: medium none; border-left: medium none; border-right: medium none; border-top: medium none;">
</div>
<div style="border-bottom: medium none; border-left: medium none; border-right: medium none; border-top: medium none;">
<br /></div>
<div style="border-bottom: medium none; border-left: medium none; border-right: medium none; border-top: medium none;">
<br /></div>
<div style="border-bottom: medium none; border-left: medium none; border-right: medium none; border-top: medium none;">
<br /></div>
</div>
<div class="separator" style="clear: both; text-align: center;">
<br /></div>
<br />
<div class="separator" style="clear: both; text-align: center;">
<br /></div>
<br />
<div class="separator" style="clear: both; text-align: center;">
<a href="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEiLFxV096RBfdj5SQb9exQYEI0FUHwcnkaeThPjGJUOge6EkbPyLXtb8m3MBnA0efc0qwkfku5a7Z51au1XlmosL3-Q8k8F2ryme2-koCIuNJsm7WJpBuRvTwDY-1eWFDB5UYWikLcs3dw/s1600/mercado+virtual.png" imageanchor="1" style="margin-left: 1em; margin-right: 1em;"></a></div>
<br />
<div class="separator" style="clear: both; text-align: center;">
<br /></div>
<br />
<div class="separator" style="clear: both; text-align: center;">
<br /></div>
<div class="separator" style="border-bottom: medium none; border-left: medium none; border-right: medium none; border-top: medium none; clear: both; text-align: center;">
</div>aljurepastranmorenohttp://www.blogger.com/profile/17032234509937787478noreply@blogger.com0tag:blogger.com,1999:blog-8146728142951580136.post-39395657925001058022012-04-08T18:53:00.002-05:002012-04-08T23:51:44.119-05:00Fases de la Mineria de Datos<a href="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEhrqWIerCjvsK017MGpMcc-9Q2EyvcCuBx6mBdazfLikpP-B-pxSsIOnl0c0-rmVqWInyNxC2znTFWEiRnzHqBomBaRzmDWlYSLB3cfzyPx49saADWWsQ_BHTZkUReBpn_N5Fioj0fB8bw/s1600/grafica.jpg" imageanchor="1" style="clear: right; float: right; margin-bottom: 1em; margin-left: 1em;"><img border="0" height="147" src="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEhrqWIerCjvsK017MGpMcc-9Q2EyvcCuBx6mBdazfLikpP-B-pxSsIOnl0c0-rmVqWInyNxC2znTFWEiRnzHqBomBaRzmDWlYSLB3cfzyPx49saADWWsQ_BHTZkUReBpn_N5Fioj0fB8bw/s200/grafica.jpg" width="200" /></a><br />
<br />
<br />
Cualquier proyecto de Minería de Datos, independiente de su enfoque y de las técnicas de extracción utilizadas al transcurso del proceso, debe atravesar por una serie de fases que hace que el proceso sea exitoso desde que inicia hasta que culmina. Dando así un análisis completo y efectivo para tomar una decisión correcta.<br />
<br />
<br />
Las siguientes son las fases que normalmente abarca un proyecto de Minería de Datos:
<br />
<br />
<br />
<ul>
<li>Filtrado de Datos.</li>
<li>Selección de Variables.</li>
<li>Extracción de Conocimiento.</li>
<li>Interpretación y Evaluación.</li>
</ul>
<br />
<div>
<div class="separator" style="clear: both; text-align: center;">
<a href="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEi9ivk2xTMAAp7aBhRPSbS-ZRi_LWu9CqYCkYwGCZFZbvcxxfiTpA6TpMCUd6vhTl_qrv8oXbV_hZs4GNAf88vlB-FUE46MHBZaIfsiIpcPDYE9PZ-PItYDimVwNwFUMPHnILP8TlZCOEQ/s1600/proceso.jpg" imageanchor="1" style="margin-left: 1em; margin-right: 1em;"><img border="0" src="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEi9ivk2xTMAAp7aBhRPSbS-ZRi_LWu9CqYCkYwGCZFZbvcxxfiTpA6TpMCUd6vhTl_qrv8oXbV_hZs4GNAf88vlB-FUE46MHBZaIfsiIpcPDYE9PZ-PItYDimVwNwFUMPHnILP8TlZCOEQ/s1600/proceso.jpg" /></a></div>
<div style="text-align: center;">
Imagen 1: Fases dentro de un proyecto de Minería de Datos<br />
<br />
<br />
<ul style="text-align: -webkit-auto;">
<li style="text-align: left;">Filtrado de Datos</li>
</ul>
<div style="text-align: left;">
En muchos casos el formato de los datos fuente no son adecuadamente ligeros para ser tratados en estos procesos, por tal motivo el objetivo en esta fase, es filtrar los datos de tal manera que se eliminen todos los valores incorrectos, todos los valores no validos y desconocidos, reduciendo así el número de valores posibles para ser tratados en un proceso como lo es el proceso de Data Mining. </div>
<div style="text-align: left;">
<br /></div>
<div style="text-align: -webkit-auto;">
<div style="text-align: left;">
</div>
</div>
<ul style="text-align: -webkit-auto;">
<li style="text-align: left;">Selección de Variables.</li>
</ul>
<div style="text-align: left;">
Para reducir el tamaño de los datos elegidos, se deben establecer las características correspondientes y necesarias para ser aplicadas a la selección correcta de los datos. Asi tener las variables que influyen con mas fuerza en el problema a solucionar; los métodos utilizados para la selección de las características son los siguientes:</div>
<div style="text-align: left;">
<br /></div>
<div style="text-align: left;">
<ul><ul>
<li>Aquellos basados en la eleción de los mejores atributos del problema.</li>
<li>Aquellos que buscan variables independientes mediante pruebas de sensibilidad, algoritmos de distancia. </li>
</ul>
</ul>
</div>
<ul style="text-align: -webkit-auto;">
<li style="text-align: left;">Extracción de Conocimiento</li>
</ul>
<div style="text-align: left;">
"Mediante una técnica de minería de datos, se obtiene un modelo de conocimiento,</div>
<div style="text-align: left;">
<div>
que representa patrones de comportamiento observados en los valores de las variables del problema o relaciones de asociación entre dichas variables".</div>
<div>
<br /></div>
</div>
<ul style="text-align: -webkit-auto;">
<li style="text-align: left;">Interpretación y Evaluación</li>
</ul>
<div style="text-align: left;">
Luego de obtener el modelo final, se debe validar las conclusiones obtenidas al finalizaar el proceso de extracción. Se debe comprobar que las conclusiones arrojadas son validas, suficientes y satisfactorias. </div>
<div style="text-align: left;">
Podemos tener el caso, en el que nos resulten dos o mas modelos, utilizando distintas técnicas de extracción. En estos casos se comprobaran los modelos en busca del que solucione mejor el problema y en caso en que ninguno de los modelos obtenidos de la solución adecuada al problema, se debe alterar uno de los anteriores pasos.</div>
<div style="text-align: left;">
<br /></div>
<div style="text-align: left;">
<br /></div>
<div style="text-align: left;">
Referencias:</div>
<div style="text-align: left;">
<ul>
<li><a href="http://exa.unne.edu.ar/depar/areas/informatica/SistemasOperativos/MineriaDatosBressan.htm#Algoritmos%20de%20Miner%C3%ADa%20de%20Datos">http://exa.unne.edu.ar/depar/areas/informatica/SistemasOperativos/MineriaDatosBressan.htm#Algoritmos%20de%20Miner%C3%ADa%20de%20Datos</a></li>
<li>http://exa.unne.edu.ar/depar/areas/informatica/SistemasOperativos/Mineria_DatosVallejos.pdf</li>
</ul>
<div class="MsoNormal">
<o:p></o:p></div>
<div class="MsoNormal">
<br /></div>
</div>
<div style="text-align: left;">
<br /></div>
<div style="text-align: left;">
<div>
<br /></div>
<div>
<br /></div>
</div>
</div>
</div>aljurepastranmorenohttp://www.blogger.com/profile/17032234509937787478noreply@blogger.com0tag:blogger.com,1999:blog-8146728142951580136.post-49496442408995932282012-04-01T22:58:00.006-05:002012-04-01T23:08:03.356-05:00Text Mining y Redes Sociales<br />
<div class="separator" style="clear: both; text-align: center;">
</div>
<div class="MsoNormal" style="clear: right; float: right; margin-bottom: 1em; margin-left: 1em;">
<br /></div>
<div class="MsoNormal">
<span lang="ES-CO"></span></div>
<br />
<a href="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEin-rph76aqddVRoHZaCQ-_xKFr2wMShUjlqdmGRKCcEm8MOIM8rjDIOPITLmd_c3h3HPDdzzbGFZF6cPRBkqZdt19EpOO_oQ_M8hMYp4lEc7E7crY2Qc8a1Z04KALBORV_nsH3lszjb9k/s1600/porfa3.png" imageanchor="1" style="clear: right; display: inline !important; float: right; margin-bottom: 1em; margin-left: 1em; text-align: center;"><img border="0" height="170" src="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEin-rph76aqddVRoHZaCQ-_xKFr2wMShUjlqdmGRKCcEm8MOIM8rjDIOPITLmd_c3h3HPDdzzbGFZF6cPRBkqZdt19EpOO_oQ_M8hMYp4lEc7E7crY2Qc8a1Z04KALBORV_nsH3lszjb9k/s200/porfa3.png" width="200" /></a><br />
<br />
<br />
En esta entrega, hablaremos de las posibilidades de extraer conocimiento a partir del texto – pero no nos referimos al texto estructurado contenido en las bases de datos: hablamos del lenguaje natural, y particularmente, de lo que se consigna en las redes sociales. La minería de texto es un área propia de estudio, pues el procesamiento de la información no estructurada es mucho más amplio y complejo que aquél ejercido sobre las bases de datos.<br />
<br />
<br />
<br />
<br />
<div class="MsoNormal">
<a href="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEjSiP5WgpjkoTlBCKOL7DNSFHzRxlhVJP74rUedsWI0V7ADNKzq5lgY2hDyafTtug19sO3WerZNYZCNyrzfvrH5p_2E_3I215cBxxujuG7N1Sv9FQ0OdhnrEJgc2dlqemk0s5C8JPb8B1U/s1600/porfa4.jpg" imageanchor="1" style="clear: left; float: left; margin-bottom: 1em; margin-right: 1em;"><img border="0" height="200" src="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEjSiP5WgpjkoTlBCKOL7DNSFHzRxlhVJP74rUedsWI0V7ADNKzq5lgY2hDyafTtug19sO3WerZNYZCNyrzfvrH5p_2E_3I215cBxxujuG7N1Sv9FQ0OdhnrEJgc2dlqemk0s5C8JPb8B1U/s200/porfa4.jpg" width="188" /></a>Muchas
organizaciones están presentes, por ejemplo, en Facebook o Twitter, pero utilizan
la minería de datos sobre información procedente de los CRM (Customer
Relationship Management) para análisis de tendencias y opiniones, desperdiciando
así grandísimos niveles de información relacionada directamente en la Web. Por
esta razón, han surgido términos como “Opinion Mining”, partiendo de la
consideración del texto que circula en Internet como <b>hechos</b> u <b>opiniones, </b>o<b> </b>“Sentiment Analysis”, que representan factores
muy valiosos para equipos de mercadeo. En este terreno, se suelen usar palabras
clave para buscar –y algunos mecanismos extra para diferenciar cuándo se puede
tratar de sarcasmos, por ejemplo–. Las aplicaciones de estos métodos son muy amplias,
y representan un gran acercamiento a los clientes.</div>
<div class="MsoNormal">
<span lang="ES-CO"><br /></span></div>
<div class="MsoNormal">
<span lang="ES-CO">Otro
interesante campo de aplicación ha sido el uso para la salud pública: por
ejemplo, se han tomado palabras clave relacionadas con la influenza, para
identificar los lugares donde los virus aparece, a partir de Blogs. Y, aún más,
se ha buscado identificar qué comunidades sociales respectivas podrían ayudar a
distribuir información preventiva. </span></div>
<div class="MsoNormal">
<span lang="ES-CO"><br /></span></div>
<div class="separator" style="clear: both; text-align: center;">
<a href="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEgUAVZmM6Ao3qdD_h-iur6rYEHex40YteV9C_VM7VFJ9t4FGvXLYLK1BvE9etSfw6x5S0dxQtODmcOYmWbQC13RUiXQMOf4uzmjzVcPxZNOQ5il3HCil4nWvsCwaCaE_7hTww-CBiEiJzg/s1600/porfa.JPG" imageanchor="1" style="clear: right; float: right; margin-bottom: 1em; margin-left: 1em;"><img border="0" height="215" src="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEgUAVZmM6Ao3qdD_h-iur6rYEHex40YteV9C_VM7VFJ9t4FGvXLYLK1BvE9etSfw6x5S0dxQtODmcOYmWbQC13RUiXQMOf4uzmjzVcPxZNOQ5il3HCil4nWvsCwaCaE_7hTww-CBiEiJzg/s400/porfa.JPG" width="400" /></a></div>
<div class="MsoNormal">
<br /></div>
<div class="MsoNormal">
Las
apariciones de influenza también han sido supervisadas a través de Twitter, así
como la definición de los analgésicos más comunes consumidos por la gente, a
partir de las recomendaciones que hacen los usuarios allí.</div>
<div class="MsoNormal">
<span lang="ES-CO"><br /></span></div>
<div class="separator" style="clear: both; text-align: center;">
<a href="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEifdTPJ4nK0gzdzx18qew52STmsh-N4hfrAqkBqhP-lh59HFrQTGcFIIOGQ80s6Xa7lbqKI5XIbJ-53FpRWdORO8yUFdiDG4atIrMEUHx9ade0Pzn7fvOGUmyhu1WansTflsHdeiAC_eV4/s1600/porfa2.png" imageanchor="1" style="clear: left; float: left; margin-bottom: 1em; margin-right: 1em;"><img border="0" height="76" src="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEifdTPJ4nK0gzdzx18qew52STmsh-N4hfrAqkBqhP-lh59HFrQTGcFIIOGQ80s6Xa7lbqKI5XIbJ-53FpRWdORO8yUFdiDG4atIrMEUHx9ade0Pzn7fvOGUmyhu1WansTflsHdeiAC_eV4/s200/porfa2.png" width="200" /></a></div>
<div class="MsoNormal">
<span lang="ES-CO">Otros
ejemplos valiosos están en la predicción de éxito de las nuevas películas, a
partir de las menciones realizadas en Twitter, o la clasificación de los tipos
de música y tags de Last.Fm, entre otros. <o:p></o:p></span></div>
<div class="MsoNormal">
<span lang="ES-CO"><br /></span></div>
<div class="MsoNormal">
<span lang="ES-CO"><br /></span></div>
<div class="MsoNormal">
<span lang="ES-CO">Para esto, se pueden utilizar herramientas como <a href="http://collectiveintellect.com/products#page=tools" target="_blank">Real Time Text Analytics</a> ,
<a href="http://www.statsoft.com/products/data-mining-solutions/" target="_blank">Statistica Text Miner</a> (como extensión de Statistica Data Miner), o <a href="http://dataminingsoftwareapm.blogspot.com/2012/02/data-mining-bajo-una-solucion-open.html" target="_blank">la anteriormente mencionada RapidMiner</a>, entre otras.<o:p></o:p></span></div>
<div class="MsoNormal">
<span lang="ES-CO"><br /></span></div>
<div class="MsoNormal">
<span lang="ES-CO" style="font-size: large;"><b>Referencias</b></span></div>
<div class="MsoNormal">
<span lang="ES-CO"><b><br /></b></span></div>
<div class="MsoNormal">
<span lang="ES-CO">Boorman, Chris. </span>Why Data Mining Is the Next Frontier for Social Media Marketing.</div>
<div class="MsoNormal">
<span lang="ES-CO"><a href="http://mashable.com/2011/02/25/data-mining-social-marketing/">http://mashable.com/2011/02/25/data-mining-social-marketing/</a>
</span></div>
<div class="MsoNormal">
<b><br /></b></div>
Jensen, David; Neville, Jennifer. Data Mining in Social Networks. University of Massachusetts. Consultado: 01.04.2012. <a href="http://www.cs.purdue.edu/homes/neville/papers/jensen-neville-nas2002.pdf">http://www.cs.purdue.edu/homes/neville/papers/jensen-neville-nas2002.pdf</a> <br />
<br />
Liu, Bing. Opinion Mining. University of Illinois, Chicago. Consultado: 01.04.2012<br />
<div class="MsoNormal">
<a href="http://www.cs.uic.edu/~liub/teach/cs583-spring-07/opinion-mining.pdf">http://www.cs.uic.edu/~liub/teach/cs583-spring-07/opinion-mining.pdf</a><br />
<span style="color: #333333; font-family: 'Segoe UI', Arial, Helvetica, sans-serif; font-size: large;"><span style="line-height: 18px;"><br /></span></span><br />
Pang, Bo; Lee, Lillian. Cornell University. Opinion Mining and Sentiment Analysis. Consultado: 01.04.2012. <a href="http://www.cs.cornell.edu/home/llee/omsa/omsa.pdf">http://www.cs.cornell.edu/home/llee/omsa/omsa.pdf</a><br /></div>
Social Media, Data Mining & Machine Learning Blog. European University of Madrid. ACM TIST Special Issue On Search And Mining User-Generated Contents. Consultado: 01.04.2012.<br />
<a href="http://machine-learning.blogspot.com/">http://machine-learning.blogspot.com/</a><br />
<br />Schönhalz, David - Entrevista para Sozial-Media-Magazin. Opinion Mining und Sentiment-Analyse im Web 2.0. <a href="http://www.social-media-magazin.de/index.php/inhalt/opinion-mining-und-sentiment-analyse-im-web-20.html">http://www.social-media-magazin.de/index.php/inhalt/opinion-mining-und-sentiment-analyse-im-web-20.html</a><br />
<div class="MsoNormal">
<br /></div>
<div class="MsoNormal">
Laurent, William. The Realities of Social Media Data Mining. Consultado: 01.04.2012. </div>
<div class="MsoNormal">
<a href="http://www.dashboardinsight.com/articles/new-concepts-in-business-intelligence/the-realities-of-social-media-data-mining.aspx">http://www.dashboardinsight.com/articles/new-concepts-in-business-intelligence/the-realities-of-social-media-data-mining.aspx</a>
</div>
<div class="MsoNormal">
<br /></div>
<div class="MsoNormal">
Asur, Sitaram; Huberman, Bernardo. Predicting the Future with Social Media. Consultado: 01.04.2012. <a href="http://www.hpl.hp.com/techreports/2010/HPL-2010-53.pdf">http://www.hpl.hp.com/techreports/2010/HPL-2010-53.pdf</a></div>
<div class="MsoNormal">
<br /></div>
<div class="MsoNormal">
Morik, Katharina. Data Mining for Social Networks. Consultado: 01.04.2012. <a href="http://www.mis.ethz.ch/teaching/FS09/FS09/documents/Data.Mining.for.Social.Networks">http://www.mis.ethz.ch/teaching/FS09/FS09/documents/Data.Mining.for.Social.Networks</a></div>aljurepastranmorenohttp://www.blogger.com/profile/17032234509937787478noreply@blogger.com0tag:blogger.com,1999:blog-8146728142951580136.post-32044249002015829392012-03-26T20:21:00.000-05:002012-03-26T20:42:05.903-05:00<br />
<div class="MsoNormal">
<span lang="ES-CO"><span style="font-size: x-large;">Qué Hace un Software
Para Minería de Datos DMS</span><o:p></o:p></span><br />
<span lang="ES-CO"><span style="font-size: x-large;"><br /></span></span></div>
<div class="separator" style="clear: both; text-align: center;">
<a href="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEjTyMCUIubNHvGVnfDEZzP57ofp5eoJMyu1h0ar-4eT1Pp1Xzn8U4FnIEygd1Wdny15sqCn43Fdjsn4WgAXAMturm1_NkSgKxjqSdbQ6pI9y_qLe0e0E-Gps-XA-lLcUfsQSB0JkAmOazg/s1600/IMG_0274.JPG" imageanchor="1" style="margin-left: 1em; margin-right: 1em;"><img border="0" height="320" src="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEjTyMCUIubNHvGVnfDEZzP57ofp5eoJMyu1h0ar-4eT1Pp1Xzn8U4FnIEygd1Wdny15sqCn43Fdjsn4WgAXAMturm1_NkSgKxjqSdbQ6pI9y_qLe0e0E-Gps-XA-lLcUfsQSB0JkAmOazg/s320/IMG_0274.JPG" width="144" /></a></div>
<br />
<div class="MsoNormal" style="text-align: justify;">
<span lang="ES-CO">Las empresas almacenan una gran cantidad de
datos que ocultan información importante, aprovechar esa información es vital
para las compañías de la era de la información.<o:p></o:p></span></div>
<div class="MsoNormal" style="text-align: justify;">
<span lang="ES-CO">La minería de datos permite descubrir automáticamente información potencialmente
útil a partir de grandes cantidades de datos. <o:p></o:p></span></div>
<div class="MsoNormal" style="text-align: justify;">
<span lang="ES-CO"><br /></span></div>
<div class="MsoNormal" style="text-align: justify;">
Existen dos clases de métodos generales
para la minería de datos:</div>
<div class="MsoNormal" style="text-align: justify;">
<span lang="ES-CO">Los métodos de predicción de
comportamientos, los cuales se usan para adelantarse a los resultados con una
buena probabilidad de acertar; y los métodos de descripción de comportamientos
que sirven para conocer los comportamientos en los acontecimientos relativos al
negocio y poder tomar ventajas estratégicas.<o:p></o:p></span></div>
<div class="MsoNormal" style="text-align: justify;">
<span lang="ES-CO"><br /></span></div>
<div class="separator" style="clear: both; text-align: center;">
<a href="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEgcqOrDwWWlKRub5rUZRqquFIhWhfPgt0yfYvVDUPG_SdgkAi6nonftF3fmiAeHVQsTREGSFDiWmi0Ghs_M3CRsLS229MOPcCk9s6HCujONbwB6VGDMeEGTkXHTorBelvjlwUpFxd5eIqw/s1600/hombre.jpg" imageanchor="1" style="clear: left; float: left; margin-bottom: 1em; margin-right: 1em;"><img border="0" height="156" src="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEgcqOrDwWWlKRub5rUZRqquFIhWhfPgt0yfYvVDUPG_SdgkAi6nonftF3fmiAeHVQsTREGSFDiWmi0Ghs_M3CRsLS229MOPcCk9s6HCujONbwB6VGDMeEGTkXHTorBelvjlwUpFxd5eIqw/s200/hombre.jpg" width="200" /></a></div>
<div class="MsoNormal" style="text-align: justify;">
<b><span lang="ES-CO">Clasificación</span></b><span lang="ES-CO">. Es un
método de predicción de comportamientos que utiliza la definición de
categorías. Como ejemplo se pueden clasificar las personas como Hombres y Mujeres
y se puede predecir de estas categorías que los hombres compran licor, y que
las mujeres compran zapatos.</span></div>
<div class="MsoNormal" style="text-align: justify;">
<b><span lang="ES-CO"><br /></span></b></div>
<div class="MsoNormal" style="text-align: justify;">
<b><br /></b></div>
<div class="MsoNormal" style="text-align: justify;">
<b><span lang="ES-CO"><br /></span></b></div>
<div class="MsoNormal" style="text-align: justify;">
<b><span lang="ES-CO"><br /></span></b></div>
<div class="separator" style="clear: both; text-align: center;">
<a href="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEihoArMenVWSIeWyAiR6Nxnh3F83bzBzBk8tlPeRO9JdffIqiH6KoKH7zjrl3sU_hM3R9zYsNZ17Y7CuYjz2iziPfwJgXJmlIguJr8SI1kHr7D1cyi7mdUdHmRS10N_6I60YOeztQmquBE/s1600/regresion.jpg" imageanchor="1" style="clear: right; float: right; margin-bottom: 1em; margin-left: 1em;"><img border="0" height="121" src="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEihoArMenVWSIeWyAiR6Nxnh3F83bzBzBk8tlPeRO9JdffIqiH6KoKH7zjrl3sU_hM3R9zYsNZ17Y7CuYjz2iziPfwJgXJmlIguJr8SI1kHr7D1cyi7mdUdHmRS10N_6I60YOeztQmquBE/s200/regresion.jpg" width="200" /></a></div>
<div class="MsoNormal" style="text-align: justify;">
<b><span lang="ES-CO">Regresión.</span></b><span lang="ES-CO"> Es otro método
de predicción de comportamientos cuyos elementos son los datos estadísticos, se
efectúan sobre éstos, cálculos de regresión para identificar tendencias y poder
predecir furas conductas.<o:p></o:p></span><br />
<span lang="ES-CO"><br /></span><br />
<span lang="ES-CO"><br /></span><br />
<span lang="ES-CO"><br /></span></div>
<div class="MsoListParagraphCxSpFirst" style="margin-left: 0in; text-align: justify;">
<b><span lang="ES-CO"><br /></span></b></div>
<div class="MsoListParagraphCxSpFirst" style="margin-left: 0in; text-align: justify;">
<a href="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEhJ0pdJ8LdVnfXN-SY9927bN4wI2QlCp7DMhmWCFenUkwIxgBrbd-6m7RCCl9_LvwfAcN50CKkbJilueiyLgwJKbCn_-LQLr0Irwcpr8xHOVpqoNJi0amVcX3yTNl9L3B8xjF86LuvIBmE/s1600/Desviacion.jpg" imageanchor="1" style="clear: left; float: left; margin-bottom: 1em; margin-right: 1em;"><img border="0" height="200" src="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEhJ0pdJ8LdVnfXN-SY9927bN4wI2QlCp7DMhmWCFenUkwIxgBrbd-6m7RCCl9_LvwfAcN50CKkbJilueiyLgwJKbCn_-LQLr0Irwcpr8xHOVpqoNJi0amVcX3yTNl9L3B8xjF86LuvIBmE/s200/Desviacion.jpg" width="200" /></a></div>
<div class="MsoListParagraphCxSpFirst" style="margin-left: 0in; text-align: justify;">
<b><span lang="ES-CO">Detección de desviaciones.</span></b><span lang="ES-CO"> Este también es un método de predicción de comportamientos, su foco
está en revelar eventos que se salen de lo normal para efectuar una predicción
de algún suceso.</span></div>
<div class="MsoListParagraphCxSpLast" style="margin-left: 0in; mso-add-space: auto;">
<br /></div>
<div class="separator" style="clear: both; text-align: center;">
<a href="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEgoKI7oJs-ODQ0HMPW5WBCL63Cg6S8ERFrFBknykjLf4el6JzXHxyz-gq1RAEpgTu9R6F-p9E2BFT8ALSfFQMQE2_lGFg-uqOg0vc39cGDqy2IVeDdLdpdRpqcH4fHXq7XOaeZp5V-Mpdg/s1600/agrupar.png" imageanchor="1" style="clear: right; float: right; margin-bottom: 1em; margin-left: 1em;"><img border="0" height="200" src="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEgoKI7oJs-ODQ0HMPW5WBCL63Cg6S8ERFrFBknykjLf4el6JzXHxyz-gq1RAEpgTu9R6F-p9E2BFT8ALSfFQMQE2_lGFg-uqOg0vc39cGDqy2IVeDdLdpdRpqcH4fHXq7XOaeZp5V-Mpdg/s200/agrupar.png" width="200" /></a></div>
<div class="MsoNormal" style="text-align: justify;">
<b><span lang="ES-CO">Agrupación
(Clustering)</span></b><span lang="ES-CO">. Este es un método de descripción de comportamientos, su
objetivo es agrupar en conjuntos los elementos similares en algún sentido para
poder describir sus características. <u><o:p></o:p></u></span></div>
<div class="MsoNormal" style="text-align: justify;">
<b><span lang="ES-CO"><br /></span></b></div>
<div class="MsoNormal" style="text-align: justify;">
<b><span lang="ES-CO"><br /></span></b></div>
<div class="MsoNormal" style="text-align: justify;">
<b><span lang="ES-CO"><br /></span></b></div>
<div class="MsoNormal" style="text-align: justify;">
<b><span lang="ES-CO"><br /></span></b></div>
<div class="MsoNormal" style="text-align: justify;">
<b><span lang="ES-CO"><br /></span></b></div>
<div class="MsoNormal" style="text-align: justify;">
<b><span lang="ES-CO"><br /></span></b></div>
<div class="MsoNormal" style="text-align: justify;">
<b><span lang="ES-CO"><br /></span></b></div>
<div class="MsoNormal" style="text-align: justify;">
<b><span lang="ES-CO"><br /></span></b></div>
<div class="MsoNormal" style="text-align: justify;">
<b><span lang="ES-CO"><br /></span></b></div>
<div class="MsoNormal" style="text-align: justify;">
<b><span lang="ES-CO"><br /></span></b></div>
<div class="separator" style="clear: both; text-align: center;">
<a href="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEiz_hbWazgTm65cXr390aU8l2n537fTL8y2UwOA2NoLtbdwF8-OMUpEUq0uBbxJ73t_HG8CN5BZnUfInnIvDEXxzMBlS1IN0FzPrnnTtKwEVBwMhDB9EVNbyvAOmqzoPmJDCQU6vC4bvZE/s1600/Pa%C3%B1ales.jpg" imageanchor="1" style="clear: left; float: left; margin-bottom: 1em; margin-right: 1em;"><img border="0" height="121" src="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEiz_hbWazgTm65cXr390aU8l2n537fTL8y2UwOA2NoLtbdwF8-OMUpEUq0uBbxJ73t_HG8CN5BZnUfInnIvDEXxzMBlS1IN0FzPrnnTtKwEVBwMhDB9EVNbyvAOmqzoPmJDCQU6vC4bvZE/s200/Pa%C3%B1ales.jpg" width="200" /></a></div>
<div class="MsoNormal" style="text-align: justify;">
<b><span lang="ES-CO">Descubrimiento
de reglas de asociación.</span></b><span lang="ES-CO"> Es otro método para la
descripción de comportamientos y consiste en encontrar las dependencias
repetitivas en los acontecimientos descritos por los datos. El ejemplo clásico es que en los supermercados, las parejas jóvenes, los viernes compran cerveza y pañales.</span></div>
<div class="MsoNormal" style="text-align: justify;">
<span lang="ES-CO"><br /></span></div>
<div class="MsoNormal" style="text-align: justify;">
<span lang="ES-CO"> <o:p></o:p></span></div>
<div class="MsoNormal" style="text-align: justify;">
<b><span lang="ES-CO"><br /></span></b></div>
<div class="MsoNormal" style="text-align: justify;">
<b><span lang="ES-CO"><br /></span></b></div>
<div class="MsoNormal" style="text-align: justify;">
<b><span lang="ES-CO"><br /></span></b></div>
<div class="MsoNormal" style="text-align: justify;">
<b><span lang="ES-CO"><br /></span></b></div>
<div class="MsoNormal" style="text-align: justify;">
<b><span lang="ES-CO"><br /></span></b></div>
<div class="separator" style="clear: both; text-align: center;">
<a href="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEgASEnuUzcUE_7J3YEY3wHCRnpyWUYiw9GD_uweN0fmezDKb8JImtQZSAm-3AqJ2kDs20bouU9BEGnMR4TaPJNL_k3cWqQBsYVuQBw5V_xpN0ZFYVZSbNEtHCRn8Qx02GdImNBx28UeIXI/s1600/semaforo.jpg" imageanchor="1" style="clear: right; float: right; margin-bottom: 1em; margin-left: 1em;"><img border="0" height="200" src="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEgASEnuUzcUE_7J3YEY3wHCRnpyWUYiw9GD_uweN0fmezDKb8JImtQZSAm-3AqJ2kDs20bouU9BEGnMR4TaPJNL_k3cWqQBsYVuQBw5V_xpN0ZFYVZSbNEtHCRn8Qx02GdImNBx28UeIXI/s200/semaforo.jpg" width="159" /></a></div>
<div class="MsoNormal" style="text-align: justify;">
<b><span lang="ES-CO">Descubrimiento
de patrones secuenciales.</span></b><span lang="ES-CO"> También se trata de un
método de descripción, éste descubre cadenas de eventos que definen
comportamientos. Un ejemplo es, “Siempre
que un semáforo está en rojo y pasa a verde, alguien pita”.<o:p></o:p></span></div>
<div class="MsoNormal" style="text-align: justify;">
<span lang="ES-CO"><br /></span></div>
<div class="MsoNormal" style="text-align: justify;">
<span lang="ES-CO"><br /></span></div>aljurepastranmorenohttp://www.blogger.com/profile/17032234509937787478noreply@blogger.com0tag:blogger.com,1999:blog-8146728142951580136.post-7216164654699623922012-03-23T20:04:00.000-05:002012-03-23T20:04:08.363-05:00Definición de DMSHoy presentamos un video de nuestra autoría, donde mostramos las generalidades de la minería de datos. Lo invitamos a compartir nuestra visión.<br />
<br />
<div class="separator" style="clear: both; text-align: center;">
<iframe allowfullscreen='allowfullscreen' webkitallowfullscreen='webkitallowfullscreen' mozallowfullscreen='mozallowfullscreen' width='320' height='266' src='https://www.youtube.com/embed/mi32ycV7zDg?feature=player_embedded' frameborder='0'></iframe></div>
<br />aljurepastranmorenohttp://www.blogger.com/profile/17032234509937787478noreply@blogger.com1Bogotá, Bogotá D.C., Colombia4.5980556 -74.07583334.0915821 -74.7075473 5.1045291000000006 -73.4441193tag:blogger.com,1999:blog-8146728142951580136.post-25757053549896705002012-03-18T23:00:00.001-05:002012-03-19T13:57:45.571-05:00<div class="separator" style="clear: both; text-align: center;">
<a href="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEjC9XxWJDLD0lvvtS5RxYu5wYw86WMM8yp9UjCkRDmAM5N9uYRjswM7y_2DmKrVoeaKnMHnqNKaY63NDK2ohgyQPVwq1Ym0_HDyhWclorNsWh52sXGKs3hNjlqjIyNiHt-yz9G5cdyMu_g/s1600/iceberg.jpg" imageanchor="1" style="clear: left; float: left; margin-bottom: 1em; margin-right: 1em;"><br /></a></div>
<span style="font-size: x-large;">Ejemplos de Aplicación de Minería de Datos</span><br />
<span style="font-size: x-large;"><br /></span><br />
<div class="separator" style="clear: both; text-align: center;">
<a href="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEjC9XxWJDLD0lvvtS5RxYu5wYw86WMM8yp9UjCkRDmAM5N9uYRjswM7y_2DmKrVoeaKnMHnqNKaY63NDK2ohgyQPVwq1Ym0_HDyhWclorNsWh52sXGKs3hNjlqjIyNiHt-yz9G5cdyMu_g/s1600/iceberg.jpg" imageanchor="1" style="margin-left: 1em; margin-right: 1em; text-align: center;"><img border="0" height="320" src="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEjC9XxWJDLD0lvvtS5RxYu5wYw86WMM8yp9UjCkRDmAM5N9uYRjswM7y_2DmKrVoeaKnMHnqNKaY63NDK2ohgyQPVwq1Ym0_HDyhWclorNsWh52sXGKs3hNjlqjIyNiHt-yz9G5cdyMu_g/s320/iceberg.jpg" width="236" /></a></div>
<br />
<span style="font-size: large;">Gobiernos</span><br />
<span style="font-size: large;"><br /></span><br />
<div class="separator" style="clear: both; text-align: center;">
<a href="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEiQ93u7ksxVZF5FHiG-yD48uzyDdPk9UDcaI5xRSCrur-zISDCENvFJ9gHSStUXnKQ8Hvw2uC_WzSXFAlxq4PZejsoEgHA4B5z1el11tqWtfRJsOt-uVfboiuJx_nAOfEe5Q9iTBE8Hrh0/s1600/68932.jpg" imageanchor="1" style="clear: left; float: left; margin-bottom: 1em; margin-right: 1em;"><img border="0" height="200" src="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEiQ93u7ksxVZF5FHiG-yD48uzyDdPk9UDcaI5xRSCrur-zISDCENvFJ9gHSStUXnKQ8Hvw2uC_WzSXFAlxq4PZejsoEgHA4B5z1el11tqWtfRJsOt-uVfboiuJx_nAOfEe5Q9iTBE8Hrh0/s200/68932.jpg" width="189" /></a></div>
<i>"El FBI analizará las bases de datos comerciales para detectar terroristas"</i><br />
<i><br /></i><br />
Lo que pretende como objetivo el FBI, es hacer uso de las herramientas de minería de datos para identificar a potenciales terroristas con antelación a que puedan cometer un atentado. Teniendo la cantidad de datos que tienen, pretenden estudiar los hábitos y costumbres de la población, sabiendo así si la persona fuma, que talla es, que tipo de ropa usa, si ha sido arrestado, el barrio donde vive, su salario, las revistas a las que esta suscrito, su altura , peso y entre otros aspectos que serian de gran ayuda para cumplir con el objetivo.<br />
<br />
<span style="font-size: large;">Deporte</span><span style="font-size: large;"> </span> <span style="font-size: large;"><br /></span><br />
<br />
<div class="separator" style="clear: both; text-align: center;">
<a href="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEjGIEUnnuMPR7whldGUZqp8jzjlif_9RBYTABAqKl5JoHLN2Fef6q8gseZM2p6UP8H02w7gi-bS4RJVZFB9xYXkVA0oUYbGkRSKm8a0QpsDJQFshBSFNmsAZ-a1s9OlHYIuBH9VFFv2THI/s1600/NBA2.jpg" imageanchor="1" style="clear: left; float: left; margin-bottom: 1em; margin-right: 1em;"><img border="0" height="150" src="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEjGIEUnnuMPR7whldGUZqp8jzjlif_9RBYTABAqKl5JoHLN2Fef6q8gseZM2p6UP8H02w7gi-bS4RJVZFB9xYXkVA0oUYbGkRSKm8a0QpsDJQFshBSFNmsAZ-a1s9OlHYIuBH9VFFv2THI/s200/NBA2.jpg" width="200" /></a></div>
Los equipos de la NBA (National Basketball Association), hacen uso de la minería de datos para apoyar a sus cuerpos técnicos en cuanto a la toma de decisiones para sus futuras tácticas. Con el <i>Advanced Scout, </i>el cual es un software que emplea técnicas de minería de datos, el cuerpo técnico de los diferentes equipos, tienen a su disposición el análisis de los diferentes partidos jugados, teniendo así cada evento sucedido como lo son pases, encetes, rebotes y doble marcaje a un jugador por el equipo contrario, entre otros. Todos estos aspectos ayudan a concluir patrones que son poco visibles por el técnico al ver el partido en vivo o en vídeo. Por ejemplo, el doble marcaje a un jugador puede generalmente dar la oportunidad a otro jugador de encestar mas fácilmente. Con este conocimiento, los entrenadores crearon estrategias alternativas para tratar con el doble marcaje.<br />
<br />
<span style="font-size: large;">Terrorismo</span><br />
<span style="font-size: large;"><br /></span><br />
<div class="separator" style="clear: both; text-align: center;">
<a href="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEjfCpqQIq1fuSQIfrQFtmtpcpZJlI0FUih8mmX8bqvX_T0GuyOeeeuDlSc4Cc9XCEearoSHUfe4yUvdSOlcnH5UxPVA7dFHRwiDEUoWEZV90sDJO1w-ME2Xxdq_m6V54FPr8w3l7GFZqYs/s1600/terrorismo-contra-cuba-4-294x300.jpg" imageanchor="1" style="clear: left; float: left; margin-bottom: 1em; margin-right: 1em;"><img border="0" height="200" src="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEjfCpqQIq1fuSQIfrQFtmtpcpZJlI0FUih8mmX8bqvX_T0GuyOeeeuDlSc4Cc9XCEearoSHUfe4yUvdSOlcnH5UxPVA7dFHRwiDEUoWEZV90sDJO1w-ME2Xxdq_m6V54FPr8w3l7GFZqYs/s200/terrorismo-contra-cuba-4-294x300.jpg" width="196" /></a></div>
Gracias a la minería de datos, el ejercito de los EE.UU, habían identificado al líder de los atentados del 11 de septiembre de 2001, Mohmmed Atta, y tres secuestradores mas.<br />
<span style="font-size: large;"><br /></span><br />
<span style="font-size: large;"><br /></span><br />
<span style="font-size: large;"><br /></span><br />
<span style="font-size: large;"><br /></span><br />
<span style="font-size: large;"><br /></span><br />
<span style="font-size: large;"><br /></span><br />
<span style="font-size: large;">Recursos Humanos</span><br />
<span style="font-size: large;"><br /></span><br />
<div class="separator" style="clear: both; text-align: center;">
<a href="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEghlwpZLKF_wet6Ojwz8eUx-AYNUxu5zUxTj6S3UmCt8yPmFeeM4lS3shBpWNx63CYUgCPiDO2n34bA5mxiLPmKlHOCxZ-11gCEjBHAe4-timooZEUAU9Q6eSpPxlNLV9pzZO_jPAnzgyk/s1600/headermulti.jpg" imageanchor="1" style="clear: left; float: left; margin-bottom: 1em; margin-right: 1em;"><img border="0" height="143" src="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEghlwpZLKF_wet6Ojwz8eUx-AYNUxu5zUxTj6S3UmCt8yPmFeeM4lS3shBpWNx63CYUgCPiDO2n34bA5mxiLPmKlHOCxZ-11gCEjBHAe4-timooZEUAU9Q6eSpPxlNLV9pzZO_jPAnzgyk/s200/headermulti.jpg" width="200" /></a></div>
Bajo este tema, la minería de datos es útil para identificar las características de los empleados, mirando así, por ejemplo, cuales tienen un perfil de desempeño alto y cuales un perfil de desempeño bajo. Toda la información obtenida luego de practicar la minería de datos, puede ayudar a la contratación de personal que cumplan los requisitos de cierto cargo.<br />
<br />
<span style="font-size: large;"><br /></span><br />
<span style="font-size: large;">Genética</span><br />
<span style="font-size: large;"><br /></span><br />
<div class="separator" style="clear: both; text-align: center;">
<a href="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEjlUAarjMbgteyU4wPk6SqxkmX8R9X7J6o5aFgtLNYhPliESyf8mZI4D7Ns96CZJCLtt09uAvdVrRO3CKwM34tAzt8_48ABjpR8nZSZtVzKDlOPdUuAOT05GyY9sn7CURJuR0L-ZL3l5sI/s1600/dna3d.gif" imageanchor="1" style="clear: left; float: left; margin-bottom: 1em; margin-right: 1em;"><img border="0" height="200" src="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEjlUAarjMbgteyU4wPk6SqxkmX8R9X7J6o5aFgtLNYhPliESyf8mZI4D7Ns96CZJCLtt09uAvdVrRO3CKwM34tAzt8_48ABjpR8nZSZtVzKDlOPdUuAOT05GyY9sn7CURJuR0L-ZL3l5sI/s200/dna3d.gif" width="200" /></a></div>
El objetivo de esta área, se trata de saber como los cambios en la secuencia de ADN de un individuo afectan al riesgo de desarrollar enfermedades comunes. Este proceso es de suma importancia para ayudar a mejorar el diagnostico, prevención y tratamiento de las enfermedades. La técnica de minería de datos que se utiliza para tal fin es conocida como reducción de dimensionalidad multifactorial.<br />
<span style="font-size: large;"><br /></span><br />
<span style="font-size: large;"><br /></span><br />
<span style="font-size: large;"><br /></span><br />
<span style="font-size: large;"><br /></span><br />
<span style="font-size: large;">Fraudes</span><br />
<span style="font-size: large;"><br /></span><br />
<div class="separator" style="clear: both; text-align: center;">
<a href="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEgK0c3A_QVXxRYNhPD90ts8QVxqV6Ri9_6vjQ9R6CDBC4oYi8rU9JQ3nM97n9Gj2zgHfq79i_j5ucQuepDFXEKQe0R9tQ3LAmesgzCrr81MdxqsShZpK-YDKPpZDHiOLB1uI-VvnO6y9lI/s1600/fraude_phishing_estafa.jpg" imageanchor="1" style="clear: left; float: left; margin-bottom: 1em; margin-right: 1em;"><img border="0" height="173" src="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEgK0c3A_QVXxRYNhPD90ts8QVxqV6Ri9_6vjQ9R6CDBC4oYi8rU9JQ3nM97n9Gj2zgHfq79i_j5ucQuepDFXEKQe0R9tQ3LAmesgzCrr81MdxqsShZpK-YDKPpZDHiOLB1uI-VvnO6y9lI/s200/fraude_phishing_estafa.jpg" width="200" /></a></div>
La detección de fraudes en el uso de tarjetas de crédito o en servicios de telefonía móvil, normalmente suelen seguir patrones caracterisiticos que permiten distinguirlas de las legitimas para así desarrollar mecanismos con el fin de tomar medidas rápidas frente a ellas.<br />
<span style="font-size: large;"><br /></span><br />
<span style="font-size: large;"><br /></span><br />
<span style="font-size: large;"><br /></span><br />
<span style="font-size: large;"><br /></span><br />
<span style="font-size: large;"><br /></span><br />
<span style="font-size: large;">Patrones de fuga</span><br />
<span style="font-size: large;"><br /></span><br />
<div class="separator" style="clear: both; text-align: center;">
<a href="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEgUIhrNpRs2gaS1PBR3FHN2BWqpiKpXCpzxCcgg09FP023fVw6G9MKn7uupm3deCMt-7W1sZPoHHtzgG0p8PA2AP0R57uaCekx4LwI57MjEe-hFFHfThC99iq-7e95oHD2u8jTaTywbiNY/s1600/thumb.jpg" imageanchor="1" style="clear: left; float: left; margin-bottom: 1em; margin-right: 1em;"><img border="0" height="112" src="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEgUIhrNpRs2gaS1PBR3FHN2BWqpiKpXCpzxCcgg09FP023fVw6G9MKn7uupm3deCMt-7W1sZPoHHtzgG0p8PA2AP0R57uaCekx4LwI57MjEe-hFFHfThC99iq-7e95oHD2u8jTaTywbiNY/s200/thumb.jpg" width="200" /></a></div>
En la mayoría de industrias, existen un entendible interés en detectar lo mas pronto posible a todos los clientes que probablemente estén pensando en cancelar los servicios con la empresa anulando sus contratos, o clientes que posiblemente estén obteniendo cierto interés por la competencia. Aquí, la minería de datos ayuda a determinar los clientes que podrían darse de baja, estudiando sus patrones de comportamiento y comparandolos con muestras de clientes que ya lo han hecho.<br />
<br />
<span style="font-size: large;">Habitos de compra en supermercados</span><br />
<span style="font-size: large;"><br /></span><br />
<div class="separator" style="clear: both; text-align: center;">
<a href="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEiX-FBDT62dw3bkqtgFPk5m3tay77nwMjb47DY57IHefebdap4JiJhnppjmB5wnJ68CKr3GiKxk1-xu2DyrIz2CfAAHCdXDTcpsypZu89Brvh4q3_MNHIgCgioIgcHEmO85IYdueeS2oxc/s1600/bebe_en_supermercado.jpg" imageanchor="1" style="clear: left; float: left; margin-bottom: 1em; margin-right: 1em;"><img border="0" height="136" src="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEiX-FBDT62dw3bkqtgFPk5m3tay77nwMjb47DY57IHefebdap4JiJhnppjmB5wnJ68CKr3GiKxk1-xu2DyrIz2CfAAHCdXDTcpsypZu89Brvh4q3_MNHIgCgioIgcHEmO85IYdueeS2oxc/s200/bebe_en_supermercado.jpg" width="200" /></a></div>
Uno de los estudios mas citados, en cuanto a los hábitos que se pueden encontrar en las compras de supermercado, fue la detección del patrón de adquisición de cerveza y pañales al mismo tiempo, por padres jóvenes los viernes en la noche. Jovenes cuya perspectiva para el fin de semana consistia en quedarse en casa cuidando de sus hijos viendo television con una cerveza en la mano.<br />
Con el descubrimiento de este patron, los supermercados incrementaron sus ventas de cerveza colocandolas justo al lado de los pañales, con el fin de fomentar las ventas compulsivas.<br />
<span style="font-size: large;"><br /></span><br />
<span style="font-size: large;">Internet: Web Mining</span><br />
<span style="font-size: large;"><br /></span><br />
<div class="separator" style="clear: both; text-align: center;">
<a href="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEhtJgbSYonFDkVZWUueCDBwsF6BEWpPtiPE0R5QtZZGaYzwFHvkBzyXB_0q_kQ9lKj2wfD6FciFz-B9tdtNSW6ST4s07KsqRWgtxETesjl8S_UibKPWA4de95YKG5Bw8jsEpvZo6Ps1J5M/s1600/site_internet.jpg" imageanchor="1" style="clear: left; float: left; margin-bottom: 1em; margin-right: 1em;"><img border="0" height="150" src="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEhtJgbSYonFDkVZWUueCDBwsF6BEWpPtiPE0R5QtZZGaYzwFHvkBzyXB_0q_kQ9lKj2wfD6FciFz-B9tdtNSW6ST4s07KsqRWgtxETesjl8S_UibKPWA4de95YKG5Bw8jsEpvZo6Ps1J5M/s200/site_internet.jpg" width="200" /></a></div>
Cada vez que un usuario visita un sitio web, deja una serie de huellas web (direcciones IP, navegador, etc) que los servidores van almacenando automáticamente en sus bases de datos. Con la minería de datos y en este caso "web mining" se analizan y procesan estos datos con el fin de producir información significativa. Por ejemplo, se pueden observar casos donde los clientes que hacen una compra en linea cada semana, tienden a ser sectores de la población determinados, como estudiantes, pensionistas, funcionarios u otros. El resultado de estos patrones, es proponer diversas ofertas a los diferentes sectores y asi conseguir un incremento en las compras de estos grupos.<br />
<br />
<span style="font-size: large;">Negocios</span><span style="font-size: x-large;"><br /></span><br />
<br />
<div class="separator" style="clear: both; text-align: center;">
<a href="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEiPkmnQDEHokPu_OjPykJwXYskzDzcKyk3iJncIrkYeilZaBSp4gVre218tvDFghulFmnThNiY_SoMBAkXYogX2FAi0K3kJHmQCyc5WAK6BcjK-uPsJOg5TyeHUIQgZrVEiGLlJVi8ONKw/s1600/Business-plan.jpg" imageanchor="1" style="clear: left; float: left; margin-bottom: 1em; margin-right: 1em;"><img border="0" height="138" src="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEiPkmnQDEHokPu_OjPykJwXYskzDzcKyk3iJncIrkYeilZaBSp4gVre218tvDFghulFmnThNiY_SoMBAkXYogX2FAi0K3kJHmQCyc5WAK6BcjK-uPsJOg5TyeHUIQgZrVEiGLlJVi8ONKw/s200/Business-plan.jpg" width="200" /></a></div>
Normalmente, los metodos que aplican las empresas para administrar y contactar clientes son poco eficiente; lo hacen de una forma indiscriminada enviando cartas o desde un centro de llamada. Lo que hace en la mayoría de casos es contactar sin ningun patron de selección. El trato con los clientes al momento de ofrecer cualquier tipo de promoción o al momento de hacer cualquier otro tipo de contacto , se vería facilmente reflejado si se contactan a los clientes previamente estudiados y previamente seleccionados.<br />
<br />
La contribución de la Minería de Datos se ve aplicada por ejemplo, al momento de contactar a los clientes que tienen una mayor probabilidad de responder positivamente a una determinada oferta o promoción, también podrían construir modelos separados para cada región y para cada tipo de cliente, en lugar de crear modelos para predecir que clientes pueden cambiar. Normalmente las empresas que utilizan minería de datos en casos como estos, ven rapidamente el retorno de la inversión.<br />
<br />
<b>Referencias:</b><br />
<b><br /></b><br />
<b><a href="http://www.slideshare.net/bebeyom/mineria-de-datos-4869412">http://www.slideshare.net/bebeyom/mineria-de-datos-4869412</a></b><br />
<br />
<b><a href="http://es.scribd.com/doc/31683929/Ejemplos-de-uso-de-la-mineria-de-datos">http://es.scribd.com/doc/31683929/Ejemplos-de-uso-de-la-mineria-de-datos</a></b><br />
<br />
<b><a href="http://www.it.uc3m.es/jvillena/irc/practicas/06-07/22.pdf">http://www.it.uc3m.es/jvillena/irc/practicas/06-07/22.pdf</a></b><br />
<br />
<b><a href="http://es.wikipedia.org/wiki/Miner%C3%ADa_de_datos#Ejemplos_de_uso_de_la_miner.C3.ADa_de_datos">http://es.wikipedia.org/wiki/Miner%C3%ADa_de_datos#Ejemplos_de_uso_de_la_miner.C3.ADa_de_datos</a></b><br />
<br />aljurepastranmorenohttp://www.blogger.com/profile/17032234509937787478noreply@blogger.com0tag:blogger.com,1999:blog-8146728142951580136.post-85031181233454984892012-03-11T23:01:00.000-05:002012-03-11T23:20:41.196-05:00El Valor de los Datos que Transitan en el Mundo<span style="font-family: 'Trebuchet MS',sans-serif;">El uso de Business
Intelligence fue una de las tendencias que marcaron la feria alemana </span><a href="http://www.cebit.de/en/about-the-trade-show/facts-figures/about-cebit-2012" style="font-family: 'Trebuchet MS', sans-serif;" target="_blank">CeBIT 2012</a><span style="font-family: 'Trebuchet MS',sans-serif;">,
que culminó ayer, 10 de marzo. Allí participaron diferentes empresas de
software, mostrando sus productos: el aprendizaje computacional y las técnicas
de Data Mining están a la orden del día.</span><br />
<span style="font-family: 'Trebuchet MS',sans-serif;"><br /></span><br />
<div class="MsoNormal">
<span lang="ES-CO" style="font-family: 'Trebuchet MS',sans-serif;">Como hemos
mostrado en ocasiones anteriores, las herramientas de minería de datos proporcionan
información muy valiosa para las empresas. Hasta ahora, hemos presentado algunos
ejemplos de éxito y utilización en contextos típicos, como los <a href="http://dataminingsoftwareapm.blogspot.com/2012/02/te-amo-alona.html" target="_blank">datos locales</a> en diferentes formatos, o <a href="http://dataminingsoftwareapm.blogspot.com/2012/03/el-valor-de-los-datos-que-transitan.html" target="_blank">Internet</a>. Ahora es la
oportunidad de ver algunos maravillosos ejemplos de uso de la minería de datos en
contextos más amplios:<o:p></o:p></span><br />
<span lang="ES-CO" style="font-family: 'Trebuchet MS',sans-serif;"><br /></span></div>
<div class="MsoNormal">
<span lang="ES-CO" style="font-family: 'Trebuchet MS',sans-serif;"><span style="font-size: large;">La
construcción de una ciudad más inteligente</span><o:p></o:p></span><br />
<span lang="ES-CO" style="font-family: 'Trebuchet MS',sans-serif;"><span style="font-size: large;"><br /></span></span></div>
<div class="MsoNormal">
<span lang="ES-CO" style="font-family: 'Trebuchet MS',sans-serif;">En el
siguiente video, se muestra el uso de una aplicación (Intelligent Operations
Center) para mejorar las diferentes operaciones de Zhenjiang, una ciudad
turística de China. Por ahora, se puede desde allí monitorear el transporte: se
toman datos de satélites, cámaras, sensores, entre otros, y se facilita la toma
de decisiones mediante la identificación de tendencias. La aplicación en esta ciudad
también proviene del aprendizaje en sistemas similares obtenido en otras
ciudades (Río de Janeiro, New York, Estocolmo, Madrid, Singapur, entre otros)…
y así, se busca identificar algunos patrones que faciliten la automatización de
algunas operaciones en el futuro. Por supuesto, la minería de datos es la
encargada de dilucidar estas tendencias, y consideramos que su uso en estos
temas es decisivo y constituye un reto para el manejo de data mining en datos
de gran cantidad y crecimiento (big data).<o:p></o:p></span><br />
<div class="separator" style="clear: both; text-align: center;">
<iframe allowfullscreen='allowfullscreen' webkitallowfullscreen='webkitallowfullscreen' mozallowfullscreen='mozallowfullscreen' width='320' height='266' src='https://www.youtube.com/embed/vicqBmAGl80?feature=player_embedded' frameborder='0'></iframe></div>
<span style="font-family: 'Trebuchet MS',sans-serif;"><br /></span></div>
<div class="MsoNormal">
<span lang="ES-CO" style="font-family: 'Trebuchet MS',sans-serif;"><span style="font-size: large;">Monitoreando
el uso de un carro electrónico</span><o:p></o:p></span></div>
<div class="MsoNormal">
<span lang="ES-CO" style="font-family: 'Trebuchet MS',sans-serif;"><br /></span><br />
<a href="http://www.dradio.de/images/70824/landscape/" imageanchor="1" style="clear: right; float: right; margin-bottom: 1em; margin-left: 1em;"><img alt="Elektroautos sind derzeit en vogue, so auch schon auf der jüngsten IAA in Frankfurt. (Bild: picture alliance / dpa / Arne Dedert)" border="0" height="240" src="http://www.dradio.de/images/70824/landscape/" width="320" /></a><span lang="ES-CO" style="font-family: 'Trebuchet MS',sans-serif;">Este tipo
de vehículos está pasando por una importante fase de investigación y producción.
Es el caso de 44 automóviles que se encuentran en circulación en Alemania, y
que contienen “loggers” de datos autorizados, enviando información al Centro de
Investigación en Inteligencia Artificial de Bremen: se envía la información de
batería, posición, uso de la energía, velocidad, entre otros. Así, se generan “perfiles
de movimiento”, que se deducen a partir de Data Mining: y todo, para establecer
las necesidades y usos típicos de estos autos, y así definir nuevas metas de
investigación, e incluso predecir su funcionamiento.<o:p></o:p></span><br />
<span lang="ES-CO" style="font-family: 'Trebuchet MS',sans-serif;"><br /></span><br />
<div style="text-align: center;">
<span lang="ES-CO" style="font-family: 'Trebuchet MS',sans-serif;">
</span></div>
</div>
<div class="MsoNormal">
<span style="font-family: 'Trebuchet MS',sans-serif;"><br /></span></div>
<div class="MsoNormal">
<span lang="EN-US" style="font-family: 'Trebuchet MS',sans-serif;"><span style="font-size: large;">Seguridad
Sanitaria</span><o:p></o:p></span><br />
<span lang="EN-US" style="font-family: 'Trebuchet MS',sans-serif;"><span style="font-size: large;"><br /></span></span></div>
<div class="MsoNormal">
<a href="http://ars.sciencedirect.com/content/image/1-s2.0-S0140673601057786-gr3.jpg" imageanchor="1" style="clear: left; float: left; margin-bottom: 1em; margin-right: 1em;"><img border="0" height="206" src="http://ars.sciencedirect.com/content/image/1-s2.0-S0140673601057786-gr3.jpg" width="320" /></a><span lang="ES-CO" style="font-family: 'Trebuchet MS',sans-serif;">En un caso
concreto, en Gales, existe una amplia cantidad de información acerca de las
enfermedades animales de la región. Los factores de riesgo se han identificado,
y se ha hecho una clasificación de estos para así mejorar las condiciones
sanitarias. Todo esto, gracias al eficiente uso de diferentes técnicas de
minería de datos: regresión, árboles de clasificación, y análisis de factores.<o:p></o:p></span><br />
<span lang="ES-CO" style="font-family: 'Trebuchet MS',sans-serif;"><br /></span></div>
<div class="MsoNormal">
<div style="text-align: center;">
</div>
<a href="http://images.springer.com/cda/content/image/cda_displayimage.jpg?SGWID=0-0-16-1268120-0" imageanchor="1" style="clear: right; float: right; margin-bottom: 1em; margin-left: 1em;"><img alt="Applications of Data Mining in Computer Security" border="0" src="http://images.springer.com/cda/content/image/cda_displayimage.jpg?SGWID=0-0-16-1268120-0" /></a><span lang="ES-CO" style="font-family: 'Trebuchet MS',sans-serif;"><span style="font-size: large;"><br /></span></span><br />
<span lang="ES-CO" style="font-family: 'Trebuchet MS',sans-serif;"><span style="font-size: large;">Seguridad
Computacional</span><o:p></o:p></span><br />
<span lang="ES-CO" style="font-family: 'Trebuchet MS',sans-serif;"><span style="font-size: large;"><br /></span></span></div>
<div class="MsoNormal">
<span lang="ES-CO" style="font-family: 'Trebuchet MS',sans-serif;">En el campo
de la detección de intrusiones, la minería de datos puede jugar un factor
decisivo, pues la cantidad de información que se manejan en las redes y
sistemas es muy grande, haciendo que este tipo de problemas puedan ser
estudiados mediante el software que aquí estudiamos: mediante DM es posible
identificar aquellas anomalías que puedan sugerir las intrusiones, y el
análisis de las implicaciones que éstas han tenido.<o:p></o:p></span><br />
<span lang="ES-CO" style="font-family: 'Trebuchet MS',sans-serif;"><br /></span><br />
<span lang="ES-CO" style="font-family: 'Trebuchet MS',sans-serif;"><b>Referencias:</b></span><br />
<span lang="ES-CO" style="font-family: 'Trebuchet MS',sans-serif;"><b><br /></b></span></div>
<div class="MsoNormal">
<span lang="ES-CO" style="font-family: 'Trebuchet MS',sans-serif;">IBM. A Smarter Planet Project: Building an Operating System for Cities. </span><br />
<span lang="ES-CO" style="font-family: 'Trebuchet MS',sans-serif;"><a href="http://asmarterplanet.com/blog/2012/02/building-an-operating-system-for-cities.html" target="_blank">http://asmarterplanet.com/blog/2012/02/building-an-operating-system-for-cities.html</a></span><br />
<span lang="ES-CO" style="font-family: 'Trebuchet MS',sans-serif;"><br /></span><br />
<span style="font-family: 'Trebuchet MS',sans-serif;">IBM: Calabrese, Francisco. Smart Cities - How can Data Mining and Optimization shape Future Cities? </span><br />
<span style="font-family: 'Trebuchet MS',sans-serif;"><a href="http://www.cost.eu/download/Calabrese" target="_blank">http://www.cost.eu/download/Calabrese </a> </span><span lang="ES-CO" style="font-family: 'Trebuchet MS',sans-serif;"><br /></span><br />
<span style="font-family: 'Trebuchet MS',sans-serif;">Deutschlandfunk: Kloiber, Manfred. Auto als Datenquelle.</span><br />
<span lang="ES-CO" style="font-family: 'Trebuchet MS',sans-serif;"><a href="http://www.dradio.de/dlf/sendungen/forschak/1698145/">http://www.dradio.de/dlf/sendungen/forschak/1698145/</a></span><br />
<span style="font-family: 'Trebuchet MS',sans-serif;"><br /></span><br />
<div class="MsoNormal">
<span lang="EN-US" style="font-family: 'Trebuchet MS',sans-serif;">Ortiz-Peláez, Ángel. Use of data mining techniques to investigate disease risk classification as a proxy for compromised biosecurity of cattle herds in Wales</span></div>
<span lang="ES-CO" style="font-family: 'Trebuchet MS',sans-serif;"><a href="http://www.biomedcentral.com/1746-6148/4/24">http://www.biomedcentral.com/1746-6148/4/24</a>
</span></div>
<div class="MsoNormal">
<span lang="ES-CO" style="font-family: 'Trebuchet MS',sans-serif;"><br /></span><br />
<span lang="ES-CO" style="font-family: 'Trebuchet MS',sans-serif;">Barbara, Daniel. Applications of Data Mining in Computer Security.
</span><br />
<span lang="ES-CO" style="font-family: 'Trebuchet MS',sans-serif;"><a href="http://www.springer.com/computer/theoretical+computer+science/book/978-1-4020-7054-9">http://www.springer.com/computer/theoretical+computer+science/book/978-1-4020-7054-9</a>
</span><br />
<br />
<span style="font-family: 'Trebuchet MS',sans-serif;">PresseBox. Teradata auf der CeBIT 2012: Datenanalysen stehen im Rampenlicht</span><br />
<span style="font-family: 'Trebuchet MS',sans-serif;"><a href="http://www.pressebox.de/pressemeldungen/teradata-deutschland/boxid/487193">http://www.pressebox.de/pressemeldungen/teradata-deutschland/boxid/487193</a></span></div>aljurepastranmorenohttp://www.blogger.com/profile/17032234509937787478noreply@blogger.com0tag:blogger.com,1999:blog-8146728142951580136.post-87618841506513727452012-03-05T06:14:00.000-05:002012-03-05T06:14:32.156-05:00<w:sdt contentlocked="t" id="89512093" sdtgroup="t"><span style="font-family: "Calibri","sans-serif"; font-size: 1.0pt; mso-ansi-language: EN-US; mso-ascii-theme-font: minor-latin; mso-bidi-font-family: "Times New Roman"; mso-bidi-language: AR-SA; mso-bidi-theme-font: minor-bidi; mso-fareast-font-family: "Times New Roman"; mso-fareast-language: EN-US; mso-fareast-theme-font: minor-fareast; mso-hansi-theme-font: minor-latin;"><w:sdtpr></w:sdtpr><w:sdt docpart="3AF62623728A44E2B01C452FD432702E" id="89512082" storeitemid="X_54335E7B-A572-4BDA-AA33-F333FF2DB1B3" text="t" title="Título de la entrada de blog" xpath="/ns0:BlogPostInfo/ns0:PostTitle"></w:sdt></span>
</w:sdt><br />
<div class="Publishwithline">
</div>
<div class="Publishwithline" style="color: #6fa8dc; font-size: x-large; font-weight: bold;">
El Valor de los Datos que Transitan Internet</div>
<div class="Publishwithline" style="color: #6fa8dc; font-size: x-large; font-weight: bold;">
<br /></div>
<div class="separator" style="clear: both; font-weight: bold; text-align: center;">
<a href="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEh74dNw9l_UdMBITZ96tdGBm_4SnVQPhyYpAjwQYroJflI6DVekbGAOPTbl1isbWA_fq3IVtBFIfPaikqsrHEAuposkRo0FSPkBddRnBeabV1pw9bFEVzpERYz6EraJaNhRwT59aEr5XGE/s1600/mineria.jpg" imageanchor="1" style="clear: right; float: right; margin-bottom: 1em; margin-left: 1em;"><br /></a><a href="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEh74dNw9l_UdMBITZ96tdGBm_4SnVQPhyYpAjwQYroJflI6DVekbGAOPTbl1isbWA_fq3IVtBFIfPaikqsrHEAuposkRo0FSPkBddRnBeabV1pw9bFEVzpERYz6EraJaNhRwT59aEr5XGE/s1600/mineria.jpg" imageanchor="1" style="clear: right; float: right; margin-bottom: 1em; margin-left: 1em;"><img border="0" src="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEh74dNw9l_UdMBITZ96tdGBm_4SnVQPhyYpAjwQYroJflI6DVekbGAOPTbl1isbWA_fq3IVtBFIfPaikqsrHEAuposkRo0FSPkBddRnBeabV1pw9bFEVzpERYz6EraJaNhRwT59aEr5XGE/s1600/mineria.jpg" /></a></div>
<div class="Publishwithline" style="color: #6fa8dc; font-size: x-large; font-weight: bold;">
<br /></div>
<div class="Publishwithline">
<span style="color: #6fa8dc; font-weight: bold;"><br /></span></div>
<div class="Publishwithline" style="text-align: justify;">
<span style="color: #6fa8dc; font-weight: bold;">La minería Web (Web Mining o Webmining)</span><span style="color: #3d85c6; font-weight: bold;"> </span><span style="color: #cfe2f3; font-weight: bold;">es la metodología de recolección de información en la WEB. Por medio de minería de datos, se extrae información del contenido de las páginas, de los enlaces y de los registros de navegación.</span></div>
<div class="Publishwithline">
<span style="color: #cfe2f3; font-weight: bold;"><br /></span></div>
<div class="Publishwithline">
<span style="color: #cfe2f3; font-weight: bold;"><br /></span></div>
<div class="Publishwithline">
<span style="color: #cfe2f3; font-weight: bold;"><br /></span></div>
<div class="Publishwithline">
<span style="color: #cfe2f3; font-weight: bold;"><br /></span></div>
<div class="Publishwithline" style="font-weight: bold;">
<span style="color: #cfe2f3;"><br /></span></div>
<div class="Publishwithline" style="font-weight: bold;">
<span style="color: #cfe2f3;"></span></div>
<div style="text-align: justify;">
<span style="color: #cfe2f3;">En ésta, la era de la información la minería de datos en la WEB se hace protagonista.</span></div>
<div style="text-align: justify;">
<span style="color: #cfe2f3;"><br /></span></div>
<div style="text-align: justify;">
<span style="color: #cfe2f3;">Al cierre del 2011 se alcanza la gigantesca cifra de 2.1 mil millones de usuarios de internet en el mundo, además los usuarios de internet en los diferentes continentes son entre el 11% y el 78% de la población total y ahora con el auge del internet móvil, esta cifra sigue subiendo. Cada uno de estos usuarios día a día van dejando un rastro importante de datos que se convierten, para muchos, en el oro del momento. </span></div>
<br />
<div class="Publishwithline" style="font-weight: bold;">
<span style="color: #cfe2f3;"> </span></div>
<div class="separator" style="clear: both; text-align: center;">
<a href="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEhP4xttzJ5NPsHXJEYzNY96arYaEhxOmwjxpni9CTlhIW9wJUamO2w23VUDjjOERTKhxDTLwm2QcDn6FtuiskCafvowuGUDV8bQIN8Y5W23ugoFRFTaS3QLAEFG2L2do_FgR4z3ZzOEfZw/s1600/EstadistInternet.png" imageanchor="1" style="margin-left: 1em; margin-right: 1em;"><img border="0" height="221" src="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEhP4xttzJ5NPsHXJEYzNY96arYaEhxOmwjxpni9CTlhIW9wJUamO2w23VUDjjOERTKhxDTLwm2QcDn6FtuiskCafvowuGUDV8bQIN8Y5W23ugoFRFTaS3QLAEFG2L2do_FgR4z3ZzOEfZw/s320/EstadistInternet.png" width="320" /></a></div>
<div class="Publishwithline" style="font-weight: bold; text-align: justify;">
<span style="color: #cfe2f3;">Las empresas que mejor convierten los datos en información relevante para el negocio y ésta a su vez en conocimiento útil para la innovación, son las empresas que lideran los mercados. Cada día, muchos sitios de internet están recogiendo datos, haciendo clasificaciones y encontrando patrones por medio de técnicas de minería de datos (WEB Mining), sacando provecho de la información implícita que dejamos. Hay tres objetivos claves en la minería WEB:</span></div>
<div class="separator" style="clear: both; text-align: center;">
<a href="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEgb9_Uz75qEuEtgOm8JtHOhi2jkhZs2eAuaj-7aVSqWnzEGtZyU5IRru7wrx7w3k57d0GH3McGtHo5CSwlF7xLfkJqRfoUd9fOvyur4B5X1mGiAF1u5OpBsjzBMEIdbglRImxZjsdhNyjI/s1600/mineria1.gif" imageanchor="1" style="clear: right; float: right; margin-bottom: 1em; margin-left: 1em;"><img border="0" src="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEgb9_Uz75qEuEtgOm8JtHOhi2jkhZs2eAuaj-7aVSqWnzEGtZyU5IRru7wrx7w3k57d0GH3McGtHo5CSwlF7xLfkJqRfoUd9fOvyur4B5X1mGiAF1u5OpBsjzBMEIdbglRImxZjsdhNyjI/s1600/mineria1.gif" /></a></div>
<div class="Publishwithline" style="font-weight: bold;">
<span style="color: #cfe2f3;"><br /></span></div>
<div class="Publishwithline" style="font-weight: bold;">
<span style="color: #cfe2f3;"><br /></span></div>
<div class="Publishwithline" style="font-weight: bold;">
<span style="color: #6fa8dc;">Minería del uso de la Web</span></div>
<div class="Publishwithline" style="font-weight: bold; text-align: justify;">
<span style="color: #cfe2f3;">Es el proceso mediante el cual se extrae información del historial de los registros del servidor con el fin de descubrir cómo y para qué usa la web e identificar lo que los usuarios buscan en Internet.</span></div>
<div class="Publishwithline" style="font-weight: bold;">
<span style="color: #6fa8dc;">Minería del contenido de la Web</span></div>
<div class="Publishwithline" style="font-weight: bold; text-align: justify;">
<span style="color: #cfe2f3;">Con este método se extraen e integran los datos útiles, información y conocimiento de los contenidos de la Web tales como imágenes, audio, texto, video, etc.</span></div>
<div class="Publishwithline" style="font-weight: bold;">
<span style="color: #6fa8dc;">Minería de la estructura de la Web</span></div>
<div class="Publishwithline" style="font-weight: bold; text-align: justify;">
<span style="color: #cfe2f3;">En este proceso se utiliza la teoría de grafos para analizar el nodo y las estructuras de conexión de un sitio web.</span></div>
<div class="Publishwithline" style="font-weight: bold; text-align: justify;">
<span style="color: #cfe2f3;"><br /></span></div>
<div class="Publishwithline" style="font-weight: bold;">
<span style="color: #cfe2f3;"><br /></span></div>
<div class="Publishwithline" style="font-weight: bold; text-align: justify;">
<a href="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEiz3YXSPxyiKoowSiB05euYZx2U6lZ0YaEolLjlqimVTrE7fupJ-zQ_nt87BNhxwK12OKOD0VKhbM5LBnyAJSI8DUrwOV1Cq8rT5OUVqZqCLTGN9xJeT2-t4l4ddGPTz2iJS6MCOei_1Jo/s1600/empresas.jpg" imageanchor="1" style="clear: right; float: right; margin-bottom: 1em; margin-left: 1em;"><img border="0" src="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEiz3YXSPxyiKoowSiB05euYZx2U6lZ0YaEolLjlqimVTrE7fupJ-zQ_nt87BNhxwK12OKOD0VKhbM5LBnyAJSI8DUrwOV1Cq8rT5OUVqZqCLTGN9xJeT2-t4l4ddGPTz2iJS6MCOei_1Jo/s1600/empresas.jpg" /></a><span style="color: #cfe2f3;">Empresas poderosas por la información que poseen, como Google, FaceBook, Micosoft, Yahoo, Apple entre otros, hacen uso de la minería Web; esto les permite, por ejemplo, mejorar el acierto en la publicidad que aparece en las páginas al clasificar a los usuarios de acuerdo las características encontradas por medio de sus datos; identificar preferencias u opiniones de los clientes oportunamente a través del reconocimiento de patrones en las búsquedas o compras. En internet es fácil encontrar datos generales como la ubicación o la hora que pueden ayudar a crear estadísticas relevantes a los negocios.</span></div>
<div class="Publishwithline" style="font-weight: bold; text-align: justify;">
<span style="color: #cfe2f3;"><br /></span></div>
<div class="Publishwithline" style="font-weight: bold; text-align: justify;">
<span style="color: #cfe2f3;">Toda esta información, en un alto porcentaje, es usada para encontrar clientes potenciales en internet para todo tipo de productos y servicios.</span></div>
<div class="Publishwithline" style="font-weight: bold;">
<span style="color: #cfe2f3;"><br /></span></div>
<div class="separator" style="clear: both; text-align: center;">
<a href="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEihjZiIvT5ZHZQQAQOiEWqmF_EfZdxCJSGLNczydbPQ7tiPbEQiMfDqc4lAn0zOG0bfDVVF81nwd3bqGbgWnhEFdOg4q31LfGa7HaQfWgnSNjjM15kl2jtNKj_ClGe7bFB44ctXR0cBFtk/s1600/ventaja.jpg" imageanchor="1" style="clear: left; float: left; margin-bottom: 1em; margin-right: 1em;"><img border="0" src="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEihjZiIvT5ZHZQQAQOiEWqmF_EfZdxCJSGLNczydbPQ7tiPbEQiMfDqc4lAn0zOG0bfDVVF81nwd3bqGbgWnhEFdOg4q31LfGa7HaQfWgnSNjjM15kl2jtNKj_ClGe7bFB44ctXR0cBFtk/s1600/ventaja.jpg" /></a></div>
<div class="Publishwithline" style="font-weight: bold;">
<span style="color: #6fa8dc;">Ventajas</span></div>
<div class="Publishwithline" style="font-weight: bold; text-align: justify;">
<span style="color: #cfe2f3;">Muchas son las ventajas que provee esta tecnología, influye en que aumenten los volúmenes en el comercio, aporta en la aparición de nuevas iniciativas, productos y servicios, provoca mas innovación, permite un mejor servicio al cliente, apoya el control de la autoridades por medio de la predicción de actividades delictivas. En líneas generales, si los datos y la información son “el oro del momento”, la minería Web es la herramienta para extraerlo.</span></div>
<div class="Publishwithline" style="font-weight: bold;">
<span style="color: #cfe2f3;"><br /></span></div>
<div class="separator" style="clear: both; text-align: center;">
<a href="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEjX8x8-bYpTyI12UJOUYHiO1DFprKVvBEaub03RX1D-SqX3giRSxpMqAUsyFGgdw2PyCw5YJ9YK-Uy235JfuukfCker6dqw5-ofnWEcVzPfQIIGvaqfr6CeQIiW67HDBiX20MJ89jap26I/s1600/pregunta.jpg" imageanchor="1" style="clear: right; float: right; margin-bottom: 1em; margin-left: 1em;"><img border="0" src="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEjX8x8-bYpTyI12UJOUYHiO1DFprKVvBEaub03RX1D-SqX3giRSxpMqAUsyFGgdw2PyCw5YJ9YK-Uy235JfuukfCker6dqw5-ofnWEcVzPfQIIGvaqfr6CeQIiW67HDBiX20MJ89jap26I/s1600/pregunta.jpg" /></a></div>
<div class="Publishwithline" style="font-weight: bold;">
<span style="color: #6fa8dc;">Polémicas</span></div>
<div class="Publishwithline" style="font-weight: bold; text-align: justify;">
<span style="color: #cfe2f3;">Como todo no es color de rosa, cabe mencionar que entre todo este bum de la información en internet, hay algunas polémicas que surgen del manejo que se le da a la información. La que más ruido hace es la que se refiere a la información personal y al derecho a la privacidad. Existen empresas que se dedican a crear y vender a terceros clasificaciones y bases con los datos de los usuarios que inocentemente transitan en internet. Mucha de la información personal de los usuarios de internet se encuentra suelta y sin restricciones, ¿Hasta qué punto será que es tolerable su uso?</span></div>
<div class="Publishwithline" style="font-weight: bold;">
<br /></div>
<div class="Publishwithline" style="font-weight: bold;">
<span style="color: #6fa8dc;">Referencias</span></div>
<div class="Publishwithline" style="font-weight: bold;">
<span style="color: #cfe2f3; font-size: x-small;">Wikipedia. (4 de Marzo de 2012). Web Mining</span></div>
<div class="Publishwithline" style="font-weight: bold;">
<span style="color: #cfe2f3; font-size: x-small;"><a href="http://en.wikipedia.org/wiki/Web_mining">http://en.wikipedia.org/wiki/Web_mining</a></span></div>
<div class="Publishwithline" style="font-weight: bold;">
<span style="color: #cfe2f3; font-size: x-small;">(4 de Marzo de 2012)</span></div>
<div class="Publishwithline" style="font-weight: bold;">
<span style="color: #cfe2f3; font-size: x-small;">NAP. Comportamiento del trafico NAP en Colombia</span></div>
<div class="Publishwithline" style="font-weight: bold;">
<span style="color: #cfe2f3; font-size: x-small;"><a href="http://www.nap.com.co/">http://www.nap.com.co/</a></span></div>
<div class="Publishwithline" style="font-weight: bold;">
<span style="color: #cfe2f3; font-size: x-small;">(4 de Marzo de 2012)</span></div>
<div class="Publishwithline" style="font-weight: bold;">
<br /></div>
<div class="Publishwithline" style="font-weight: bold;">
<span style="color: #cfe2f3; font-size: x-small;">Pingdom. (17 de Enero de 2012). Internet 2011 in numbers</span></div>
<div class="Publishwithline" style="font-weight: bold;">
<span style="color: #cfe2f3; font-size: x-small;"><a href="http://royal.pingdom.com/2012/01/17/internet-2011-in-numbers/">http://royal.pingdom.com/2012/01/17/internet-2011-in-numbers/</a></span></div>
<div class="Publishwithline" style="font-weight: bold;">
<span style="color: #cfe2f3; font-size: x-small;">(4 de Marzo de 2012)</span></div>
<div class="Publishwithline" style="font-weight: bold;">
<span style="color: #cfe2f3; font-size: x-small;">Jorge Enrique Mújica, LC. (13 de Septiembre de 2010). El negocio de la información personal en Internet</span></div>
<div class="Publishwithline" style="font-weight: bold;">
<span style="color: #cfe2f3; font-size: x-small;"><a href="http://www.forumlibertas.com/frontend/forumlibertas/noticia.php?id_noticia=17876&id_seccion=33">http://www.forumlibertas.com/frontend/forumlibertas/noticia.php?id_noticia=17876&id_seccion=33</a></span></div>
<div class="Publishwithline" style="font-weight: bold;">
<span style="color: #cfe2f3; font-size: x-small;">(4 de Marzo de 2012)</span></div>
<div class="Publishwithline" style="font-weight: bold;">
<br /></div>
<div class="Publishwithline" style="font-weight: bold;">
<span style="color: #cfe2f3; font-size: x-small;">Jessica E. Vascellaro. (12 de Agosto de 2010). La publicidad personalizada y el dilema de Google sobre privacidad</span></div>
<div class="Publishwithline" style="font-weight: bold;">
<span style="color: #cfe2f3; font-size: x-small;"><a href="http://online.wsj.com/article/SB128139814321225965.html?mod=wsj_share_twitter">http://online.wsj.com/article/SB128139814321225965.html?mod=wsj_share_twitter</a></span></div>
<div class="Publishwithline" style="font-weight: bold;">
<span style="color: #cfe2f3; font-size: x-small;">(4 de Marzo de 2012)</span></div>
<div class="Publishwithline" style="font-weight: bold;">
<span style="color: #cfe2f3; font-size: x-small;">Time Magazine. Joel Stain(10 de Marzo de 2011). How Companies Now Know Everything About You</span></div>
<div class="Publishwithline" style="font-weight: bold;">
<span style="color: #cfe2f3; font-size: x-small;"><a href="http://www.time.com/time/magazine/article/0,9171,2058205-1,00.html">http://www.time.com/time/magazine/article/0,9171,2058205-1,00.html</a></span></div>
<div class="Publishwithline" style="font-weight: bold;">
<span style="color: #cfe2f3; font-size: x-small;">(4 de Marzo de 2012)</span></div>
<br />aljurepastranmorenohttp://www.blogger.com/profile/17032234509937787478noreply@blogger.com0tag:blogger.com,1999:blog-8146728142951580136.post-83570036243104069272012-02-26T15:33:00.001-05:002012-02-27T00:15:54.514-05:00<div class="separator" style="clear: both; text-align: center;">
</div>
<div style="text-align: left;">
<span style="text-align: -webkit-auto;"><b><span style="font-size: large;">Data Mining bajo una solución Open-Source: RarpidMiner </span></b></span></div>
<br />
<br />
<div class="separator" style="clear: both; text-align: left;">
</div>
<div class="MsoNormal">
<a href="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEjxjjMvaVnEUopkaqzqSbnFbDPu-u2iIghcjRL9Cpo-L03rc_UrXtBAnYRM8TTuN_pZTE2evRD6CqlXEiUgqu5cgNUkg0jtOFXcryODwjvQTgsEgHdlWHanRG4ZKIRAkErNXW0m9FJw-40/s1600/Rapid-I_Logo.gif" imageanchor="1" style="clear: right; float: right; margin-bottom: 1em; margin-left: 1em;"><img border="0" height="115" src="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEjxjjMvaVnEUopkaqzqSbnFbDPu-u2iIghcjRL9Cpo-L03rc_UrXtBAnYRM8TTuN_pZTE2evRD6CqlXEiUgqu5cgNUkg0jtOFXcryODwjvQTgsEgHdlWHanRG4ZKIRAkErNXW0m9FJw-40/s200/Rapid-I_Logo.gif" width="200" /></a>Solución que según una encuesta realizada por <a href="http://www.kdnuggets.com/" target="_blank">KDnuggets</a> (periódico especializado en Data Mining), se ha posicionado en los primeros
lugares de la lista de las soluciones de software de minería de datos y
herramientas analíticas utilizadas para proyectos reales en 2009 y 2010. Siendo
así líder mundial de los sistemas de exploración de datos y texto de código
abierto, con la posibilidad de ser encontrado como una aplicación independiente
para el análisis de datos y como un motor de minería.<br />
<div class="MsoNormal">
<o:p></o:p></div>
</div>
<div class="separator" style="clear: both; text-align: center;">
<br /></div>
<table align="center" cellpadding="0" cellspacing="0" class="tr-caption-container" style="float: left; margin-right: 1em; text-align: left;"><tbody>
<tr><td style="text-align: center;"><span style="margin-left: auto; margin-right: auto;"><a href="http://www.blogger.com/goog_588664710"><img border="0" height="400" src="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEhTA4xB-xm-mLLlHOORAJrbKNCPD3-35tpPLr8rZG9p-5DkwynbZBRYVxDZC0q2dDOH-BKSb_y_Bi6xDma1_H_iTn-0YtbjwEluoNW868dOPXpFAoMrQB3YV7qVdbR5ETW19IEXV62FkUs/s400/graffica.jpg" width="325" /></a></span></td></tr>
<tr><td class="tr-caption" style="text-align: center;">Mayo de 2009 segundo lugar depues de SPSS RASW. <a href="http://www.kdnuggets.com/polls/2009/data-mining-tools-used.htm" target="_blank">Mas info aqui.</a></td></tr>
</tbody></table>
<div class="separator" style="clear: both; text-align: center;">
<br /></div>
<table align="center" cellpadding="0" cellspacing="0" class="tr-caption-container" style="float: left; margin-right: 1em; text-align: left;"><tbody>
<tr><td style="text-align: center;"><span style="margin-left: auto; margin-right: auto;"><a href="http://www.blogger.com/goog_588664722"><img border="0" height="226" src="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEhXWfgx2XC34QdvR0NmU0hi-9XpZtSvM-6xBpeTB5oqZx7eCa8m9YkzHPXFuyeONPzkm-HrH5W6MsYi4XNu9vQHQEcl40aj205ni-NmrbG8ild2kRa6RembJubsZOkEy64LHoZPhHfSews/s320/gra.jpg" width="320" /></a></span></td></tr>
<tr><td class="tr-caption" style="text-align: center;">Mayo de 2010 encabezando la lista con 345 votos de 912. <a href="http://www.kdnuggets.com/polls/2010/data-mining-analytics-tools.html" target="_blank">Mas info aqui.</a></td></tr>
</tbody></table>
<div class="MsoNormal">
</div>
<br />
<div class="separator" style="clear: both; text-align: center;">
</div>
<br />
<div class="MsoNormal">
Es una solución escrita en lenguaje de programación Java que
se encuentra distribuida bajo licencia de código abierto ofreciéndonos la
minería de datos, bajo las modalidades de extracción, transformación y carga de
datos (ETL), procesamiento, modelación, evaluación y despliegue de datos.<o:p></o:p><br />
<br />
<div class="MsoNormal">
Con esta solución, lo que se obtiene es una óptima exploración de
datos, simplificación de la construcción de procesos de análisis, evaluación de
diferentes enfoques y la combinación de pre-procesamiento. Adicionándole la posibilidad de utilizar más de 400 operadores de minería
de datos; combinándolos arbitrariamente. Configurado por archivos XML que son fácilmente
creados con una interfaz gráfica (GUI).</div>
<div class="MsoNormal">
<br /></div>
<div class="MsoNormal">
</div>
<div class="MsoNormal">
Características principales:<br />
<ul>
<li><span style="font-family: Wingdings; text-indent: -18pt;"><span style="font-family: 'Times New Roman'; font-size: 7pt;"> </span></span><span style="text-indent: -18pt;">Gran colección de algoritmos para la minería de
datos (decisión trees and self-organization maps).</span></li>
<li><span style="text-indent: -18pt;">Superposición de los histogramas, diagramas de
árbol y gráficos 3D de dispersión.</span></li>
<li><span style="text-indent: -18pt;">Variedad de plugins.</span></li>
</ul>
</div>
</div>
<div class="MsoNormal">
<div class="MsoNormal">
<br />
Campos de aplicación:<br />
<ul>
<li><span style="text-align: left; text-indent: -18pt;">Industria electrónica.</span></li>
<li><span style="text-align: left; text-indent: -18pt;">Industria de energía.</span></li>
<li><span style="text-align: left; text-indent: -18pt;">Industria automotriz.</span></li>
<li><span style="text-align: left; text-indent: -18pt;">Industria farmacéutica.</span></li>
<li><span style="text-align: left; text-indent: -18pt;">Comercio.</span></li>
<li><span style="text-align: left; text-indent: -18pt;">Aviación.</span></li>
<li><span style="text-align: left; text-indent: -18pt;">Telecomunicaciones.</span></li>
<li><span style="text-align: left; text-indent: -18pt;">Banca y seguros.</span></li>
<li><span style="text-align: left; text-indent: -18pt;">Producción.</span></li>
<li><span style="text-align: left; text-indent: -18pt;">IT.</span></li>
<li><span style="text-align: left; text-indent: -18pt;">Investigación de mercado.</span></li>
</ul>
</div>
<div class="MsoListParagraphCxSpLast" style="mso-list: l0 level1 lfo1; text-indent: -18.0pt;">
<div style="text-align: left;">
<o:p></o:p></div>
</div>
<br />
Ejemplos de aplicación:</div>
<div class="MsoNormal">
<ul>
<li><span style="text-indent: -18pt;">Exploración de datos en Excel.</span></li>
<li><span style="text-indent: -18pt;">Construcción de flujos de trabajo personalizados
del análisis de datos.</span></li>
<li><span style="text-indent: -18pt;">Es posible llamar las funciones de RapidMiner
desde programas escritos en otros lenguajes.</span></li>
</ul>
<span style="text-indent: -18pt;"><br /></span><br />
<span style="text-indent: -18pt;">A </span><span style="text-indent: -18pt;">continuación les compartimos el link de descarga, algunos links que
probablemente les serán de mucha ayuda al momento de dar inicio en este y un video que incluye una ligera demostración de como importar datos a RapidMiner.</span></div>
<br />
Descarga: <a href="http://rapid-i.com/content/view/26/82/" target="_blank"> http://rapid-i.com/content/view/26/82/ </a><br />
Descripción de Operación: <a href="http://rapid-i.com/content/view/12/34/" target="_blank"> http://rapid-i.com/content/view/12/34/</a><br />
Imágenes: <a href="http://rapid-i.com/content/view/9/25/" target="_blank"> http://rapid-i.com/content/view/9/25/</a><br />
<br />
<br />
<h1 id="watch-headline-title">
<span class="long-title" dir="ltr" id="eow-title" title="RapidMiner Tutorial - Importing Data into RapidMiner (Data Mining and Predictive Analytics System)"><span style="font-size: small;"><a href="http://www.youtube.com/watch?v=cVjyJ9Ag0_0" target="_blank">Importing Data into RapidMiner (Data Mining and Predictive Analytics System).</a></span></span></h1>
<br />
<div class="separator" style="clear: both; text-align: center;">
<object class="BLOGGER-youtube-video" classid="clsid:D27CDB6E-AE6D-11cf-96B8-444553540000" codebase="http://download.macromedia.com/pub/shockwave/cabs/flash/swflash.cab#version=6,0,40,0" data-thumbnail-src="http://1.gvt0.com/vi/cVjyJ9Ag0_0/0.jpg" height="266" width="320"><param name="movie" value="http://www.youtube.com/v/cVjyJ9Ag0_0&fs=1&source=uds" />
<param name="bgcolor" value="#FFFFFF" />
<embed width="320" height="266" src="http://www.youtube.com/v/cVjyJ9Ag0_0&fs=1&source=uds" type="application/x-shockwave-flash"></embed></object></div>
<div class="separator" style="clear: both; text-align: center;">
<br /></div>
<br />
<br />
<div class="MsoNormal">
Referencias:<br />
<br />
<ul>
<li><span style="font-family: Wingdings; text-indent: -18pt;"><span style="font-family: 'Times New Roman'; font-size: 7pt;"><span style="font-family: Wingdings; font-size: small; text-indent: -18pt;"><span style="font-family: 'Times New Roman'; font-size: 7pt;"> </span></span><a href="http://rapid-i.com/content/view/10/69/lang,en/" target="_blank"><span style="font-size: small;"><span style="text-indent: -18pt;">http://rapid-i.com/content/view/10/69/lang,en/</span></span> </a></span></span></li>
<li> <a href="http://en.wikipedia.org/wiki/RapidMiner" target="_blank">http://en.wikipedia.org/wiki/RapidMiner</a></li>
</ul>
</div>
<br />
<br />
<br />
<div class="separator" style="clear: both; text-align: center;">
<a href="http://rapid-i.com/content/view/10/69/lang,en/" style="clear: left; float: left; margin-bottom: 1em; margin-right: 1em;" target="_blank"><img border="0" height="85" src="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEjE31n4-1j0TmbYlrbTGrJ_5IRo52IzVUlZIXxGgyuh0mmKLVCJZ0KN8CLbktO6NMzAjuwgaZUHJonQkGunPI59Fe88TcYOe-G9-HHnhWJ2bFHrTA0V0CszqLVlapq8RoRGBHjrM-2BZPU/s320/rapidminer_logo.gif" width="320" /></a></div>
<br />
<br />aljurepastranmorenohttp://www.blogger.com/profile/17032234509937787478noreply@blogger.com0tag:blogger.com,1999:blog-8146728142951580136.post-88655731085588795992012-02-19T22:05:00.004-05:002012-02-19T22:13:54.361-05:00Entradas y salidas: ¿qué se analiza? ¿Cuál es el resultado?<br />
<div class="MsoNormal">
Cuando
hablamos de minería de datos, es claro que entra al análisis una gran cantidad
de datos, y que se obtiene una representación de lo que no se conocía; es
decir, se hace uso de la información recibida, para generar conocimiento. Cuando
usted utilice software de minería de datos, observará que se cumplen los
conceptos generales de los datos ingresados, y las representaciones obtenidas.
Aquí le presentamos cómo entenderlos.</div>
<div class="MsoNormal">
<span lang="ES-CO"><br /></span></div>
<div class="MsoNormal">
<span lang="ES-CO">Básicamente,
cuando se desea hacer un análisis mediante minería de datos, se formula una
pregunta sobre lo que se desea conocer (un <i>concepto,
</i>al que se puede llegar mediante diversos métodos). Teniendo esto claro, se
introducen las <i>instancias</i> (es decir,
los casos), con sus correspondientes <i>atributos</i>
al software de Data Mining. Por ejemplo, en el mencionado caso de los pañales y
la cerveza, podría pensarse que se decidió incluir todas las ventas del fin de
semana del supermercado: siendo cada producto una instancia, sus atributos
podrían incluir la hora en que fue comprado, y en qué factura se registró (por
supuesto, entre otros). <o:p></o:p></span></div>
<div class="separator" style="clear: both; text-align: center;">
<a href="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEgmKYcX4YsufYw2Mgmm6ycZ_qIB4dyzBIGA0uMdsESUgyJfxG6AjSnY1-rXQm5AU6r7Q3T9NlfvvtToCcNK4YLj368g_MVfzyIkMWJpUOhYR3Lg3JdjhS4OQ8zU7vZg2CaDZHX9lEIvN20/s1600/01.JPG" imageanchor="1" style="margin-left: 1em; margin-right: 1em;"><img border="0" height="128" src="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEgmKYcX4YsufYw2Mgmm6ycZ_qIB4dyzBIGA0uMdsESUgyJfxG6AjSnY1-rXQm5AU6r7Q3T9NlfvvtToCcNK4YLj368g_MVfzyIkMWJpUOhYR3Lg3JdjhS4OQ8zU7vZg2CaDZHX9lEIvN20/s320/01.JPG" width="320" /></a></div>
<div class="separator" style="clear: both; text-align: center;">
<br /></div>
El software de data mining toma toda esta información, la agrupa y estudia según diferentes métodos (que explicaremos luego) y presenta la información según corresponda: puede presentar tablas, que es la forma más simple; modelos lineales (también llamados de regresión), árboles de decisión, reglas (estos dos pueden usarse alternativamente), representación basada en instancias (es decir, ubicando los ejemplos en un modelo), y clusters (cuando los conceptos incluyen la reunión de varias características).<br />
<div class="separator" style="clear: both; text-align: center;">
<a href="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEhy7RUpNT05znjPMwfvRJrcPvnIDE_UuridIveclQCJgWT-DVwCY2iYEZpHqYCHbB3jFVyHhBlRJm7GZoBYif72xzak3BpjOGl_q8k-THTiyE90RVkVKxfmVwNp5yYUTraqcLRxWZVMGJc/s1600/02.JPG" imageanchor="1" style="margin-left: 1em; margin-right: 1em;"><img border="0" height="129" src="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEhy7RUpNT05znjPMwfvRJrcPvnIDE_UuridIveclQCJgWT-DVwCY2iYEZpHqYCHbB3jFVyHhBlRJm7GZoBYif72xzak3BpjOGl_q8k-THTiyE90RVkVKxfmVwNp5yYUTraqcLRxWZVMGJc/s320/02.JPG" width="320" /></a></div>
<div class="separator" style="clear: both; text-align: center;">
<br /></div>
<div class="separator" style="clear: both; text-align: center;">
<a href="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEibuN6Xe9Gj-lyiaQBpjQXrLZcEPNDIvqTrqOAdbCNor0hXIpEaQNbqbVdwpinKAFAs-hEEbcLCMevPhn4QYQ5qaIzEWWXgbnJ_mjqWs6ahbI-0jsJc4eV0lAFJrm5_nWtaZ35Yy-Ze2mI/s1600/03.JPG" imageanchor="1" style="margin-left: 1em; margin-right: 1em;"><img border="0" height="165" src="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEibuN6Xe9Gj-lyiaQBpjQXrLZcEPNDIvqTrqOAdbCNor0hXIpEaQNbqbVdwpinKAFAs-hEEbcLCMevPhn4QYQ5qaIzEWWXgbnJ_mjqWs6ahbI-0jsJc4eV0lAFJrm5_nWtaZ35Yy-Ze2mI/s320/03.JPG" width="320" /></a></div>
<br />
<div class="separator" style="clear: both; text-align: center;">
<br /></div>
<div class="separator" style="clear: both; text-align: center;">
<a href="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEgo-FtTs_kScAlgxjIcEsfpSuVwhyzvHc1QPzn4VPNzq5Yap4uyPfc5JPe_Bg3blADdhD28fzBtbHWy1gF48loe1XVPWpL-cApkbgk4K8zL32AbM_b0bhqQsbE02rl8rgH8LiDF0IFNm-E/s1600/04.JPG" imageanchor="1" style="margin-left: 1em; margin-right: 1em;"><img border="0" height="172" src="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEgo-FtTs_kScAlgxjIcEsfpSuVwhyzvHc1QPzn4VPNzq5Yap4uyPfc5JPe_Bg3blADdhD28fzBtbHWy1gF48loe1XVPWpL-cApkbgk4K8zL32AbM_b0bhqQsbE02rl8rgH8LiDF0IFNm-E/s320/04.JPG" width="320" /></a></div>
<br />
<div class="separator" style="clear: both; text-align: center;">
<a href="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEiWRcsCZ8_1PekMcR5hy7RKDoCVecQbdXqkDDMA3RSDZkM7YPyPMYMSA39Mo8GWQRW009uH4jJmDSP9j3zMbZo7rFlSaHCNYyor94J7cCcGNy4tqXEvK31mhI-VG1S4oji6j-NpKsciSHU/s1600/05.JPG" imageanchor="1" style="margin-left: 1em; margin-right: 1em;"><img border="0" height="19" src="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEiWRcsCZ8_1PekMcR5hy7RKDoCVecQbdXqkDDMA3RSDZkM7YPyPMYMSA39Mo8GWQRW009uH4jJmDSP9j3zMbZo7rFlSaHCNYyor94J7cCcGNy4tqXEvK31mhI-VG1S4oji6j-NpKsciSHU/s320/05.JPG" width="320" /></a></div>
<br />
<div class="separator" style="clear: both; text-align: center;">
<br /></div>
<div class="separator" style="clear: both; text-align: center;">
<a href="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEhCc9LrPJ-HYgJ_gqYBCMECfvQD14JK6krgixzPTw3Yq_Ew6hxeYV_hQPCXkApPN-ChBw1rrgTht_OZ25_FDgCgKi-0t-aMYw4AWnhhzmkK5WHVEPMNZDnS8jsK6IShS4RkOA2zHRKlpsQ/s1600/06.JPG" imageanchor="1" style="margin-left: 1em; margin-right: 1em;"><img border="0" height="128" src="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEhCc9LrPJ-HYgJ_gqYBCMECfvQD14JK6krgixzPTw3Yq_Ew6hxeYV_hQPCXkApPN-ChBw1rrgTht_OZ25_FDgCgKi-0t-aMYw4AWnhhzmkK5WHVEPMNZDnS8jsK6IShS4RkOA2zHRKlpsQ/s320/06.JPG" width="320" /></a></div>
<br />
<div class="separator" style="clear: both; text-align: center;">
<a href="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEgEzqO2Fh-V2SfJIMBiKfufIIY68TNKHIQpvqAxGDbfzURwGcUo4kPMcTXicZiTUtKIpit-3UeOfP-VshaXN3QVYeLqVdg2KnYO2PNXHCzbhevIczIMBfigtFT-7s9pFB4M9ixUlPFBdZ8/s1600/07.JPG" imageanchor="1" style="margin-left: 1em; margin-right: 1em;"><img border="0" src="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEgEzqO2Fh-V2SfJIMBiKfufIIY68TNKHIQpvqAxGDbfzURwGcUo4kPMcTXicZiTUtKIpit-3UeOfP-VshaXN3QVYeLqVdg2KnYO2PNXHCzbhevIczIMBfigtFT-7s9pFB4M9ixUlPFBdZ8/s1600/07.JPG" /></a></div>
<br />
<div align="center" class="MsoNormal" style="text-align: -webkit-auto;">
<br />
<br />
Referencias:<br />
<br />
Witten, Ian et al. Data Mining. Practical Machine Learning Tools and Techniques. Ed. Morgan Kaufmann. Burlington, USA.<br />
<br />
The University of Edinburgh. Data Mining and Exploration. <a href="http://www.inf.ed.ac.uk/teaching/courses/dme/">http://www.inf.ed.ac.uk/teaching/courses/dme/</a>
<br />
<br />
Kantardzic, Mehmed. Data Mining: Concepts, Models, Methods, and Algorithms. IEEE Press.<br />
<br />
Data Mining Software, Tools and Applications. <a href="http://www.the-data-mine.com/Software/DataMiningSoftware">http://www.the-data-mine.com/Software/DataMiningSoftware</a>
<br />
<br />
<h1 class="gb-volume-title" dir="ltr" style="background-color: white; margin-bottom: 0px; margin-left: 0px; margin-right: 0px; margin-top: 0px;">
<div style="color: #333333; font-family: Arial, sans-serif; font-size: 11px;">
<br /></div>
</h1>
<div>
<br /></div>
</div>aljurepastranmorenohttp://www.blogger.com/profile/17032234509937787478noreply@blogger.com0tag:blogger.com,1999:blog-8146728142951580136.post-33521230603824210042012-02-12T22:30:00.002-05:002012-02-12T22:38:16.327-05:00<b><span style="font-size: x-large;">La Minería de Datos, Proceso y Patrones</span></b><br />
<b><span style="font-size: x-large;"><br /></span></b><br />
<div class="separator" style="clear: both; text-align: center;">
</div>
<div class="separator" style="clear: both; text-align: center;">
<a href="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEj9a7NzFVAxSlfdPuAFKkQK6To5OicOk2YHoJmt6LFPhor5LwicMbizMyGF3JesaYUEVWNDGLgjEIwBP1urWlNZINSsbWNOQUmmWUaZS2Dn-vzuaP2CyULRhmS1x6LUZrEWv3epEt3UB40/s1600/lupa1.jpg" imageanchor="1" style="clear: right; float: right; margin-bottom: 1em; margin-left: 1em;"><img border="0" height="320" src="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEj9a7NzFVAxSlfdPuAFKkQK6To5OicOk2YHoJmt6LFPhor5LwicMbizMyGF3JesaYUEVWNDGLgjEIwBP1urWlNZINSsbWNOQUmmWUaZS2Dn-vzuaP2CyULRhmS1x6LUZrEWv3epEt3UB40/s320/lupa1.jpg" width="320" /></a></div>
<div style="text-align: justify;">
Todo software construido para la minería de datos posee un proceso que tiene como objetivo captar información y conocimientos valiosos para el negocio a partir de los datos. Este proceso lo podemos dividir en seis pasos:</div>
<div style="text-align: justify;">
<br /></div>
<div style="text-align: justify;">
<br /></div>
<div style="text-align: justify;">
<span style="color: #6fa8dc;"><b>1.<span class="Apple-tab-span" style="white-space: pre;"> </span>Selección del conjunto datos:</b></span> Consiste en escoger el grupo de variables que se someterán a análisis </div>
<div style="text-align: justify;">
<b><span style="color: #6fa8dc;">2.<span class="Apple-tab-span" style="white-space: pre;"> </span>Análisis de las propiedades de los datos: </span></b>Se evalúan las propiedades en histogramas y diagramas de dispersión, se detectan los valores típicos y atípicos, los valores nulos entre otras propiedades.</div>
<div style="text-align: justify;">
<b><span style="color: #6fa8dc;">3.<span class="Apple-tab-span" style="white-space: pre;"> </span>Transformación del conjunto de datos de entrada: </span></b>Teniendo las propiedades de los datos, estos se preparan en forma, formato o significado para hacer el procesamiento que provee la técnica de minería.</div>
<div style="text-align: justify;">
<b><span style="color: #6fa8dc;">4.<span class="Apple-tab-span" style="white-space: pre;"> </span>Seleccionar y aplicar la técnica de minería de datos:</span></b> Aquí se realiza el modelo predictivo de clasificación o segmentación que permite obtener la información relevante según las necesidades del negocio.</div>
<div style="text-align: justify;">
<b><span style="color: #6fa8dc;">5.<span class="Apple-tab-span" style="white-space: pre;"> </span>Extracción de conocimiento:</span></b> Una vez se tiene la técnica de minería de datos, se prepara un modelo de conocimiento cuya función es representar los patrones de comportamiento que arrojan los valores de las variables o las relaciones ente ellas. </div>
<div style="text-align: justify;">
<span style="color: #6fa8dc;"><b>6.<span class="Apple-tab-span" style="white-space: pre;"> </span>Interpretación y evaluación de datos:</b></span> Finalmente con el conocimiento extraído se procede a evaluar la información y a presentar interpretaciones apropiadas y relevantes al negocio.</div>
<br />
<b><span style="font-size: large;">Patrones</span></b><br />
<b><span style="font-size: large;"><br /></span></b><br />
<div style="text-align: justify;">
<div class="separator" style="clear: both; text-align: center;">
<a href="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEi5vgifu-UmbbY5GlIgvmDJgQQBTE4gF5A4bSwQBFTyBXzIC-u49CxH6L-Q7Viq3Br3EpuJXjjGSPzU5Uw4XMgrnhFYtuE_6pPZo6ieY2Mi2t9qvvraaZ2urVKBKTx-IBFsrkLdiPU06F4/s1600/molde.jpg" imageanchor="1" style="clear: left; float: left; margin-bottom: 1em; margin-right: 1em; text-align: center;"><img border="0" height="200" src="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEi5vgifu-UmbbY5GlIgvmDJgQQBTE4gF5A4bSwQBFTyBXzIC-u49CxH6L-Q7Viq3Br3EpuJXjjGSPzU5Uw4XMgrnhFYtuE_6pPZo6ieY2Mi2t9qvvraaZ2urVKBKTx-IBFsrkLdiPU06F4/s200/molde.jpg" width="200" /></a></div>
Un método de minería de datos muy útil en la industria y el mercado es la minería de datos por patrones. Esta técnica Involucra la búsqueda de patrones repetitivos en los datos, esto permite encontrar reglas de asociación muy útiles a la hora de formular juicios predictivos. </div>
<div style="text-align: justify;">
<br /></div>
<div style="text-align: justify;">
Dos asombrosos ejemplos de esto se exponen a continuación. </div>
<br />
<br />
<br />
<br />
<br />
<br />
<a href="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEjiEqPmcr7c9xvttKIonzluLg6fOrGu_oLueG97PXPCB7ONT3ehlL5f42OGRpZmNPycr9qPAM-GYW1w8tiU3vyBlevTvpnIdtUu9MnRHsNRYLl1K-CdyuknUrTSlnIZyYym9oU1qlv1M1A/s1600/cerveza.jpg" imageanchor="1" style="clear: right; float: right; margin-bottom: 1em; margin-left: 1em; text-align: center;"><img border="0" height="151" src="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEjiEqPmcr7c9xvttKIonzluLg6fOrGu_oLueG97PXPCB7ONT3ehlL5f42OGRpZmNPycr9qPAM-GYW1w8tiU3vyBlevTvpnIdtUu9MnRHsNRYLl1K-CdyuknUrTSlnIZyYym9oU1qlv1M1A/s200/cerveza.jpg" width="200" /></a><a href="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEjyCle0X0wvTAVWQRSXkGxE2MByAh0Up8P-wdYhsCfKF8Fl_V78kARqpKqF6VKR1dsGq2hBTLuzdj0Eh1mtUAXhosWWLlrM2IedtiH__UJZO8wuFz5LWiYQ_Cb5_9le5wCoVZG_uWBcDag/s1600/pa%C3%B1ales.JPG" imageanchor="1" style="clear: right; float: right; margin-bottom: 1em; margin-left: 1em; text-align: center;"><img border="0" height="150" src="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEjyCle0X0wvTAVWQRSXkGxE2MByAh0Up8P-wdYhsCfKF8Fl_V78kARqpKqF6VKR1dsGq2hBTLuzdj0Eh1mtUAXhosWWLlrM2IedtiH__UJZO8wuFz5LWiYQ_Cb5_9le5wCoVZG_uWBcDag/s200/pa%C3%B1ales.JPG" width="200" /></a><b><span style="color: #6fa8dc;">Hábitos de compra en supermercados</span></b><br />
<div style="text-align: justify;">
El ejemplo clásico pero que tiene mucho éxito es el de los supermercados. En ellos los patrones sirven para realizar la distribución de los productos detectando la relación de compra que existe entre ellos. El ejemplo citado es:<br />
<br /></div>
<div style="text-align: justify;">
<i>“Un estudio muy citado detectó que los viernes había una cantidad inusualmente elevada de clientes que adquirían a la vez pañales y cerveza. Se detectó que se debía a que dicho día solían acudir al supermercado padres jóvenes cuya perspectiva para el fin de semana consistía en quedarse en casa cuidando de su hijo y viendo la televisión con una cerveza en la mano. El supermercado pudo incrementar sus ventas de cerveza colocándolas próximas a los pañales para fomentar las ventas compulsivas” </i></div>
<br />
<br />
<br />
<br />
<br />
<a href="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEhY0WSO8fxROAlqmENO2NA69CL7k9UYri99QsFjWWTzrlWz3giEVfHfu4W6TpLn-C1bpn7r9O_4FUuXQSPjffsmxVaF_INdzlVekfc-bQabItkOnrAnwhRVLEQ2dNKWD4M1JdMTh5DBhzI/s1600/criminal2.gif" imageanchor="1" style="clear: left; float: left; margin-bottom: 1em; margin-right: 1em; text-align: center;"><img border="0" height="200" src="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEhY0WSO8fxROAlqmENO2NA69CL7k9UYri99QsFjWWTzrlWz3giEVfHfu4W6TpLn-C1bpn7r9O_4FUuXQSPjffsmxVaF_INdzlVekfc-bQabItkOnrAnwhRVLEQ2dNKWD4M1JdMTh5DBhzI/s200/criminal2.gif" width="162" /></a><b><span style="color: #6fa8dc;">Criminales</span></b><br />
<div style="text-align: justify;">
Otra aplicación de este método es la identificación de las redes o bandas criminales, sus líderes o integrantes clave y las relaciones entre ellos. Primero se construye una red de sospechosos que, por medio de los vínculos entre ellos en acciones y eventos y, teniendo en cuenta la periodicidad y otros factores patronales, se identifica al líder de la organización. </div>
<br />
<br />
<br />
<br />
<br />
<br />
<br />
<b><span style="color: #6fa8dc;">Referencias</span></b><br />
Licenciatura en Informática de la Universidad de Morón, Centro de Ingeniería de Software e Ingeniería del Conocimiento de la Escuela de Postgrado ITBA, Laboratorio de Sistemas Inteligentes de la Facultad de Ingeniería de la Universidad de Buenos Aires. Minería de Datos Aplicada a la Detección de Patrones Delictivos<br />
en Argentina<br />
<a href="http://www.itba.edu.ar/archivos/secciones/98JIISIC-08-31-39.pdf">http://www.itba.edu.ar/archivos/secciones/98JIISIC-08-31-39.pdf</a><br />
(12 de Febrero de 2012)<br />
<br />
Wikipedia. (11 de Febrero de 2012).Minería de datos.<br />
<a href="http://es.wikipedia.org/wiki/Miner%C3%ADa_de_datos#cite_note-0">http://es.wikipedia.org/wiki/Miner%C3%ADa_de_datos#cite_note-0</a><br />
(12 de Febrero de 2012)<br />
<br />
Wikipedia. (12 de Febrero de 2012). Data Mining.<br />
<a href="http://en.wikipedia.org/wiki/Data_mining">http://en.wikipedia.org/wiki/Data_mining</a><br />
(12 de Febrero de 2012)<br />
<br />
<br />
<br />
<div class="MsoNormal" style="line-height: 150%;">
<span style="font-family: Arial, sans-serif; font-size: x-large;"><b><br /></b></span></div>aljurepastranmorenohttp://www.blogger.com/profile/17032234509937787478noreply@blogger.com0tag:blogger.com,1999:blog-8146728142951580136.post-8278995996495276442012-02-04T17:26:00.005-05:002012-02-06T00:10:26.368-05:00Google Refine. Una herramienta libre para ser aplicada en la minería de datos.<a href="http://3.bp.blogspot.com/-ZCupbQpyTFY/Ty73ujqWv3I/AAAAAAAAACo/Fvjvsdg8ZSs/s1600/Google_Refine_2.jpg" imageanchor="1" style="clear: right; float: right; margin-bottom: 1em; margin-left: 1em;"><img border="0" height="227" src="http://3.bp.blogspot.com/-ZCupbQpyTFY/Ty73ujqWv3I/AAAAAAAAACo/Fvjvsdg8ZSs/s320/Google_Refine_2.jpg" width="320" /></a>Google refine es una herramienta poderosa empleada para trabajar con datos desordenados, con el fin de limpiarlos, ordenarlos, y transfórmalos de un formato a otro sin importar el origen de los mismos, teniendo en cuenta que esta entre sus principales funciones el trabajo con datos que no se encuentren bien estructurados. Esta aplicación también nos posibilita encontrar las diferentes incoherencias que se pueden presentar al momento de almacenar o trabajar datos. Un ejemplo de esto, son las tablas en Excel cuando son cargadas manualmente, aquí indudablemente encontraremos errores poco relevantes pero que no se deben dejar a un lado, pues con el tiempo irán adquiriendo mayor complejidad, la cual aumentara la necesidad de darles una solución inmediata y efectiva. Es este el caso donde Google refine intercedería por nosotros, facilitándonos la tarea.<br />
<br />
Las características específicas de este software son tan sencillas, que no se encontraran con dificultades al momento de dar uso a este, para ver lo sencillo que es, haremos llamado de una sola característica que será usada siempre. El programa instalara un sencillo servidor en el equipo local, al cual se accederá a través del navegador, desde el que se podrá seleccionar los datos con los que se quieran trabajar, claro está que dichos datos deben estar almacenados en el disco duro local.<br />
Lo bueno de esta herramienta recae en que es de código abierto y no se tienen que cargar los datos en un servidor ajeno, por esto es accesible para todo aquel que desee probarla, y pues teniendo en cuenta este detalle, a continuación les compartimos el link de descarga y algunos links que probablemente les serán de mucha ayuda al momento de dar inicio en este. <br />
<br />
Descarga: <a href="http://code.google.com/p/google-refine/wiki/Downloads?tm=2">http://code.google.com/p/google-refine/wiki/Downloads?tm=2</a><br />
Instalación: <a href="http://code.google.com/p/google-refine/wiki/InstallationInstructions">http://code.google.com/p/google-refine/wiki/InstallationInstructions</a><br />
Guía de usuario: <a href="http://code.google.com/p/google-refine/wiki/UserGuide">http://code.google.com/p/google-refine/wiki/UserGuide</a><br />
<br />
<br />
<a href="http://code.google.com/p/google-refine/" target="_blank"><img border="0" src="http://3.bp.blogspot.com/-xI3_vr7pC5o/Ty73xoxN5sI/AAAAAAAAACw/Ll5mRT1xneA/s1600/Google_Refine.jpg" /></a>Hernán M.http://www.blogger.com/profile/08770877613626691858noreply@blogger.com0tag:blogger.com,1999:blog-8146728142951580136.post-91309612193185679222012-01-29T20:43:00.004-05:002012-01-29T20:43:51.026-05:00IBM SPSS Modeler: eficiencia, confiabilidad. Casos de Éxito.<br />La primera herramienta que presentamos corresponde a una propuesta de IBM. Esta solución de software ha llamado nuestra atención, pues promete un uso fácil de aprender, permite tener la visión de negocio permanentemente (sin preocuparse por la programación, por ejemplo), y cuenta con el respaldo del gigante de la computación IBM. Adicionalmente, ha tenido ya una entrada significativa al mercado colombiano, con casos de éxito. <br /><br /> Algunos puntos que <a href="http://www-142.ibm.com/software/products/es/es/spss-modeler/">en su página</a> se comentan como ventajas son la agilidad en el proceso, la utilización óptima de los datos, y la amplia compatibilidad con otros sistemas. <br /><br />Los precios de esta herramienta van desde los €10.701 en Europa, en su edición IBM SPSS Modeler Professional. En Colombia, su distribuidor es Informese Ltda , empresa con 18 años de experiencia en el sector y sedes en Bogotá, Lima, Caracas y Quito. (Información del distribuidor y la herramienta <a href="http://informese.com.co/jml/index.php?option=com_content&view=category&layout=blog&id=44&Itemid=58">aquí</a>)<br />
<br />
<b>Casos de Éxito:</b><br />
<br />Un interesante caso de éxito de esta herramienta es el Standard Bank Argentina, en donde se utilizó la herramienta para adquirir clientes de manera inteligente para una tarjeta de crédito. A raíz de las palpables ganancias en el negocio, el banco amplió el uso de la solución, como lo comenta el gerente del área de Credits Analytics en el siguiente video:<br />
<br />
<div class="separator" style="clear: both; text-align: center;">
<iframe allowfullscreen='allowfullscreen' webkitallowfullscreen='webkitallowfullscreen' mozallowfullscreen='mozallowfullscreen' width='320' height='266' src='https://www.youtube.com/embed/0UtjIADG9pw?feature=player_embedded' frameborder='0'></iframe></div>
<br /><br />En el contexto colombiano, se puede observar <a href="https://www.contratos.gov.co/archivospuc1/2010/DA/113001002/10-12-422659/DA_PROCESO_10-12-422659_113001002_2220156.pdf">en este documento oficial</a> que la Superintendencia Financiera de Colombia ha utilizado esta herramienta desde hace algunos años (en este caso, se puede observar una aproximación al precio colombiano de la herramienta), y el Icetex también (como se puede ver <a href="http://www.icetex.gov.co/portal/Default.aspx?tabid=287%20">en este informe de la entidad</a>).<br /><br />En conclusión, es una solución de software que promete la entrega de resultados que contribuyan a la inteligente toma de decisiones, y que dado su precio y robustez está orientada a organizaciones con una considerable cantidad de datos, necesidades de inteligencia de negocios, y posiblemente dinero: es una excelente herramienta para organizaciones grandes.aljurepastranmorenohttp://www.blogger.com/profile/17032234509937787478noreply@blogger.com0tag:blogger.com,1999:blog-8146728142951580136.post-25919178447635783092012-01-24T23:52:00.000-05:002012-01-25T09:32:40.886-05:00Definición y Descripción del Alcance<a href="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEh3Ri8sAu6-62oUi2-wtDfCDmFWSG6F_FNohJ6xmzE6JpNFRdj1ZpvrzdAp_cad1G6awY75qz9Ucp40WnpI2lvJYHs_fC4txNWMQ4AznLWsCsyVlLaJXbnj0SePGdaOJ2ShpTp5LfoNijw/s1600/datamining.jpg" imageanchor="1" style="clear: right; float: right; margin-bottom: 1em; margin-left: 1em;"><img border="0" height="198" src="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEh3Ri8sAu6-62oUi2-wtDfCDmFWSG6F_FNohJ6xmzE6JpNFRdj1ZpvrzdAp_cad1G6awY75qz9Ucp40WnpI2lvJYHs_fC4txNWMQ4AznLWsCsyVlLaJXbnj0SePGdaOJ2ShpTp5LfoNijw/s200/datamining.jpg" width="200" /></a><br />
Estimado lector: en este blog encontrará información sobre diferentes
soluciones de software existentes, relacionadas con Data Mining.
Semanalmente, se presentarán productos e información relacionada con
este tema. Hay una creciente diversidad de productos, pero antes de
reseñarlos, quisiéramos aclarar el concepto mencionado: ¿qué es,
entonces, la “minería de datos”? ¿Para qué sirve?<br />
<br />
La minería de
datos (que es el resultado de un trabajo inicialmente
interdisciplinario, con un gran componente estadístico) lleva a
descubrir conocimiento que se encuentra en los datos: se busca
identificar patrones contenidos en un conjunto de una base de datos,
para que los usuarios puedan encontrar allí importantes puntos que
lleven a la toma de decisiones. Por esta razón, Data Mining es un
componente infaltable en la Inteligencia de Negocios. Con el uso de las
herramientas de Data Mining, los usuarios (que no deben tener
necesariamente conocimientos avanzados de computación) pueden
identificar tendencias importantes en sus datos, que pueden ser
utilizadas para mejorar sus utilidades, entre otros.<br />
<br />
El
software de Data Mining acude en general a una amplia cantidad de datos
almacenados, aplica diferentes algoritmos a éstos, e identifica puntos
considerables que puedan servir al usuario (y por estas razones, suele
necesitar alguna capacidad en las máquinas, como mostraremos más
adelante). Sin embargo, la posibilidad de encontrar información valiosa
para las organizaciones es realmente considerable, pues generalmente se
pueden sugerir de allí algunos aspectos inesperados. <br />
<br />
La
próxima semana comenzaremos a describir algunas soluciones de software
de Data Mining. Esperamos que el tema sea de su agrado.aljurepastranmorenohttp://www.blogger.com/profile/17032234509937787478noreply@blogger.com0