RSS


Desde los 14 años me encuentro inmerso en el mundo de la informática, desarrollé mi primer programa comercial a las 15 años para una empresa no tan pequeña, es por esto que me inquietan los nuevos conceptos en este campo, conceptos tales como el de DataMining por ejemplo, veamos, luego de algunas investigaciones y de algunas conversaciones sobre el tema, me dispongo a compartir mis humildes alcances y entendimientos, espero les sea de alguna ayuda a alguien en el planeta...

Principiemos (como dice mi profesora de Gestión del Mantenimiento y lo dice bien), como le explicarías a un niño que significa el concepto de Data Mining?, pues primero se lo traduces no?, Data Mining significa “Minería de Datos”, inmediatamente el niño se imaginaría una gran mina con muchos datos en su interior y pues no estaría muy alejado de la verdad, en esencia se dice que se trata de Montañas de Datos y de lo que se trata es que en base a herramientas (como lo son el pico, la pala, etc) logremos excavar esas montañas y encontremos las famosas "pepitas de oro", en este caso se trataría de información útil e importante para nosotros.

Una definición que encontré por ahí:

Data Mining es el conjunto de técnicas y herramientas usadas para encontrar y entender relaciones en una gran cantidad de datos y presentarlas en una forma útil y ventajosa.

Es decir, cuando una empresa ha acumulado una gran cantidad de datos en su interacción con los clientes, podría usar estos datos para conocer mejor a estos clientes y tomar mejores decisiones. Y ¿cómo haría esto? La mejor manera, sobre todo si la cantidad de datos es muy grande, sería usar programas especiales que le permitan no solo obtener promedios y sumas, sino también que sean capaces de encontrar relaciones útiles. Por ejemplo, si el porcentaje de clientes que se cambia a la competencia es preocupante, sería conveniente conocer cuáles son los factores que influyen es sus decisiones para poder actuar de manera que se logre disminuir las bajas.

Al conjunto de programas, técnicas y métodos que posibilitan conocer este tipo de información, se lo llama Data Mining.


Tengo un amigo, que es "consultor en DataMining", él me lo explicó con un ejemplo....

El ejemplo clásico de aplicación de la minería de datos tiene que ver con la detección de hábitos de compra en supermercados. Un estudio muy citado detectó que los viernes había una cantidad inusualmente elevada de clientes que adquirían a la vez pañales y cerveza. Se detectó que se debía a que dicho día solían acudir al supermercado padres jóvenes cuya perspectiva para el fin de semana consistía en quedarse en casa cuidando de su hijo y viendo la televisión con una cerveza en la mano. El supermercado pudo incrementar sus ventas de cerveza colocándolas próximas a los pañales para fomentar las ventas compulsivas.

También es un área en boga el del análisis del comportamiento de los visitantes —sobre todo, cuando son clientes potenciales— en una página de Internet. O la utilización de la información —obtenida por medios más o menos legítimos— sobre ellos para ofrecerles propaganda adaptada específicamente a su perfil. O para, una vez que adquieren un determinado producto, saber inmediatamente qué otro ofrecerle teniendo en cuenta la información histórica disponible acerca de los clientes que han comprado el primero.


ESTA ES LA TECNICA DE "AMAZON.COM"



Si bien es posible usar Excel para realizar buena parte de un proyecto de Data Mining, usualmente se usan otros programas especialmente creadas para este propósito, ya que permiten trabajar con bases de datos que contienen millones de filas y cientos o miles de columnas. Además, estos programas contienen algoritmos que permiten crear modelos capaces de poner en evidencia las relaciones buscadas.

Actualmente muchas empresas en el mundo están llevando a cabo proyectos de Data Mining en distintas áreas para responder diversas cuestiones. Por ejemplo:

  • ¿Cuáles son los mejores productos para venderles a mis clientes?
  • ¿Cuál es la probabilidad de que un cliente compre un determinado producto?
  • ¿Cuál es la mejor manera de agrupar o segmentar a mis clientes?
  • ¿Qué características comparten mis mejores clientes?
  • ¿A cuáles clientes puedo otorgarles crédito y a cuáles no?
  • ¿Cuál es la probabilidad de que un cliente esté cometiendo un fraude?
  • ¿Cuál es el riesgo de perder este cliente?

En realidad la mayoría de los algoritmos, las técnicas y los métodos de análisis no son nuevos. Las bases sobre las que están construidos la mayoría de los programas de Data Mining, son las mismas, por lo que en general los tiempos de desarrollo de los proyectos y los resultados obtenidos son similares usando cualquier programa.




En 1999 Dorian Pyle publicó un libro llamado Data Preparation for Data Mining, que pasó a convertise en la mejor referencia acerca de la preparacion de datos. En este mismo libro se esboza una nueva manera de realizar un análisis de datos basado en la Teoría de la Información. Este nuevo enfoque posibilita una gran cantidad de ventajas respecto al enfoque tradicional.




Fuentes:

http://es.wikipedia.org/wiki/Miner%C3%ADa_de_datos

http://datamining.typepad.com/data_mining/2007/06/blogbelt.html

http://foros.emagister.com/foro-foro_de_datamining-12768.htm

http://www.asine.cl/mainproyserdatamining.html

http://www.dei.uc.edu.py/tai2001/datamining/Dataminig.htm

http://www.pti.com/espanol/Datamining.htm

2 versos sobre el tema:

guille dijo...

gracias estimado. keria comenzar con una definición sencilla de data mining para proseguir con las lecturas sobre el tema. tu post me ayudó con ese paso inicial. saludos

Ivan dijo...

GRACIAS!!!!, así da gusto.
Bien resumido y bien redactado