22/07/2016

Data mining: información valiosa para tomar decisiones inteligentes

Data mining: información valiosa para tomar decisiones inteligentes

Se dice que el cerebro humano es el mejor dispositivo de almacenamiento de datos jamás creado. Sin embargo, desde la prehistoria el hombre ha buscado distintos medios externos para guardar datos de manera persistente y poder acceder a ellos sin el esfuerzo que implica la memorización. Un ejemplo temprano son las pinturas realizadas en cavernas hace más de 35.000 años, que les permitían a los hombres de la época compartir sus recuerdos con otras personas. Con el tiempo, los medios para almacenar datos fueron evolucionando y permitiendo el registro de volúmenes de datos cada vez mayores. La información fue ganando importancia como factor para la toma de decisiones en los más diversos ámbitos; por ejemplo, ya en el año 4000 a.C. los babilonios realizaban censos con el fin de saber qué cantidad de comida necesitaban para alimentar a la población, y registraban los datos en tablas de arcilla. Muchos años después aparecieron métodos matemáticos para identificar patrones en grandes conjuntos de datos, lo que permite conocer a fondo la situación actual y estimar fenómenos futuros. Algunos ejemplos son el teorema de Bayes (1763) y el análisis de regresión (1805). Desde el nacimiento de la computación digital en el siglo XX, los medios de almacenamiento de datos vienen expandiendo su capacidad a un ritmo inédito, y las herramientas para guardar y procesar tales datos son cada vez más eficientes.

dm

Algunos de los servidores de Facebook en su data center de Pineville, Orlando. La empresa de Mark Zuckerberg utiliza data mining para presentar resultados de búsqueda relevantes, mostrar anuncios personalizados y otras aplicaciones que son objeto de controversia. Fuente: TechCrunch.

De este desarrollo de los medios para almacenar y procesar información surge el data mining (minería de datos), un proceso que consiste en explorar grandes volúmenes de datos desde diferentes perspectivas para identificar patrones y tendencias significativos. El resultado de este proceso es información valiosa que nos ayuda a tomar mejores decisiones en un ámbito particular. Los límites de cada término son difusos, pero en general se considera que, si el big data se encarga de almacenar grandes volúmenes de datos, el data mining se encarga de analizarlos. Generalmente, los tipos de análisis involucrados se clasifican de la siguiente forma:

  • Análisis descriptivo. Describir lo que está sucediendo.
  • Análisis predictivo. Predecir lo que sucederá.
  • Análisis prescriptivo. Determinar qué hacer con base en los datos recogidos.

Muchos limitan la definición de data mining a la extracción de datos, sin incluir el análisis y la obtención de conclusiones a partir de los mismos. Desde este punto de vista, la minería de datos es apenas una de las etapas que componen un proceso mayor: el Knowledge Discovery in Databases (KDD), cuyo objetivo es, justamente, convertir una gran cantidad de datos en conocimiento. Sin embargo, la gran mayoría de los referentes de la industria (incluyendo a Oracle e IBM) utilizan ambos términos como sinónimos.

El poder estadístico y predictivo del data mining puede ayudarnos a detectar áreas a mejorar y oportunidades a explotar en prácticamente cualquier disciplina donde se almacenen datos históricos. Las actuales aplicaciones del data mining son diversas:

  • Marketing. Una posibilidad es usar los datos de comportamiento de un usuario en nuestra tienda online para ofrecerle la mejor experiencia posible. Por ejemplo, podemos estimar sus áreas de interés a partir de los últimos productos que compró, y acercarle determinadas ofertas en consecuencia. Además, estos datos nos permiten segmentar a los consumidores en distintos perfiles por sus características comportamentales en común. Otra aplicación, útil por igual para tiendas físicas y tiendas online, es utilizar datos históricos relativos a las ventas y el stock en los depósitos para conocer la cantidad de unidades que nos convendría producir.
  • Finanzas. El data mining puede utilizarse para identificar patrones de uso sospechosos en tarjetas de crédito y así evitar o detectar posibles fraudes.
  • Ciencia. El biological data mining es toda una disciplina en sí misma. En campos como la genómica y la proteómica se realizan análisis comparativos de enormes datasets con información genética para generar hipótesis específicas.
  • Criminología. Existen algoritmos que, a partir de los patrones encontrados en registros policiales históricos, pueden ayudar a resolver casos criminales e incluso a evitar crímenes futuros.

Estas son apenas algunas de las aplicaciones de una disciplina que también encuentra utilidad en la medicina, el transporte, la protección del medio ambiente, las telecomunicaciones y la vigilancia, entre muchas otras áreas. Es de esperar que, con la rápida evolución actual de los sistemas de almacenamiento y procesamiento de datos, el data mining ocupe cada vez más espacio en nuestras vidas.

0

angularjs Aplicaciones en Facebook aplicaciones mobile behavioral targeting Botones Call-to-action breadcrumbs breadcrumbs web búsqueda de personal búsqueda facetada Call-to-action buttons Client-side cliente-destacado cms a medida coding comercio electrónico content marketing CSS3 PIE cuanto debe pesar un sitio data-driven web design Datos estructurados Defacement Denegación de servicio Desarrollar una aplicación web desventajas de PhoneGap diseñar newsletters diseño web diseño web argentina diseño web esqueuomórfico Diseño web responsive Diseño web responsivo diseño web santa fe diseño web Smart TV diseño web televisores DOM desde PHP enlaces rotos filtros de búsqueda flash flat web design formularios sitio web fragmentos enriquecidos función de autocompletar futuro de la realidad aumentada html HTML5 html5shiv inbound marketing Initializr interfaces Web para televisores javascript jobs jQuery Mobile Mapbox maquetado html/css maquetador web masonry layout menú de navegación menú desplegable Metodologías ágiles Modernizr MVC Navegación por teclado oferta laboral OpenStreetMap paginas de Facebook Paper js Paper js framework personas Phishing plan de QA Polyfills polymer portfolio-destacados portfolio-inicio programacion de CMS Programadores WordPress página de contacto página de error 404 que es Backbone.js Realidad aumentada Resultados instantáneos server-side skeuomorphic design sliders y usabilidad soporte Internet Explorer Storytelling Underscores usabilidad usabilidad buscadores user-centered design ux velocidad de carga web Vendor prefixes ventajas jQuery Mobile Ventanas integradas versiones antiguas de Internet Explorer WAI-ARIA web components web imprimible Web Semántica WordPress para ecommerce