Big data: deportes, bolsa y política

Publicado el 25 de septiembre de 2014 a las 8:45


ForecastingEl mundo del big data, la analítica predictiva, la minería de datos y aledaños es un cajón desastre en el que se pueden encontrar perfiles profesionales (y personales) de lo más variopinto (de recién llegados con aires de gurú, intrusos varios y personajes de diversa calaña ya hablaremos otro día): desde el matemático loco, obsesionado por refinar por enésima vez ese algoritmo casi desgastado de tanto usarse, hasta el informático ferviente creyente en las infinitas capacidades de la inteligencia artificial, pasando por el estadístico defensor acérrimo de un buen análisis multifactorial y el ingeniero pragmático que apuesta por ir cogiendo de aquí y allá lo que unos y otros van aportando (me incluyo, claro está, en esta última categoría).

Pero todos, al menos los que realmente llevan un rato en esto (y, por qué no decirlo, los que realmente saben algo de este mundo y no se han limitado a subirse a la ola del último buzzword de moda), comparten (o compartimos) algo en común: un bautizo en este mundo construido sobre el trinomio deportes-bolsa-política (esta última, aplica sólo en el caso yankee). Creo que no hay experto en este mundo que no haya dado sus primeros pasos desarrollando sus propios modelos para predecir los resultados del campeonato de fútbol, baloncesto o beisbol o que no haya hecho lo propio para tratar de predecir los vaivenes de los mercados financieros. Al otro lado del charco, suman a estas aficiones la política y el forecasting de elecciones es lo más parecido a un hobby para muchos (obligado citar, llegados a este punto, a Nate Silver, que construyó toda la reputación de la que hoy goza en el campo de la analítica predictiva tras conseguir desarrollar un modelo capaz de predecir el ganador de las elecciones presidenciales de Estados Unidos de 2008 en 49 de los 50 estados del país. Añadamos que antes de aventurarse en el mundo del análisis electoral Nate pasó una buena temporada desarrollando modelos para la predicción del desempeño futuro de jugadores de béisbol).

En mi caso, dediqué hace casi mil años un buen puñado de horas a desarrollar un modelo predictivo sobre los resultados de la liga de fútbol. El proceso incluyó hackear el (por esa época) legendario juego de gestión deportiva PC Fútbol para hacerme con su base de datos histórica y dedicar su buen tiempo a procesarla y corregirla (sí, tenía no pocos errores que afloraban una y otra vez al correr los modelos). El ejercicio, muy próximo ya al momento de la verdad, terminó abruptamente cuando mi odiado Windows decidió que era una buen momento para dejar de funcionar y de la noche a la mañana perdí todo mi trabajo. No, no tenía copia de seguridad y la idea de volver a comenzar de cero se me hizo una tarea titánica. Me pasé a la bolsa, pero esa es otra historia.

En definitiva, ¿buscáis un experto de verdad en esto del big data, la minería de datos y alrededores? Simplemente preguntadle cómo empezó…