martes, 31 de mayo de 2016

El Big Data y la pregunta del billón

El pasado jueves 26 de mayo de 2016, asistí al evento organizado por la oficina para Latinoamérica de la Escuela de Negocios de Sloan del Massachusetts Institute of Technology en el hotel JW Marriot cuyo tema fue “Big Data: Shaping the Future of Latin America“.

El evento fue un gran éxito y tuvo una gran acogida con una asistencia superior a la esperada. Quiero agradecer a Diego Maldonado, Presidente de Avanxo, quien me permitió asistir al seminario a pesar de no haber confirmado mi asistencia con suficiente antelación.

En la reunión brilló con luz propia el venezolano Roberto Rigobón, Profesor de la Escuela de Negocios del MIT, quien además de ser el conferencista principal fue el Maestro de Ceremonias del evento logrando el cumplimiento del horario de manera estricta y muy entretenida, algo extraño en este tipo de seminarios.


La presentación del Profesor Rigobón se llamó “Big Data in Economic Measurement” y se dividió en tres temas interesantes como lo son la medición de: la inflación, la tasa de cambio real y la actividad productiva.

El tema de la medición de la inflación utilizando Big Data no me era desconocido. En 2011 tuve la oportunidad de hablar con Alberto Cavallo sobre su tesis de grado presentado al Departamento de Economía de la Universidad de Harvard. Este trabajo surgió por la desconfianza que le generaban las cifras oficiales de inflación del gobierno argentino de ese momento. Básicamente Cavallo buscaba alternativas tecnológicas para calcular el aumento de los precios en Argentina. Con la presentación en el Seminario de Big Data me sorprendió muy gratamente el favorable avance que han logrado Cavallo y  Rigobón en el Billion Prices Project (BPP).[1]

La base de datos de este proyecto se construye utilizando información diaria recogida de los principales negocios que comercian a través de internet. Capturar la información cada 24 horas permite producir un índice de precios para realizar mediciones de inflación en tiempo real. Los primeros hallazgos sirvieron para cuantificar la manipulación de la medición de la inflación en Argentina por parte del Instituto Nacional de Estadisticas y Censos de Argentina en la época de Cristina Fernández de Kirchner, confirmando las sospechas planteadas en la tesis de grado de Alberto Cavallo, el hijo menor de mi amigo Doming Cavallo.[2]

Hoy en día el BPP publica información diaria sobre el IPC de los Estados Unidos que se actualiza cada mes y se comparan con las cifras oficiales del gobierno americano. Adicionalmente, el proyecto recoge información en varios países que se utiliza para la investigación económica. En la  siguiente ilustración se puede ver el alcance geográfico del proyecto.


Si bien, en principio, el BPP fue concebido como un proyecto académico, se han desarrollado varias aplicaciones prácticas. Un hijito del proyecto es PriceStats que produce información diaria sobre precios en 22 países que permite una mejor toma de decisiones a los interesados en la política monetaria y  contar con información actualizada para las empresas y los inversionistas en los mercados de capitales.

Las agencias gubernamentales encargadas de recolectar la información de precios, han encontrado interesante la metodología pues en principio puede ayudarles a reducir costos y a disminuir las demoras entre la recolección y la publicación de los datos sobre el costo de vida.
Para el académico poder contar con Big Data para estudiar el comportamiento de los precios es invaluable. Este proyecto permite el acceso de los microdatos a los investigadores interesados en el tema. Para poder tener acceso a los microdatos es necesario cumplir con unas condiciones que buscan preservar la confidencialidad de las fuentes y evitar la utilización de la información para fines comerciales.

El segundo punto tratado en la conferencia del Profesor Rigobón fue  el de la medición de la tasa de cambio real. Este proyecto ha sido llamado el de Miles de Índices Big Mac. (TBIP por sus siglas en ingles) Thousand Big Mac’s Index Project: Alternative measures of the Real Exchange Rate.

La revista The Economist ha encontrado que la relación entre el precio del Big Mac medido en dólares en un país y el precio en Estados Unidos es un buen indicador de la tasa de cambio real de dicho país. El proyecto de los profesores del MIT consiste en tomar cientos de artículos y hacer el ejercicio de calcular cientos de índices estilo Big Mac. Una vez calculados los índices individuales se procede a determinar índices para sectores específicos y luego para el agregado de los sectores.

En esencia este ejercicio es muy similar al que utilice en una  entrada de mi Blog publicada el 28 de septiembre de 2014 titulada La tasa de cambio real a la carta. En la entrada calculo dos índices adicionales al desarrollado por The Economist, el primero para uno de mis sándwich preferidos de Subway, el BMT italiano, y el otro para un latte pequeño de Starbucks.

A diferencia de la alta tecnología utilizada en TBPI, mi investigación se realizó mediante visitas a las tiendas Starbucks, Subway y McDonalds de mi vecindario y a los datos tomados por mi hija mayor en San José, California.

Los resultados del TBPI se pueden utilizar para predecir situaciones de desequilibrio en el mercado cambiario que probablemente llevarían a ajustes importantes en el precio de una divisa.

El tercer tema de la presentación del ilustre profesor venezolano fue el de la medición del PIB utilizando Big Data. Este es un proyecto que está en sus inicios y es mucho más complejo. En primer lugar, porque a diferencia a la información de precios, la información sobre la producción no es tan abundante. En segundo lugar, la información sobre cantidades producidas o cantidades vendidas suele tener carácter confidencial y no tiene una frecuencia diaria. Además, mucha de la producción se da en establecimientos pequeños que no cuentan con sistemas de información en línea.

Rigobón termina su exposición diciendo que la medición del PIB se está enfrentando a problemas importantes, pues muchos de los productos digitales son gratis, como por ejemplo las consultas a Wikipedia o el uso de las redes sociales. Estas añaden valor pero como su precio es cero no están contribuyendo al incremento del PIB.

Los proyectos originados en el MIT relacionados con el uso del Big Data han tenido un impacto importante en la medición económica. Poco a poco y a medida en que pase el tiempo entrarán a formar parte del trabajo rutinario de las agencias estadísticas nacionales. En un futuro próximo los colombianos ya no nos preguntaremos ¿En dónde merca el DANE? sino que haremos la pregunta del Billón: ¿Dónde mercan Cavallo y Rigobón?




[1] La American Economic Association ha publicado recientemente un artículo de Cavallo y Rigobón The Billion Prices Project: Using Online Prices for Measurement and Research que describe el proyecto http://pubs.aeaweb.org/doi/pdfplus/10.1257/jep.30.2.151
[2] En la entrada del Blog http://alvaropachon.blogspot.com.co/2014/09/camino-la-estabilidad.html se presentaron algunos resultados publicados en la página la inflación verdadera. 

3 comentarios:

  1. Alvaro super interesante! Cómo meterle el diente a esto para Colombia con información digital con y sin Internet

    ResponderEliminar
    Respuestas
    1. Rafael, muchas gracias por la lectura y el comentario. Para escribir la entrada estuve mirando algunos documentos que pueden ser útiles para quien quiera entender mejor la metodología. se puede comenzar con el suigiente artículo en Wikipedia sobre el Data Scraping. https://en.wikipedia.org/wiki/Data_scraping.
      En una presentación Alberto Cavallo explica la metodología: http://www.mit.edu/~afc/papers/Cavallo-BPPData-NBER2015.pdf
      Ojalá el Dane explore el uso de Big Data para la recolección de información pues podría ser muy interesante su aplicación en Colombia.

      Eliminar
  2. MY dear Alvaro: As usually this blog y your`s is very important for me and I have to read it twice or triple... In our country we dont have reliable info. about PIB, IPC, and I wonder what is the real value of our Col$ ?? Thanks a lot

    ResponderEliminar