Opinión experta del Bid: Cuando el big data y el aprendizaje automático fomentan el desarrollo

382
Foto referencial.

Por En octubre de 2016, el huracán Matthew tocó tierra en Haití, inundando costas, destruyendo cosechas, matando ganado, arrasando puentes y carreteras, y destruyendo cerca de 200.000 hogares. Varias organizaciones internacionales, como el Banco Interamericano de Desarrollo (BID) y el Banco Mundial, se apresuraron a proveer asistencia inmediata. Sin embargo, la recuperación a largo plazo en las regiones más afectadas del país se vio truncada en parte debido a la falta de indicadores socioeconómicos actualizados a escala subnacional que identificaran los municipios de mayor afectación y los esfuerzos de desarrollo de mayor necesidad.

Esta falta de información en Haití se debe al hecho de que el último censo nacional se había realizado hace más de una década, en 2003, y la última encuesta de hogares, en 2012. Esto se debe principalmente al gran gasto que supone la recopilación de datos. En este contexto, se contaba con poca información actualizada que detallara la pobreza y la desigualdad a escala subdepartamental, dificultando los esfuerzos de inversión social, tanto por parte del gobierno, como de los organismos internacionales.

Un problema generalizado de insuficiencia de datos

El problema no se limita solo a Haití. Los esfuerzos para adquirir datos que permitan llevar a cabo iniciativas de recuperación después de una crisis se han visto limitados en varios países en vías desarrollo, incluyendo en América Latina y el Caribe, debido a los gastos de realización de censos y encuestas de hogares (que se estiman en US$105 por hogar en América Latina y el Caribe). Esta necesidad de información, que es apremiante en nuestra región debido a los frecuentes desastres climáticos, ha crecido exponencialmente con la pandemia de COVID-19. Se necesitan datos territoriales mucho más detallados para poder asistir a los hogares vulnerables en medio de la devastación económica provocada por la pandemia.

La buena noticia es que, mediante la combinación de novedosas técnicas de big data con información obtenida de teléfonos celulares e imágenes tomadas desde aviones o satélites, es posible actualizar la información de las encuestas de hogares a un costo relativamente bajo. Además, se puede desagregar dicha información a escala municipal o submunicipal, resultando en un pantallazo detallado de la pobreza y la desigualdad de ingresos útil para la toma de decisiones por las autoridades gubernamentales y las organizaciones internacionales.

Técnicas de big data en acción en Haití

Un estudio reciente del BID sobre la pobreza y la desigualdad en Haití, donde se utilizan dichas técnicas, muestra cómo esto se puede llevar a cabo. Para el estudio, los investigadores crearon un marco computacional de aprendizaje automático en el que se combinaron los datos del censo de 2003 con los de la encuesta de hogares de 2012 (ECVMAS), permitiendo a los algoritmos encontrar patrones comunes. Este procedimiento permitió a los investigadores obtener estimaciones de pobreza y desigualdad para 2012 a nivel de comuna (el equivalente al nivel municipal). Dichas estimaciones no estaban disponibles anteriormente debido a que la encuesta ECVMAS tiene una muestra que solo es representativa a nivel departamental.

Las estimaciones resultantes se utilizaron para validar el segundo procedimiento, que consistía en combinar datos extraídos de imágenes aéreas de 2014 con datos anonimizados de teléfonos móviles de 2015 a 2017. Posteriormente, los datos extraídos de estas fuentes se introdujeron en un sistema de aprendizaje automático que encontró patrones en los datos asociados con pobreza y desigualdad, resultando en estimaciones más actualizadas. Por ejemplo, con base al tipo de techado y la calidad de la infraestructura, así como otras características, las imágenes aéreas pueden revelar cuáles son las zonas de mayor vulnerabilidad. También muestran qué partes de las áreas rurales están sufriendo a raíz de la erosión agrícola, la calidad de la vegetación y otros factores. Los registros anonimizados de llamadas, suministrados por las compañías telefónicas, complementan esa información, ya que  capturan la movilidad de los usuarios, la diversidad de sus contactos y otros factores asociados con oportunidades sociales y económicas. Todo esto pone de manifiesto los distintos niveles de riqueza. De manera similar, se realizó una segunda serie de estimaciones socioeconómicas para 2019, utilizando imágenes satelitales gratuitas de Google que permiten extraer características similares a las que se encuentran en las imágenes aéreas. Todos estos datos, introducidos en un sofisticado modelo de aprendizaje automático, permitió tener una visión actual y geográficamente detallada de lo que ocurría en Haití entre 2014 y 2019. Esto facilitó a los investigadores crear mapas dinámicos de pobreza y desigualdad de ingresos para ponerlos a disposición de los formuladores de políticas.

Figura 1: Mapa de pobreza en Haití a nivel de comuna (2019)

El esfuerzo demostró, entre otras cosas, que las comunas con mejor desempeño se encontraban en el departamento del Oeste, donde está ubicada la capital, Puerto Príncipe. Asimismo, se demostró que, en los últimos cinco años, algunas comunas del sur del país pasaron a estar entre las más empobrecidas en comparación con el resto, posiblemente debido a los efectos del huracán Matthew. Similarmente, las estimaciones mostraron que la situación de algunas de las comunas en el noroeste del país es cada vez más alarmante en comparación con el resto de las comunas. Esto último probablemente se deba a la grave situación de seguridad alimentaria registrada en esa región, provocada por choques climáticos,  disturbios sociales y otros factores que han sido documentados por el Programa Mundial de Alimentos. Se trata de información que no se hubiera reflejado en el censo de hace 17 años ni en la última encuesta de hogares de hace ocho años.  Además, al señalar dónde habitan actualmente las personas más vulnerables del país, se proporciona una base potencial para dar prioridad a los programas de transferencia monetaria y a otras intervenciones sociales. Esto representa una contribución particularmente importante dado el limitado espacio fiscal del gobierno en la actualidad.