¿Cómo monitorear el precio de los alimentos mediante Web Scraping?

Si te estás preguntando cómo monitorear el precio de los alimentos mediante Web Scraping, nos gustaría comentar que esta es una de las labores de mayor relevancia que realizamos como Socios Tecnológicos dentro del ámbito humanitario, debido al alto impacto que genera en el presupuesto familiar el incremento del precio de los alimentos que conforman la canasta básica alimentaria.

Por ejemplo, para la recopilación de precios de alimentos que realizamos en Guatemala, Honduras y Nicaragua hemos usado el siguiente procedimiento y así es como podrías hacerlo tú:

1. Búsqueda de información

Para obtener la información más precisa y detallada de las actualizaciones y cambios en los precios de alimentos de Centroamérica,  recurrimos a dos grandes portales de datos:

  • Sistema de Información de Mercados de Productos Agrícolas de Honduras (SIMPAH)
  • Base de datos global de Precios de Alimentos de Humanitarian Data Exchange (HDX)

Los reportes de SIMPAH se publican semanalmente y desaparecen al publicar nuevos precios. Por ello, las labores de extracción y salvaguarda de los datos es de suma importancia, para monitorear, generando un histórico y detectando cambios abruptos de los precios, lo cual se define como una anomalía.

La Base de datos global de Precios de Alimentos, a pesar de carecer de actualizaciones semanales como los reportes de SIMPAH, permite dar una mirada al pasado y evaluar los precios de los alimentos hace varios meses o incluso un año atrás. Esto puede ser útil para evaluar los cambios que ha experimentado un determinado alimento en el tiempo y anticiparnos a posibles crisis alimentarias.

Pero ¿Cómo monitorear el precio de los alimentos de cualquier país con Web Scraping? A continuación lo explicamos.

2. Extracción de información (Web Scrapping)

 El Web Scraping, o «Scrapeo Web»,  es una técnica de recolección de datos que permite extraer información de sitios web de manera automatizada y puede ser utilizado para diferentes fines, de manera manual o automática.

Antes de comenzar a hacer Web Scraping, es importante tener en cuenta las políticas de privacidad y de uso de los sitios web que se van a acceder, ya que algunos pueden prohibir o limitar este tipo de actividad si se detecta un uso indebido.

A través de un extenso script de Python realizamos el proceso de extracción de información de las 2 fuentes comentadas anteriormente y se realizan descargas de los reportes semanales de los precios de los alimentos en formato PDF. Luego, usamos técnicas Web Scraping combinadas con minería de texto para extraer los precios de cada documento.

Imagen de un script de Python que sirve para monitorear el precio de los alimentos mediante Web Scrapping

3. Procesamiento de la información y respaldo en bases de datos tras el Web Scraping

Los datos que han sido extraídos a partir de las técnicas de Web scraping y minería de texto, se organizan en tablas para ser almacenados en una base de datos relacional y se actualizan de forma periódica, lo que garantiza la representatividad en el tiempo de los datos desde un punto de vista estadístico.

En la actualidad, no existe otra base de datos en abierto que se actualice diariamente con los precios de los alimentos para Guatemala, Honduras y Nicaragua.

4. Representación gráfica

Tras este proceso, los precios de los alimentos de los 4 países pertenecientes al Corredor Seco Centroamericano, así como sus fluctuaciones, se vuelcan de manera constante a la plataforma PREDISAN de monitoreo de la Seguridad Alimentaria y Nutricional en Centroamérica, que hemos desarrollado junto a Acción Contra El Hambre para permitir ayudar a ONG’s y entidades gubernamentales a la toma de decisiones y a la detección temprana de amenazas que puedan afectar al poder adquisitivo de los consumidores.

Estas fluctuaciones de precios se muestran en el apartado «Amenazas» e influyen en las predicciones SAN que se muestran en el apartado «Predicciones».

Imagen de gráficos en Power BI que refleja el monitoreo del precio de los alimentos obtenido mediante técnicas de Web Scrapping
Comparte en:

¿Tienes dudas sobre el Web Scraping del precio de los alimentos?

error: Content is protected !!