Preguntas Frecuentes Extracción Datos Web

¿Que es Web Scraping?

Web Scraping es una técnica que permite extraer datos de la web (del contenido HTML generado por un sitio web). El web scraping es realizado por un software (araña o bot) que va navegando el sitio web requerido de forma automática, y va extrayendo la información buscada. Esta información luego es estructurada según la necesidad del cliente y es almacenada por la araña ya sea en una base de datos, texto plano, Excel, etc..
Es posible realizar web scraping sobre cualquier sitio web cuyo despliegue de información sea realizado en HTML.

¿Es posible automatizar el llenado de formularios por las arañas?

Si, la posibilidades de navegación de las arañas o bots es amplio. Por ejemplo la araña podría extraer información de una base de datos para luego rellenar formularios web automáticamente. De esta manera se elimina este trabajo tedioso para aprovechar esa capacidad en tareas que aporten mayor valor a la empresa. Junto con lo anterior la araña no se equivoca al rellenar los datos y lo hace en el horario exacto en que se necesita.

¿Pueden sus arañas automatizar la descarga de reportes diarios de portales B2B?

Las arañas también se pueden utilizar para ingresar a sitios web con user y password y extraer reportes desde sitios B2B. Luego esa información el bot la puede abrir y transformar en el formato deseado por el cliente para luego subir la información a por ejemplo un sistema de Business Inteligence todo de forma automática! Nuestras arañas pueden descargar reportes tanto de sitios construidos en HTML como en sitios con formato Flash.

¿Pueden sus arañas identificar y monitorear cambios en sitios web?

Nuestras arañas no solo rescatan datos desde la web, sino que también pueden monitorear cambios y alertarlas por ejemplo vía email. Esto es de mucha utilidad para monitorear a la competencia o redes sociales. Pueden además reconocer tanto el texto del HTML como también monitorear cambios sobre textos que se encuentran en formato de imagen (OCR).