Extracción automática de datos desde sitios web – Web Scraping
En Internet existen sitios web que poseen información de consulta que es importante para nuestros intereses como por ejemplo información financiera que se actualiza constantemente, datos de precios de la competencia, información técnica, noticias, etc.
Algunas páginas web poseen maneras fáciles de extraer y capturar esta información (webservices, descarga de planillas tipo Excel, etc.), pero la gran mayoría no dispone de estas herramientas de extracción de datos. Por lo tanto debemos extraer estos datos de manera manual lo que requiere de una gran cantidad de tiempo y recursos en una tarea repetitiva y muchas veces tediosa.
LookData.cl posee las herramientas necesarias para extraer, capturar y almacenar estos datos y información de sitios dinámicos de forma automática y ajustada a sus necesidades específicas de extracción, utilizando técnicas de captura por web scraping.
Software de extracción de datos desde páginas web (Arañas o Bots que navegan la web)
Creamos según sus necesidades de extracción de datos, software automatizado que navega el sitio web solicitado. A este tipo de software se le conoce como arañas o bots (web crawlers).
Las ventajas de las arañas es que pueden navegar un sitio web las 24 horas del día y detectar cambios en el mismo, los que luego le pueden ser reportados a Ud. de distintas maneras (ver Integración con Datos Web Scraping).
Con esto se olvida de tener que aplicar copy-paste sobre datos sitios web para poder obtener información de ellos, con lo cual libera a su fuerza de trabajo de esta tarea repetitiva y tediosa.
Alternativas de ejecución de las Arañas
Una vez que las arañas han sido desarrolladas hay dos alternativas de ejecución:
Cliente Araña se ejecuta en PC del Cliente |
Hosteada Araña se ejecuta en nuestros servidores |
|
---|---|---|
Monitoreo en tiempo real | – | ![]() |
Actualizar código Arañas | Gratis primeros 3 meses | Gratis |
Múltiples Arañas | – | ![]() |
Pedir Cotización | Pedir Cotización | |
Precio
El precio de la aplicación que extraerá los datos de la web mediante web scraping, variará según los siguientes conceptos:
- Complejidad del Sitio Web
- Cantidad de registros a extraer
- Número total de páginas a revisar