Un informe recién publicado por la Agencia de Protección de Datos de los Países Bajos asegura que casi siempre la técnica del scrapping es ilegal. Luzia Jarovsky ha publicado este tweet en X sobre el tema.
🚨AI policy alert: The new report from the Dutch Data Protection Authority is out, and it has bad news for AI developers & entrepreneurs (automatic translation below): pic.twitter.com/bzD5NWWPvJ
— Luiza Jarovsky (@LuizaJarovsky) May 1, 2024
El estudio original está aquí . Aunque está en holandés, se puede traducir al inglés y se entiende bastante bien.
Qué es el web scraping o scrapear
Es una práctica que sirve para investigar y extraer contenido de una web. Se puede traducir al español como «raspado» aunque la mayoría de los profesionales del marketing y el desarrollo llaman a esta técnica por la palabra en inglés, scrapear.
¿Es ilegal scrapear?
Scrapear una web es una práctica que puede ser legal o ilegal dependiendo de varios factores, incluyendo las leyes del país en cuestión y los términos de servicio del sitio web específico desde el que se extraen los datos.
- En general, el web scraping no es ilegal si se respeta la privacidad y los derechos de autor, y si se cumple con las leyes de protección de datos aplicables.
- Bastantes sitios web establecen en sus términos de servicio si permiten o prohíben el scraping de sus datos. Éste puede violar estos términos, lo que podría llevar a acciones legales por parte de los propietarios de un sitio web.
- Meta y Microsoft han presentado demandas contra web scrapers, argumentando violaciones de sus términos de servicio y derechos de propiedad intelectual.
En la agencia de SEO SEOCOM , por ejemplo, usamos herramientas de scraping como Screaming Frog o Seocrawl, pero realmente no se explota comercialmente la información que se obtiene.
Empresas que han sido acusadas de hacer web scraping sin permiso
El caso más famoso de todos probablemente sea el de hiQ Labs , quienes básicamente scrapearon todo LinkedIn. Otra que siempre se suele citar ocurrió en 2009 cuando Facebook ganó un caso contra Power Ventures por hacer scraping de datos de la red social sin permiso.
Dentro de los propios sectores económicos también fue sonado el de Ryanair contra Atrápalo. Si quieres profundizar, es un caso muy interesante. Lo puedes ver en este enlace .
¿Qué dice la Unión Europea acerca del scraping?
La Unión Europea (UE) tiene regulaciones específicas que afectan la legalidad del web scraping, particularmente en lo que respecta a la protección de datos y la privacidad.
Hay dos que tienes que conocer. La primera es la Directiva sobre los derechos de autor (Directiva 2019/790) aquí se dice claramente que la minería de textos y datos está legalmente permitida en Europa cuando tiene una finalidad de investigación científica no comercial.
La otra ley importante es la GDPR que ya conocemos. Esta asegura que «Las prácticas de web scraping que involucran datos personales de ciudadanos de la UE deben cumplir con el GDPR, lo que incluye asegurar el consentimiento de los individuos «