El motor de búsqueda de inteligencia artificial Perplexity está bajo escrutinio por presuntamente emplear bots sigilosos y otras estrategias para eludir las directivas de no rastreo de sitios web. Cloudflare, la empresa de seguridad y optimización de redes, reveló estas acusaciones, que, de ser ciertas, violarían las normas establecidas en Internet durante más de tres décadas.
Según un informe de Cloudflare, recibieron quejas de clientes que habían bloqueado a los bots de Perplexity a través de archivos robots.txt y firewalls de aplicaciones web. A pesar de estas medidas, Perplexity aparentemente continuó accediendo al contenido de los sitios web. La investigación de Cloudflare confirmó que, ante los bloqueos, Perplexity utilizaba un bot encubierto que empleaba diversas tácticas para enmascarar su actividad.
Este "crawler no declarado" utilizaba múltiples direcciones IP no incluidas en el rango oficial de Perplexity y las rotaba para evadir las restricciones impuestas. Además, las solicitudes provenían de diferentes ASN (Autonomous System Numbers) en un intento de eludir aún más los bloqueos. Cloudflare detectó esta actividad en decenas de miles de dominios y millones de solicitudes diarias. La compañía ha respondido eliminando a Perplexity de su lista de bots verificados y agregando reglas para bloquear este rastreo sigiloso.
La práctica de respetar las directivas de rastreo web se remonta a 1994, con la propuesta del Protocolo de Exclusión de Robots, que permitía a los sitios web indicar qué partes no debían ser indexadas por los crawlers. Otros, como el CEO de Reddit, Steve Huffman, ya habían expresado su frustración con Perplexity y otras empresas de IA por considerar que el contenido de Internet es de libre uso. Perplexity también ha enfrentado acusaciones de plagio por parte de Forbes y Wired, quienes notaron similitudes entre su contenido y artículos publicados previamente, así como patrones de tráfico sospechosos que ignoraban las exclusiones de robots.txt.
Fuente Original: https://arstechnica.com/information-technology/2025/08/ai-site-perplexity-uses-stealth-tactics-to-flout-no-crawl-edicts-cloudflare-says/
Artículos relacionados de LaRebelión:
- NotebookLM Ahora al Alcance de Usuarios Mas Jovenes Una Nueva Herramienta para el Aprendizaje
- Solucion NYT Connections Hoy Pistas Trucos y la Respuesta para el Puzzle del 4 de Agosto 785
- Mejores VPN para Mac en 2025 Navega Oculto Torrentea Privadamente y Desbloquea Netflix y Mas
- CISA Libera Thorium Plataforma Open-Source para el Analisis Forense y de Malware a Gran Escala
- Ryanair Lidera el Ranking de Multas en Espana Un Analisis de las Sanciones Mas Elevadas
Artículo generado mediante LaRebelionBOT
No hay comentarios:
Publicar un comentario