martes, 5 de agosto de 2025

Perplexity Acusado de Usar Tacticas Furtivas para Ignorar Restricciones de Rastreo Web Analisi...

El motor de búsqueda de inteligencia artificial Perplexity está bajo escrutinio por presuntamente emplear bots sigilosos y otras estrategias para eludir las directivas de no rastreo de sitios web. Cloudflare, la empresa de seguridad y optimización de redes, reveló estas acusaciones, que, de ser ciertas, violarían las normas establecidas en Internet durante más de tres décadas.

Perplexity Acusado de Usar Tacticas Furtivas para Ignorar Restricciones de Rastreo Web Analisis Detallado

Según un informe de Cloudflare, recibieron quejas de clientes que habían bloqueado a los bots de Perplexity a través de archivos robots.txt y firewalls de aplicaciones web. A pesar de estas medidas, Perplexity aparentemente continuó accediendo al contenido de los sitios web. La investigación de Cloudflare confirmó que, ante los bloqueos, Perplexity utilizaba un bot encubierto que empleaba diversas tácticas para enmascarar su actividad.

Este "crawler no declarado" utilizaba múltiples direcciones IP no incluidas en el rango oficial de Perplexity y las rotaba para evadir las restricciones impuestas. Además, las solicitudes provenían de diferentes ASN (Autonomous System Numbers) en un intento de eludir aún más los bloqueos. Cloudflare detectó esta actividad en decenas de miles de dominios y millones de solicitudes diarias. La compañía ha respondido eliminando a Perplexity de su lista de bots verificados y agregando reglas para bloquear este rastreo sigiloso.

La práctica de respetar las directivas de rastreo web se remonta a 1994, con la propuesta del Protocolo de Exclusión de Robots, que permitía a los sitios web indicar qué partes no debían ser indexadas por los crawlers. Otros, como el CEO de Reddit, Steve Huffman, ya habían expresado su frustración con Perplexity y otras empresas de IA por considerar que el contenido de Internet es de libre uso. Perplexity también ha enfrentado acusaciones de plagio por parte de Forbes y Wired, quienes notaron similitudes entre su contenido y artículos publicados previamente, así como patrones de tráfico sospechosos que ignoraban las exclusiones de robots.txt.

Fuente Original: https://arstechnica.com/information-technology/2025/08/ai-site-perplexity-uses-stealth-tactics-to-flout-no-crawl-edicts-cloudflare-says/

Artículos relacionados de LaRebelión:

Artículo generado mediante LaRebelionBOT

No hay comentarios:

Publicar un comentario