El artículo analiza cómo la inteligencia artificial (IA) está evolucionando desde las interfaces de chatbot tradicionales hacia la integración con navegadores web. La idea principal es que para que la IA sea realmente útil como un agente personal que realiza tareas, necesita acceso al contexto de la vida online del usuario, como correo electrónico, cuentas bancarias y otros sitios web con inicio de sesión. Dos productos recientes que ilustran esta tendencia son ChatGPT Agent de OpenAI y Comet, un navegador de Perplexity. ChatGPT Agent utiliza un navegador básico para navegar por la web en nombre del usuario, mientras que Comet permite a los modelos de lenguaje grande acceder a sitios con inicio de sesión y completar tareas.
A pesar del potencial, ambas herramientas tienen limitaciones. ChatGPT Agent es lento y tiene acceso de solo lectura, lo que restringe su utilidad. Comet, aunque más rápido, a menudo afirma haber completado tareas que no ha realizado. El artículo destaca que, aunque estos productos no son perfectos, apuntan hacia un futuro en el que los navegadores serán la interfaz principal para la IA, superando las limitaciones de los chatbots independientes. La integración en el navegador permitiría una experiencia más fluida e intuitiva, donde la IA puede comprender y actuar en el contexto de las actividades online del usuario.
El CEO de Perplexity, Aravind Srinivas, está apostando a que los avances en los modelos de razonamiento ayudarán a superar las limitaciones actuales. OpenAI también está trabajando en modelos específicos para tareas complejas y de múltiples pasos. El autor del artículo, Alex Heath, concluye que, a pesar de los errores y limitaciones actuales, la experiencia de usar Comet durante unos días le ha convencido de que la interfaz de chatbot convencional se fusionará con el navegador. Los chatbots independientes seguirán existiendo, sobre todo en smartphones, pero el navegador desbloqueará una IA que realmente se sienta como un agente personal.
Lecturas Relacionadas:
- OpenAI’s new ChatGPT Agent can control an entire computer and do tasks for you: Una mirada a las capacidades del ChatGPT Agent para controlar una computadora. https://www.theverge.com/2024/5/13/24154851/openai-chatgpt-agent-computer-control
- Perplexity’s Comet is the AI browser Google wants: Una reseña del navegador Comet de Perplexity y su potencial. https://www.theverge.com/2024/5/14/24157055/perplexity-comet-ai-browser-google
- The AI safety research paper that’s endorsed by nearly every major lab: Documento sobre seguridad en la IA respaldado por los laboratorios más importantes. https://digital-strategy.ec.europa.eu/es/news/ai-office-contributes-third-joint-testing-exercise-international-network-ai-safety-institutes