Los agentes de inteligencia artificial, a menudo, fallan no por una falta de razonamiento del modelo subyacente, sino por la información limitada que reciben a través de las interfaces de recuperación tradicionales. Un nuevo enfoque, llamado Interacción Directa con el Corpus (DCI), propone que estos agentes interactúen directamente con los datos crudos, evitando los modelos de incrustación (embedding) y utilizando herramientas de línea de comandos estándar. Este método es particularmente útil cuando los agentes necesitan encontrar detalles precisos como números de versión, códigos de error, o rutas de archivo, donde la similitud semántica puede ser imprecisa.

Los sistemas de recuper ación clásicos, como RAG, primero procesan los documentos, los convierten en representaciones vectoriales y los indexan en una base de datos vectorial. Luego, filtran esta base de datos para encontrar los fragmentos de documentos más relevantes. Sin embargo, los agentes modernos a menudo requieren una búsqueda más dinámica y precisa. DCI permite a los agentes operar en un entorno similar a una terminal, utilizando comandos como "find", "grep", "sed" y "cat" para navegar por estructuras de directorios, localizar archivos específicos y extraer información detallada. Esto es crucial en entornos empresariales donde los datos cambian constantemente, permitiendo a los agentes razonar sobre el estado actual de la información en lugar de un índice desactualizado.
La investigación presenta dos versiones de DCI: DCI-Agent-Lite, una opción ligera basada en un modelo más pequeño, y DCI-Agent-CC, una versión de mayor rendimiento que utiliza modelos más potentes y avanzados. Ambas versiones han demostrado superar a los sistemas de recuperación tradicionales en varios puntos de referencia, mejorando la precisión y, notablemente, reduciendo los costos operativos. Aunque DCI puede tener un menor índice de recuperación general en comparación con los modelos de incrustación densa, es significativamente más eficaz una vez que localiza un documento relevante, extrayendo un valor sustancialmente mayor. Los investigadores sugieren que DCI es especialmente valioso para tareas que requieren la localización exacta de evidencia en entornos dinámicos, como la depuración de incidentes de producción, la búsqueda en grandes bases de código o el análisis de registros. Sin embargo, DCI no busca reemplazar por completo la infraestructura vectorial existente, sino complementarla. El patrón de implementación más práctico a corto plazo es un enfoque híbrido, donde la recuperación semántica se encarga de la identificación inicial de candidatos amplios, y DCI actúa como una capa de precisión y verificación para confirmar detalles exactos y combinar señales débiles entre documentos.
Fuente Original: https://venturebeat.com/orchestration/your-ai-agents-need-a-terminal-not-just-a-vector-database
Artículos relacionados de LaRebelión:
- Microsoft Abre Codigo Protege tus Agentes IA con RAMPART
- Dependencia Cloud Europa Riesgo Politico No Solo Tecnico
- UE Restringe Nube Adios a Datos Sensibles en EEUU
- Agentes IA Ya Estan Dentro Descubrelo
- Agentes IA Nueva Amenaza Oculta en Codigo Abierto
Artículo generado mediante LaRebelionBOT
No hay comentarios:
Publicar un comentario