Investigadores de la Universidad de Illinois Urbana-Champaign y Google Cloud AI Research han creado ReasoningBank, un nuevo marco de memoria que permite a los agentes basados en modelos de lenguaje grandes (LLM) organizar sus experiencias y aprender de ellas. Este sistema, que destila estrategias de razonamiento generalizables de éxitos y fracasos pasados, ayuda a los agentes a tomar mejores decisiones y evitar repetir errores.
ReasoningBank supera las limitaciones de los enfoques de memoria tradicionales, que a menudo se limitan a registrar interacciones pasadas o solo almacenan ejemplos de tareas exitosas. A diferencia de estos, ReasoningBank extrae estrategias útiles y lecciones preventivas tanto de experiencias positivas como negativas. Para determinar el éxito o el fracaso, el sistema utiliza esquemas LLM-as-a-judge, eliminando la necesidad de etiquetado humano.
El funcionamiento de ReasoningBank implica un ciclo continuo. Cuando un agente se enfrenta a una nueva tarea, busca memorias relevantes en el ReasoningBank para guiar sus acciones. Estas memorias se insertan en el prompt del sistema, proporcionando contexto para la toma de decisiones. Una vez completada la tarea, el marco crea nuevos elementos de memoria a partir de los éxitos y fracasos, analizando y fusionando este conocimiento en el ReasoningBank, permitiendo que el agente evolucione y mejore constantemente.
Los investigadores también descubrieron una sinergia entre la memoria y el escalamiento en tiempo de prueba (test-time scaling), desarrollando Memory-aware Test-Time Scaling (MaTTS). MaTTS, en sus variantes paralela y secuencial, integra el escalamiento con ReasoningBank, mejorando aún más el rendimiento del agente.
Las pruebas de ReasoningBank en WebArena (navegación web) y SWE-Bench-Verified (ingeniería de software) mostraron un rendimiento superior en comparación con los agentes sin memoria y aquellos que utilizaban marcos de memoria tradicionales. Además, la combinación con MaTTS impulsó aún más el rendimiento y la eficiencia, reduciendo los costos operativos y mejorando la experiencia del usuario. Esto sugiere un camino práctico para construir agentes adaptables y de aprendizaje continuo, abriendo la puerta a una inteligencia verdaderamente compositiva en áreas como el desarrollo de software, la atención al cliente y el análisis de datos.
Fuente Original: https://venturebeat.com/ai/new-memory-framework-builds-ai-agents-that-can-handle-the-real-worlds
Artículos relacionados de LaRebelión:
- Defensa Algoritmica Guia para Navegar la IA
- Cerrando Brechas Plan de Accion para la Deteccion
- CEO Google Trabajar como en China para Competir
- NASA Nueva Promocion de Astronautas Lista para 2025
- RAG GenAI para Ingenieros en el Mundo Real
Artículo generado mediante LaRebelionBOT
No hay comentarios:
Publicar un comentario