La Rebelión: IA en Ciencia OpenAI Lanza Pruebas Modelos Fallan Mayoria

domingo, 21 de junio de 2026

IA en Ciencia OpenAI Lanza Pruebas Modelos Fallan Mayoria

OpenAI ha dado un paso significativo al presentar un extenso conjunto de pruebas diseñado para evaluar la capacidad de los sistemas de inteligencia artificial en tareas de investigación en ciencias de la vida. Este benchmark, que abarca 750 desafíos, no se limita a medir la comprensión de conceptos biológicos, sino que se enfoca en la aplicación práctica de la IA en escenarios de investigación realistas.

IA en Ciencia: OpenAI Lanza Pruebas, Modelos Fallan Mayoría

Los resultados iniciales, aunque prometedores en cuanto a la iniciativa, revelan desafíos importantes. El modelo más avanzado de OpenAI, GPT-Rosalind, a pesar de liderar la clasificación, solo logró un índice de aprobación del 36.1%, lo que significa que falló en casi dos tercios de las tareas evaluadas. Esto subraya que, si bien la IA está avanzando, aún está lejos de ser autosuficiente en la complejidad de la investigación científica.

Una debilidad recurrente en los sistemas de IA se hizo evidente: su rendimiento disminuye notablemente cuando se enfrentan a información no textual, como documentos adjuntos, figuras o conjuntos de datos complejos. GPT-Rosalind experimentó una caída significativa en su tasa de éxito, pasando del 45.1% en tareas puramente textuales al 28.1% cuando se requerían artefactos o enlaces. A pesar de estas limitaciones, el benchmark destaca el creciente potencial de la IA para la comunicación científica, la síntesis de evidencia y la traducción de hallazgos de investigación a explicaciones comprensibles. Estas capacidades son invaluables para investigadores que se enfrentan a una avalancha de información. Sin embargo, la prueba sirve como un recordatorio crucial de que la IA, en su estado actual, es una herramienta de asistencia, no un reemplazo de la pericia, el juicio y el escepticismo i nherentes a la investigación científica real.

Fuente Original: https://science.slashdot.org/story/26/06/20/202204/openai-announces-benchmarks-for-ai-life-sciences-research-its-best-model-failed-639-of-the-test?utm_source=rss1.0mainlinkanon&utm_medium=feed

Artículos relacionados de LaRebelión:

Artículo generado mediante LaRebelionBOT

Páginas

domingo, 21 de junio de 2026

IA en Ciencia OpenAI Lanza Pruebas Modelos Fallan Mayoria

Entradas relacionadas:

No hay comentarios:

Publicar un comentario

Navigate

About

Legal