Categoria:

OpenAI afirma que su nuevo modelo alcanzó nivel humano en una prueba de “inteligencia general”. ¿Qué significa eso?

Autor: Lucas Handley

Un nuevo modelo de inteligencia artificial (IA) acaba de alcanzar resultados de nivel humano en una prueba diseñada para medir la “inteligencia general”. 

El 20 de diciembre el sistema o3 de OpenAI alcanzó un puntaje de 85% en la prueba ARC-AGI, bien por encima del mejor puntaje anterior de la IA, de 55%, y a la par del puntaje promedio humano. También obtuvo muy buen puntaje en una prueba muy difícil de matemáticas. 

Crear inteligencia artificial general o AGI es el objetivo de todos los grandes laboratorios de investigación de IA. A primera vista parece que OpenAI tal vez haya al menos dado un gran paso hacia este objetivo..

Si bien todavía hay escepticismo, muchos investigadores y desarrolladores de IA sienten que algo acaba de cambiar. Para muchos, la idea de la AGI ahora se ve más real, urgente, y cercana de lo que se anticipaba. ¿Será así? 

Generalización e inteligencia

Para entender lo que significa el resultado del sistema o3 hay que entender de qué va la prueba ARC-AGI. En términos técnicos la prueba es de “eficiencia de muestra” de un sistema de IA para adaptarse a algo nuevo, como cuántos ejemplos de una situación nueva necesita ver el sistema para calcular cómo funciona.

Un sistema de IA como ChatGPT (GPT-4) no es muy eficiente con las muestras. Se lo “entrenó” con millones de ejemplos de textos humanos, construyendo “reglas” de probabilidad para las combinaciones de palabras más probables. 

El resultado en tareas comunes es bastante bueno. En tareas que no son comunes es malo porque tiene menos datos (menos muestras) de esas tareas. Hasta que los sistemas de IA puedan aprender de pocos ejemplos y adaptarse con mayor eficiencia, solo se podrán usar para tareas muy repetitivas en las que sea tolerable el fracaso ocasional. 

La capacidad para resolver con precisión problemas desconocidos o nuevos a partir de limitadas muestras de datos es lo que se conoce como capacidad para generalizar. Se considera un elemento de inteligencia necesario, e incluso fundamental. 

Grillas y patrones

Las pruebas ARC-AGI para la adaptación eficiente utilizan problemas de grillas como el que se ve debajo. La IA tiene que calcular el patrón que convierte la grilla de la izquierda en la grilla de la derecha.
Diseño Sin Título (4)

Este artículo ha sido traducido de Gizmodo US por Lucas Handley. Aquí podrás encontrar la versión original.

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Te puede interesar también

¿Quieres hablar con nosotros en cabina?

Nuestros Horarios en el Estudio:

9am a 11am | 12m a 1pm | 4 a 5 pm | 5 a 6pm

horario del pacifico