o1 de OpenAI es una inteligencia artificial capaz de razonar al nivel de estudiantes de doctorado

Autor: Pascale Davies

OpenAI ha lanzado una nueva serie de modelos que, según afirma, “pueden resolver problemas más difíciles” que sus anteriores modelos de inteligencia artificial generativa (GenAI).

La empresa californiana anunció el jueves el lanzamiento de una versión preliminar de esta serie, denominada oficialmente ‘o1-preview’ y ‘o1-mini’. El nombre en clave del modelo es ‘Strawberry’.

OpenAI afirma que, en sus pruebas, los nuevos modelos obtuvieron resultados similares a los de estudiantes de doctorado en tareas exigentes de física, química y biología, y obtuvieron buenos resultados en matemáticas y codificación.

La empresa detrás de ChatGPT explicó que probó el modelo en un examen clasificatorio para la Olimpiada Matemática Internacional (IMO), una competición matemática de secundaria.

Tuvo diez horas para resolver seis problemas algorítmicos difíciles y se le permitieron 50 envíos por problema. El modelo ‘o1’ resolvió el 83% de los problemas, mientras que GPT-4o sólo resolvió el 13%, según OpenAI.

¿Cuáles son los inconvenientes?

La empresa señala que no dispone de todas las funciones principales de ChatGPT, como la navegación por Internet en busca de información y la carga de archivos e imágenes. Tampoco tiene funciones de análisis de imágenes, que se han desactivado a la espera de pruebas adicionales.

Otro inconveniente es que es muy caro. El nuevo modelo cuesta unas tres veces más que el GPT-4o para la entrada y cuatro veces más caro para la salida. El ‘o1-preview’ cuesta 15 dólares (13,50 euros) por 1 millón de tokens de entrada y 60 dólares (54 euros) por 1 millón de tokens de salida. Los tokens son datos en bruto y 1 millón de tokens equivale a unas 750.000 palabras.

Por el momento no es gratuito para los usuarios, pero la empresa afirma que está planeando ofrecer ‘o1-mini’ a todos los usuarios gratuitos de ChatGPT. OpenAI también dijo en un documento técnico que los comentarios de los probadores fueron que o1 tiende a alucinar (inventar cosas) más que GPT-4o. Tampoco admite tanto no tener respuesta a una pregunta.

El cofundador y consejero delegado de OpenAI, Sam Altman, dijo en un post en X que “o1 sigue teniendo fallos, sigue siendo limitado y sigue pareciendo más impresionante en el primer uso que después de pasar más tiempo con él”.

o1 usa una cadena de pensamiento similar a los humanos

OpenAI afirmó que el modelo funciona “de forma similar a como un humano puede pensar durante mucho tiempo antes de responder a una pregunta difícil”, y añadió que “o1 utiliza una cadena de pensamiento cuando intenta resolver un problema“.

OpenAI no mostró exactamente cómo funcionaba este razonamiento de “cadena de pensamiento”, en parte debido a la ventaja competitiva. Pero sí mostró “resúmenes generados por modelos” de las cadenas de pensamiento.

Colaboración con Gobiernos, no europeos

OpenAI afirmó que, para avanzar en su compromiso con la seguridad de la IA, había formalizado recientemente acuerdos con los Institutos de Seguridad de la IA de EE.UU. y Reino Unido, que incluían la concesión a dichos institutos de acceso anticipado al modelo antes de su publicación.

OpenAI no mencionó la colaboración con los Gobiernos europeos.

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Relacionadas
Te puede interesar también

¿Quieres hablar con nosotros en cabina?

Nuestros Horarios en el Estudio:

9am a 11am | 12m a 1pm | 4 a 5 pm | 5 a 6pm

horario del pacifico