Desde el inicio de la revolución que ha supuesto al inteligencia artificial generativa se ha hablado mucho de dónde se pondrían sus límites éticos y morales. Pero, ¿y si esos límites se los pusiera ella misma? Aunque suene a premisa de película de ciencia-ficcón, OpenAI apuesta por esta vía.
OpenAI, pionera en el desarrollo de modelos avanzados de inteligencia artificial, ha presentado durante doce días, a modo de calendario de adviento, varias novedades. La última es su nuevo modelo o3, continuador del actual o1, aunque han tenido que saltarse la denominación o2 para evitar problemas de marca con la empresa de telefonía de origen británico.
¿Qué hace único a este avance? Un enfoque nuevo llamado deliberative alignment (alineación deliberativa), que promete no solo una mayor seguridad en sus respuestas, sino un razonamiento más sofisticado.
Pero este planteamiento no está exento de críticas. ¿Es posible entrenar un modelo para deliberar sobre principios humanos sin caer en la censura o los sesgos? ¿Será peligroso a medio o largo plazo?
El ascenso de los modelos de razonamiento en la IA que se dan prompts a sí mismos
Los modelos de razonamiento de OpenAI, desde el o1 hasta el o3, representan un avance significativo en la forma en que las máquinas procesan la información. Estos modelos no solo predicen palabras o generan texto; imitan una cadena de pensamiento. Este método, conocido como “chain-of-thought”, permite descomponer problemas complejos en pasos más manejables.
El modelo o3, en particular, destaca por su capacidad para re-promptarse, es decir, autoformularse preguntas durante el proceso de inferencia. Este comportamiento imita la deliberación humana y resulta especialmente útil en tareas que requieren matices éticos o contextuales.
Deliberative alignment: un nuevo paradigma para la seguridad en IA
El concepto de deliberative alignment introduce un enfoque innovador: entrenar a los modelos de IA para consultar de forma activa una política de seguridad durante el proceso de inferencia. En lugar de simplemente aplicar filtros predefinidos, el modelo “piensa” en cómo responder de manera segura.
Por ejemplo, si se le solicita crear un documento falso, el modelo cita las directrices de OpenAI y rechaza la solicitud. Esta capacidad de evaluar y actuar basándose en políticas preestablecidas marca un hito en el diseño de sistemas de IA responsables.
Los desafíos éticos y técnicos del alineamiento en IA
Sin embargo, este enfoque plantea preguntas importantes. ¿Hasta qué punto serán objetivas las políticas de seguridad? ¿Cómo evitar que estas restricciones se perciban como censura? Críticos como Elon Musk han señalado que los intentos de controlar la IA pueden derivar en limitaciones innecesarias.
Además, implementar deliberative alignment no será fácil. Por ahora no está abierto al público y durante la fase de desarrollo, OpenAI se enfrentó a problemas de latencia debido al proceso intensivo de deliberación interna del modelo. Para resolverlo, la compañía utilizó datos sintéticos en lugar de humanos para entrenar a los modelos, mejorando la eficiencia sin comprometer la calidad.
El futuro de la alineación ética en modelos de IA
Con la próxima salida al mercado del modelo o3 en 2025, queda por ver cómo se traducen estos avances en aplicaciones reales. OpenAI ha posicionado deliberative alignment como un enfoque escalable para abordar problemas complejos de seguridad y ética en la inteligencia artificial.
En un mundo donde las IAs tendrán cada vez más autonomía, estas medidas podrían ser la clave para evitar usos indebidos y mantener la confianza del público. Sin embargo, la verdadera prueba será si estas tecnologías pueden equilibrar seguridad y funcionalidad sin sacrificar la creatividad y la libertad de los usuarios.
Los 12 días de anuncios de OpenAI: estos han sido sus lanzamientos
El o3 ha sido el colofón a un periodo en el que, durante 12 días, OpenAI ha ido sorprendiendo con una serie de anuncios de distinto calado. A continuación, te contamos todas las novedades.
Día 1: el modelo o1 y ChatGPT Pro
OpenAI lanzó el modelo o1 revisado, diseñado para suscriptores de ChatGPT Plus y Team. Este modelo mejora en un 34% la precisión y velocidad en preguntas complejas, incluyendo la capacidad de analizar imágenes y ofrecer explicaciones detalladas. Además, se presentó la suscripción ChatGPT Pro, destinada a profesionales, con acceso exclusivo a potencia computacional superior.
Día 2: reforzamiento por aprendizaje iterativo
La compañía introdujo una técnica de aprendizaje llamada Reinforcement Fine-Tuning, que permite perfeccionar las capacidades de razonamiento de los modelos mediante iteraciones continuas. Esto resulta en respuestas más precisas y adaptadas a tareas específicas.
Día 3: el debut de Sora, transformando texto a vídeo
OpenAI presentó Sora, un modelo que transforma descripciones de texto en vídeos. Aunque esta tecnología promete revolucionar la generación de contenido, no estará disponible en España en el corto plazo.
Día 4: expansión de Canvas a todos los usuarios
La herramienta Canvas, diseñada para proyectos de escritura y programación, ahora está disponible para todos los usuarios de ChatGPT. Ofrece una experiencia colaborativa, integración con Python y un robusto sistema de seguimiento de cambios.
Día 5: integración con Apple Intelligence
La IA de OpenAI se une a los ecosistemas iOS, iPadOS y macOS, permitiendo análisis directo de imágenes y documentos desde dispositivos Apple. Esta integración garantiza una experiencia fluida y pone un énfasis especial en la privacidad del usuario.
Día 6: llamadas de voz y videollamadas avanzadas
Lanzó la función de videollamadas con soporte de pantalla compartida para suscriptores Plus y Pro. También se incorporó una voz temática de Papá Noel para darle un toque especial a la interacción durante las festividades.
Día 7: llega la función proyectos
OpenAI presentó Proyectos, una herramienta que permite agrupar conversaciones y archivos bajo un mismo espacio, facilitando la gestión de tareas complejas. Próximamente, contará con integraciones en la nube con Google Drive y Microsoft OneDrive.
Día 8: SearchGPT para todos
La búsqueda avanzada, SearchGPT o el que viene a ser el sustituto de Google para muchos, llega a todos los usuarios, optimizada para dispositivos móviles y con integración de funciones de voz. Esto mejora la velocidad y la experiencia de consulta en la plataforma.
Día 9: API del modelo o1 y reducción de costes
OpenAI lanzó también la API del modelo o1, que permite a los desarrolladores integrar funciones avanzadas como procesamiento visual y llamadas personalizadas. Además, se redujo un 60% el coste del uso de audio en GPT-4o, haciéndolo más accesible para una variedad de proyectos.
Día 10: ChatGPT en WhatsApp
ChatGPT ahora está disponible en WhatsApp y mediante un número gratuito en EE. UU., facilitando el acceso a la IA en regiones con conectividad limitada y promoviendo una interacción más sencilla vía.
Día 11: integración con apps de escritorio
Se expandió la compatibilidad de ChatGPT con herramientas como Jetbrains, Apple Notes y Notion, optimizando los flujos de trabajo en diferentes disciplinas.
Día 12: el primer vistazo de los modelos o3
Se presentaron los ya comentados nuevos modelos o3 y o3-mini, diseñados para superar a o1 con capacidades avanzadas de razonamiento y destacando especialmente en áreas como matemáticas complejas. Un lanzamiento que marca el siguiente paso en la evolución de los modelos de OpenAI.
Estos anuncios no solo destacan por la innovación técnica, sino también por el esfuerzo de OpenAI por integrar sus avances en herramientas que impactan el día a día de los usuarios y agrandar su capa gratuita. Veremos qué tienen reservado a futuro.