DeepSeek, la startup china que ha triunfando en EE UU y más allá, presenta Janus-Pro 7B. Según informes de TechCrunch, en las últimas horas el conjunto de modelos de IA multimodal superó al generador de imágenes DallE-3, de la rival OpenAI. Ya está disponible para su descarga desde la plataforma de desarrollo de IA Hugging Face; está cubierto por una licencia MIT de software libre, lo que significa que puede utilizarse sin restricciones.
El algoritmo creado por la startup china DeepSeek tiene un rendimiento similar al demostrado por el sistema más avanzado de OpenAI en la resolución de problemas matemáticos, químicos y de codificación.
Qué es Janus-Pro
La compañía de IA denomina a Janus-Pro 7B un “nuevo marco autorregresivo”, capaz tanto de comprender como de crear imágenes. A diferencia de otros “modelos unificados”, desacopla la codificación visual para la interpretación y la generación multimodal, utilizando el modelo SigLIP-L como codificador y un tokenizador, un elemento utilizado para traducir texto en datos que puedan ser procesados por el modelo, del conjunto LlamaGen. Esta es una innovación importante que le permite superar el rendimiento de algunos de los modelos más populares del mercado como DallE-3, PixArt-alpha, Emu3-Gen y Stable Diffusion XL.
Con la licencia MIT, el usuario puede usar y modificar el código libremente, incluso para fines comerciales, siempre y cuando se mantenga el aviso de copyright original. Dentro de los modelos de IA, es una de las concesiones más permisivas que existen. No obstante, Janus-Pro 7B requiere aceptar la licencia DeepSeek, la cual incluye restricciones éticas como la prohibición de uso militar o la generación de contenidos inclinados a la desinformación.
Este es el año de la Serpiente de Madera. Este reptil es el sexto animal del ciclo zodiacal y un símbolo de sabiduría, introspección y misterio.
¿Cómo funciona?
Sin embargo, no todo lo que brilla es oro: El nuevo conjunto de modelos de DeepSeek también tiene sus defectos, empezando por el hecho de que solo puede analizar imágenes pequeñas, con una resolución máxima de 384 x 384 píxeles. Teniendo en cuenta el pequeño tamaño de Janus-Pro 7B, su rendimiento es digno de mención, como demuestran los resultados de algunas pruebas compartidas por la compañía en Hugging Face.
Su funcionamiento no difiere mucho de los disponibles actualmente en el mercado: lo único que tienes que hacer es describir una foto u obra de arte, Janus-Pro 7B se encargará de convertir esa descripción en realidad. DeepSeek ha demostrado una vez más que es capaz de mejorar la tecnología existente, haciéndola más atractiva y funcional para sus usuarios, tal y como ha hecho con su chatbot de IA que ya está causando conmoción en las tiendas de aplicaciones de EE UU. Es un detalle que preocupa a Silicon Valley y a las startups del sector que temen verse opacadas por el competidor chino.
Artículo originalmente publicado en WIRED Italia. Adaptado por Alondra Flores.