DeepSeek revoluciona la IA con Janus Pro, su modelo más avanzado

DeepSeek revoluciona la IA con Janus Pro, su modelo más avanzado

La firma tecnológica China DeepSeek, responsable del popular chatbot que ha superado a ChatGPT en la App Store, ha presentado Janus Pro, un nuevo modelo generativo de imágenes que destaca por su comprensión multimodal avanzada y por ofrecer resultados altamente realistas pese a operar con una resolución limitada de 384 x 384 píxeles.

Estoy de acuerdo con los Términos y condiciones y los Política de privacidad

Janus Pro es la última incorporación a la familia de modelos Janus y se basa en el modelo de lenguaje visual DeepSeek VL2, con 4.500 millones de parámetros activados. Este modelo logra un rendimiento competitivo frente a tecnologías líderes, como TokenFlow XL (13B), gracias a una estrategia de entrenamiento optimizada y una mayor escalabilidad, según explican sus creadores en el repositorio de GitHub.

La versión más avanzada de Janus Pro, con 7.000 millones de parámetros (7B), supera en rendimiento a modelos establecidos como Dall-E 3, obteniendo un 80% de precisión en las evaluaciones GenEval, frente al 67% del modelo de OpenAI. Además, en los test de DPG-Bench, Janus Pro alcanzó una puntuación de 84.19, lo que reafirma su capacidad para seguir instrucciones y generar imágenes coherentes y detalladas.

Uno de los aspectos destacados de Janus Pro es su mejora en la comprensión multimodal, que supera a otros modelos densos y basados en MoE de código abierto. Este logro se debe a su enfoque innovador que disocia la codificación visual para comprensión y generación multimodales, minimizando los conflictos entre ambas tareas.

DeepSeek ha ganado notoriedad en los últimos días gracias al éxito de su chatbot DeepSeek, que lidera las descargas de aplicaciones gratuitas en la App Store. Basado en el modelo DeepSeek V3, este chatbot fue entrenado con 2.048 GPU Nvidia H800, con una inversión de 5,6 millones de dólares, y ofrece un rendimiento similar o superior a sistemas de vanguardia como Claude 3.5 Sonnet, Llama 3.1 40B y GPT 4o.

Además de Janus Pro, la compañía ha lanzado recientemente DeepSeek-R1-Zero y DeepSeek-R1, modelos enfocados en tareas de razonamiento, destacando que DeepSeek-R1 logra resultados comparables a los de OpenAI en esta categoría.

Aunque Janus Pro muestra avances significativos, la baja resolución de 384 x 384 píxeles sigue siendo una limitación para aplicaciones que requieren imágenes de alta definición. Sin embargo, la compañía ha asegurado que trabaja en mejorar esta capacidad en futuras versiones, consolidando así su apuesta por liderar el mercado de Inteligencia Artificial generativa.

Escribir un comentario

Tu clasificación:

Enviar

Publish the Menu module to "offcanvas" position. Here you can publish other modules as well.