Siglo XXI. Diario digital independiente, plural y abierto. Noticias y opinión
Viajes y Lugares Tienda Siglo XXI Grupo Siglo XXI
21º ANIVERSARIO
Fundado en noviembre de 2003
Portada
Etiquetas

Alibaba presenta Qwen VLo, su nuevo modelo de creación de imágenes basado en una técnica de generación progresiva

Agencias
lunes, 30 de junio de 2025, 10:22 h (CET)

Alibaba presenta Qwen VLo, su nuevo modelo de creación de imágenes basado en una técnica de generación progresiva

MADRID, 30 (Portaltic/EP)
Alibaba ha presentado su nuevo modelo de Inteligencia Artificial (IA) Qwen VLo, con capacidades de comprensión y generación de contenido multimodal, ideado para generar y modificar imágenes de alta calidad a partir de entradas de texto, con una técnica de generación progresiva.

La tecnológica china lanzó el último integrante de su familia de modelos de lenguaje grande (LLM) multimodales, Qwen2.5-VL, en enero de este año, subrayando sus habilidades para analizar documentos, comprender vídeos de larga duración y ejecutar tareas de forma autónoma. Tras ello, ha continuado trabajando en la mejora de la capacidad del modelo para comprender el contenido de las imágenes.

Como resultado, Alibaba ha presentado su nuevo modelo unificado de comprensión y generación multimodal Qwen VLo, ideado para generar y modificar imágenes de alta calidad de forma sencilla, a partir de entradas de texto y mediante un proceso de generación progresiva.

Según ha matizado la compañía en un comunicado en su blog, este modelo actualizado "no solo comprende el mundo", sino que también genera recreaciones de alta calidad basadas en dicha capacidad de comprensión, "acortando la percepción y la creación". Es decir, se trata de un modelo que entiende lo que ve y crea contenido en base a dicha realidad.

En este sentido, los usuarios pueden lanzar una solicitud en forma de texto con lenguaje natural para que Qwen VLo genere una imagen nueva, así como compartir una o varias fotografía reales y pedir que las modifique indicando las características que se desean cambiar.

Para llevar a cabo estas tareas, Qwen VLo se basa en un método de generación progresiva. Esto es, un sistema mediante el que construye gradualmente la imagen completa, de izquierda a derecha y de arriba a abajo, a partir de una estructura básica o imagen borrosa, según ha explicado Alibaba. Por tanto, el modelo genera el contenido agregando capas, colores y texturas.

Así, este proceso permite generar el contenido perfeccionando y optimizando continuamente las predicciones del modelo a medida que construye la imagen, de manera que consigue garantizar que el resultado final sea "coherente y armonioso". Además, ofrece resultados de mejor calidad visual y una experiencia creativa "más flexible y controlable" para los usuarios, ya que pueden observar y ajustar el proceso de creación en tiempo real en base a sus necesidades.

Con todo ello, Alibaba ha destacado las mejoras integrales tanto en comprensión multimodal, a la hora de procesar texto, imágenes, audio y vídeo, como en las capacidades de generación que ofrece con Qwen VLo.

Según ha indicado, los modelos multimodales anteriores "solían presentar inconsistencias semánticas durante el proceso de generación", como la imposibilidad de conservar las características estructurales clave de la imagen original, sin embargo, Qwen VLo puede capturar dichos detalles y mantiene un "alto nivel de consistencia semántica" durante todo el proceso.

Esto permite que los usuarios puedan proporcionar instrucciones creativas en lenguaje natural, incluyendo referencias de estilo artístico o retoques detallados, y el modelo los gestiona "con facilidad". Por ejemplo, modificar objetos, editar texto y cambiar fondos, todo con un solo comando.

Por el momento, Alibaba ha señalado que Qwen VLo se ha lanzado en formato de versión preliminar, por lo que los usuarios pueden comenzar a probar sus habilidades para generar imágenes a través del chat Qwen. Asimismo, Qwen VLo admite varios idiomas, incluyendo chino e inglés.

Noticias relacionadas

El Juzgado Contencioso-Administrativo de Pontevedra ha anulado una factura de 15.600 € que pretendía cobrar la Distribuidora del grupo Naturgy alegando un “fraude eléctrico” que no ha podido demostrar en el juicio. En sentencia firme, UFD Distribución contra el recurso presentado ante la Resolución de la Xunta de Galicia, que daba la razón al titular del contrato de suministro y consideraba nula la refacturación practicada por alegar un ‘fraude eléctrico’ en el contador de electricidad.

Sí, me refiero a ti. A ese que de vez en cuando va a recoger a sus nietos al cole. A esos que están sentados en un banco de un jardín e incluso a los que están echando una partidita de dominó, esperando matar al contrario esos seis dobles que están a la expectativa, mirando de reojo al rival para que no le asesinen esa ficha adversa que todos no sabemos dónde meter cuando nos hunde la suerte en el reparto de fichas. A

La Asociación Mundial de Atletismo (World Athletics) publicó este jueves las conclusiones de un estudio realizado durante los Juegos Olímpicos de Paris 2024 con el objetivo de identificar y proteger a los atletas de los mensajes abusivos enviados a través de las plataformas de las redes sociales, siendo el racismo, con un 18%, y el abuso sexualizado (30%) los principales problemas.
 
Quiénes somos  |   Sobre nosotros  |   Contacto  |   Aviso legal  |   Suscríbete a nuestra RSS Síguenos en Linkedin Síguenos en Facebook Síguenos en Twitter   |  
© 2025 Diario Siglo XXI. Periódico digital independiente, plural y abierto | Director: Guillermo Peris Peris
© 2025 Diario Siglo XXI. Periódico digital independiente, plural y abierto