Black Forest Labs ha lanzado FLUX.2, un sistema de generación y edición de imágenes con cuatro modelos diseñados para flujos de trabajo creativos de nivel de producción. FLUX.2 introduce el acondicionamiento multi-referencia, salidas de alta fidelidad y renderizado de texto mejorado, ampliando el ecosistema de código abierto de la compañía con endpoints comerciales y checkpoints de peso abierto. Una de las principales novedades es el FLUX.2 VAE, un autoencoder variacional de código abierto bajo licencia Apache 2.0, que comprime imágenes en un espacio latente y las reconstruye en salidas de alta resolución, facilitando la interoperabilidad y evitando el bloqueo de proveedores.
FLUX.2 se posiciona como una evolución de la familia FLUX.1, con un enfoque en la fiabilidad, la controlabilidad y la integración en los pipelines creativos existentes. El sistema mantiene la coherencia a resoluciones de 4 megapíxeles para tareas de generación y edición, mejorando el seguimiento de las instrucciones y reduciendo los fallos relacionados con la iluminación y la lógica espacial. La compañía sigue una estrategia de open-core, proporcionando versiones alojadas y optimizadas para el rendimiento de FLUX.2 para implementaciones comerciales, al tiempo que publica modelos de peso abierto para la investigación y el desarrollo independiente.
FLUX.2 llega con cinco variantes, incluyendo FLUX.2 [Pro] para aplicaciones que requieren mínima latencia y máxima fidelidad visual, FLUX.2 [Flex] para desarrolladores que desean ajustar la velocidad y la precisión del texto, FLUX.2 [Dev], un checkpoint de peso abierto que integra la generación de texto a imagen y la edición de imágenes, FLUX.2 [Klein], un modelo de tamaño reducido que se lanzará bajo Apache 2.0, y FLUX.2 – VAE, el autoencoder variacional que sustenta todas las variantes de FLUX.2. Las pruebas de rendimiento muestran que FLUX.2 [Dev] supera a otras alternativas de peso abierto en generación de texto a imagen, edición de referencia única y edición multi-referencia, con una eficiencia de coste-calidad notable. En comparación con Nano Banana Pro, FLUX.2 [Pro] ofrece precios por imagen significativamente más bajos, especialmente para salidas de alta resolución o flujos de trabajo de edición multi-imagen.
FLUX.2 se basa en una arquitectura de flujo latente, combinando un transformador de flujo rectificado con un modelo de visión-lenguaje basado en Mistral-3 (24B). La mejora más significativa es el soporte multi-referencia, permitiendo la ingestión de hasta diez imágenes de referencia y el mantenimiento de la identidad, los detalles del producto o los elementos estilísticos en la salida. FLUX.2 también mejora la tipografía y el seguimiento de instrucciones, ampliando los casos de uso donde el texto y la imagen definen conjuntamente la salida final.
Fuente Original: https://venturebeat.com/ai/black-forest-labs-launches-flux-2-ai-image-models-to-challenge-nano-banana
Artículos relacionados de LaRebelión:
- Qualcomm Desafia a Nvidia y AMD con Chips IA
- Warner Bros Demanda a Midjourney Infraccion de Copyright
- Extremadura y la Amenaza China El Gigante Asiatico Desafia la Industria del Tomate Espanol
Artículo generado mediante LaRebelionBOT
No hay comentarios:
Publicar un comentario