Los esfuerzos de IA de Google y OpenAI han atraído mucha atención en los últimos meses, pero Meta cree que su nuevo modelo podría ser uno de los mejores disponibles, al menos en lo que respecta a la generación de arte de IA. La compañía acaba de lanzar «CM3leon», que se pronuncia «camaleón», un generador de imágenes que puede transformar indicaciones de texto en imágenes y viceversa. Según un comunicado de la metasitio web, CM3leon es «el primer modelo multimodal entrenado con una receta adaptada de modelos de lenguaje de solo texto». Debido a esto, Meta dice que el modelo logra «un rendimiento de última generación para la generación de texto a imagen, a pesar de haber sido entrenado con cinco veces menos cómputo que los métodos anteriores basados en transformadores».
En términos simples, puede usar la nueva herramienta para crear imágenes nuevas y complejas desde cero o editar imágenes existentes. Las ediciones pueden incluir convertir el verano en invierno, cambiar el color del cielo o cualquier otra cosa que pueda resumir con un aviso. En cuanto a las imágenes generadas, el límite es tu imaginación. Los usuarios también pueden agregar una imagen y hacer preguntas al modelo de IA al respecto, ya sea una consulta sobre aspectos específicos de la foto, o incluso pedirle al modelo que cree un título detallado de la imagen en cuestión. Otras características admitidas incluyen objeto a imagen, segmentación a imagen y la adición de una etapa de «súper resolución» que aumenta la resolución de las imágenes creadas.
hay mucha competencia
El generador de imágenes de Meta es ciertamente único y hace las cosas muy bien, pero está lejos de ser el único juego en la ciudad. Hace tiempo que existen herramientas similares, y la mayoría de los jugadores importantes tienen una de alguna forma. DALL-E de OpenAI llegó a los titulares el año pasado, aparece en varias formas y tiene muchos seguidores. El modelo GPT-4 de la compañía también es capaz de generar imágenes, aunque se necesita un complemento si está utilizando la herramienta web de OpenAI. Adobe también se apresuró a agregar IA a su conjunto de servicios. «Firefly», el modelo generativo de inteligencia artificial de la compañía, está disponible para su uso de forma gratuita, aunque los suscriptores obtienen acceso a la biblioteca de fotos de archivo de Adobe y, por lo tanto, a una versión más efectiva de la herramienta de inteligencia artificial que se basa en ella. Google Bard también usa Firefly para generar imágenes. Luego, tiene herramientas poderosas que requieren un poco de trabajo para ponerlas en marcha, y avisos decentes si desea usarlas de manera efectiva. Esta categoría incluye los gustos de Stable Diffusion y Midjourney.
En cuanto a cuándo puede probar la nueva herramienta de Meta, no lo sabemos. La compañía no ha anunciado cuándo, o si, recibirá un comunicado público. Ciertamente, Meta ya tiene suficiente con el lanzamiento de una nueva plataforma de redes sociales, Threads, y el colapso constante de «el Metaverso» con el que lidiar, pero esperamos que este nuevo generador de imágenes de IA se publique en las próximas semanas.