viernes, 14 de junio de 2024

Stable Diffusion 3 Medium, la nueva IA para crear imágenes, abierta, gratuita y optimizada para AMD y NVIDIA

Antes de que OpenAI llevara la IA al máximo nivel de popularidad visto hasta la fecha, Midjourney y Stable Diffusion eran las que atraían la atención de todos aquellos interesados en la inteligencia artificial generativa. Ambas sirven para poder crear imágenes y arte a partir de prompts de texto y aunque en esencia son muy similares, se diferencia su funcionamiento y requisitos. Con Midjourney el trabajo de la IA se realiza de forma online y como un servicio externo, mientras que con Stable Diffusion usamos nuestro PC de forma local. Se acaba de publicar Stable Diffusion 3Medium, el modelo de IA más avanzado, abierto y gratuito para generar imágenes hasta la fecha, el cual funciona muy bien con GPU de PC y portátil, mejorando la calidad de imágenes, texto y fotorealismo.

La IA generativa de imágenes empezó a conocerse hace alrededor de un par de años cuando todos empezamos a ver contenido creado por Midjourney. Aunque al principio las imágenes no eran muy realistas y se notaba enseguida que había sido creado por una inteligencia artificial, vimos como rápidamente se solventaron muchos de estos errores. Probablemente recordarás esas manos con más de 5 dedos o los ojos que no parecían nada reales, pero poco a poco hemos visto como la IA ha aprendido a no cometer estos errores, al menos en la mayoría de casos.

Stable Diffusion 3 Medium es el modelo abierto más avanzado y reciente disponible para generar imágenes por IA

A día de hoy, podemos utilizar varias IA para poder crear imágenes. Tenemos la de Microsoft Bing que es bastante reciente, GPT-4 puede crear imágenes, Midjourney o Stable Diffusion, entre muchas otras. De hecho, se han implementado ya modelos de IA en algunos software como Photoshop para también generar imágenes. Excepto Stable Diffusion, el resto funcionan todas como servicio y no podremos ejecutarlas directamente en el PC sin pasar por ahí. Por suerte, si eres de los que tiene un ordenador potente y quieres crear imágenes de manera local, tu mejor opción es el modelo Stable Diffusion 3 Medium.

Según Stability.AI, este modelo no solo es el más avanzado hasta el momento, sino que además es de relativamente pequeño tamaño y por tanto, está optimizado para PC y portátiles. Podemos ver en las imágenes el realismo de estas y los prompts debajo, para que podamos comprobar que puede hacer todo tipo de creaciones.

Este nuevo modelo mejora la precisión a la hora de hacer imágenes e incluso la tipografía generada cometiendo menos errores

Stable Diffusion 3 Medium es un modelo de Stable Diffusion 3 con 2.000 millones de parámetros, lo que le permite obtener una mejor calidad y fotorealismo. Las imágenes creadas son más nítidas, tienen más detalles, una mejora iluminación y solventa errores en manos y caras. Este nuevo modelo también reconoce los prompts de texto con mayor precisión lo que le permite crear lo que decimos con mayor fiabilidad. Podemos elegir el estilo de dibujo, efectos de cámara, desenfoques y básicamente cualquier cosa que queramos ver como imagen.

Otra de las mejoras está en la tipografía, pues en esta ocasión Stable Diffusion 3 Medium logra crear textos con menos errores y artifacts. Como decíamos antes, a pesar de obtener mejores resultados está optimizado para GPU de portátiles y PC, además de funcionar en gráficas de alto rendimiento. Stability. AI ha colaborado con NVIDIA, logrando un 50% de mejora de rendimiento al usar sus GPU con TensorRT. También tenemos una colaboración con AMD, lo que le permite soportar todo tipo de gráficas incluyendo las MI300X para IA. Si quieres descargar el modelo y el resto de archivos junto a la documentación lo tienes todo en el link al inicio.

Saludos.

No hay comentarios:

Publicar un comentario

Por favor sé respetuoso/a y escribe adecuadamente. Gracias.