Los servicios para generar imágenes utilizando inteligencia artificial están ganando popularidad: muchos los ven como una nueva fuente de creatividad para el diseño y la publicidad. Algunas aplicaciones son gratuitas y están disponibles para todos
Las posibilidades de la inteligencia artificial se utilizan no solo para fines serios, sino también para fines de entretenimiento. Hay una serie de servicios que son capaces de generar imágenes a partir de una descripción de texto. RBC Trends preparó una selección de tales servicios y los probó, pidiendo dibujar lo mismo. La petición era "música del metaverso azul rosa delfín tierra espacial".
DALL-E Mini
La red neuronal a principios de 2021 fue introducida por la compañía OpenAI de Elon Musk. Los desarrolladores la entrenaron para crear imágenes a partir de subtítulos de texto cortos. La aplicación funciona sobre la base de otro modelo de generación de texto de OpenAI – GPT-3. Está entrenado en 12 millones de parámetros y es capaz de crear versiones antropomórficas de animales y objetos, combinar conceptos no relacionados en una imagen y seleccionar texto para imágenes existentes. El nombre del programa hace referencia al artista surrealista Salvador Dalí y al personaje Wall-E de la caricatura del mismo nombre. En 2022, el equipo lanzó una versión de DALL-E 2 que genera imágenes realistas, pero hasta ahora no está disponible para una amplia gama de usuarios y empresas.
Cómo intentarlo:
visite el sitio web oficial de Dall-E Mini a través de Hugging Face;
Busque la partición dall-e.
Introduzca una descripción de texto en inglés, separando las palabras con espacios.
Haga clic en Ejecutar.
cuando se genere la imagen, deberá tomar una captura de pantalla para guardar toda la colección o guardar cada imagen por separado.
ruDALL-E Kandinsky
La red neuronal en 2021 fue desarrollada por la división SberAI junto con SberDevices, samara University, AIRI y SberCloud. Funciona sobre la base del software DALL-E, pero genera imágenes a partir de la descripción en idioma ruso. En el dominio público ya hay un modelo del generador: ruDALL-E Malevich (XL), que genera imágenes al estilo de Malevich; Sber VQ-GAN, que genera imágenes en buena resolución; ruCLIP Small para clasificar imágenes y subtítulos, y Super Resolution (Real ESRGAN) para la generación de súper alta resolución.
En 2022, SberAI lanzó un gran modelo de ruDALL-E Kandinsky, entrenado en 12 mil millones de parámetros. Está disponible en la aplicación Salyut de SberDevices y en el bot Discord. Según los desarrolladores, la generación de imágenes tiene en cuenta la descripción exacta de lo deseado y crea imágenes únicas que antes no existían. Se pueden utilizar para ilustrar artículos, así como en redacción publicitaria y publicidad.
registrarse en la plataforma Discord para jugadores;
vaya al sitio web oficial de Midjourney e inicie sesión a través de Discord;
vaya a uno de los bots novatos e ingrese el comando /imagine en el campo para enviar el mensaje;
introduzca una descripción en inglés en la placa Prompt;
haga clic en "Enviar";
aparecerán cuatro imágenes, después de lo cual puede usar el botón U para mejorar la resolución de una de ellas, o el botón V para crear cuatro variaciones más de la imagen seleccionada;
La red neuronal crea imágenes basadas en la descripción del texto, pero con adiciones. En el modo Altair, puede crear una imagen fabulosa que serán representaciones artísticas más abstractas de IA. En el modo Orión, puedes crear imágenes más complejas y cinematográficas mezclando hasta tres estilos. Para generar, se utiliza un sistema de créditos, que no solo se pueden comprar por dinero, sino también ganar, para ver publicidad o compartir trabajo en redes sociales. Para la imagen terminada, hay disponible una opción para aumentar la resolución de créditos adicionales.
Cómo intentarlo:
vaya al sitio web de Starryai, haga clic en "Comenzar a crear";
pasar la verificación a través de Google o Apple;
seleccione la opción Altair u Orion;
en la ventana Preguntar, escriba una descripción de texto en inglés;
aparecerá una imagen en la ventana, que se convertirá justo ante sus ojos;
haga clic en la imagen terminada y seleccione Descargar, también puede compartir la imagen en las redes sociales o incluso crear una animación a partir de ella.
En mayo de 2022, Google también mostró su red neuronal Imagen, que genera imágenes basadas en texto por difusión: comienza con una imagen esquemática y la mejora. Al principio, Imagen crea una imagen de 64×64 píxeles, pero luego la lleva a 1024×1024 píxeles. Como resultado, la imagen recibe un detalle tan alto que puede confundirse con una fotografía.
Cómo intentarlo:
ir al sitio web de Dream;
en la ventana Preguntar, escriba una descripción de texto en inglés;
seleccione el estilo de imagen y haga clic en Crear;
haga clic en Guardar, también puede intentar generar de nuevo haciendo clic en Generar de nuevo.