Colección de citas famosas - Colección de firmas - ¿Cómo mostrar texto específico en imágenes generadas por IA?

¿Cómo mostrar texto específico en imágenes generadas por IA?

Actualmente es muy popular permitir que la IA forme imágenes de texto y lo he probado.

¿Qué se utiliza habitualmente y es estable actualmente? ¿difusión? Entonces qué. ¿DALE-2? No he recibido capacitación en generación de texto. Incluso si se imponen requisitos similares, es fácil generar texto confuso o distorsionado. Pero utilice software de edición de imágenes (como Adobe, Photoshop, GIMP, etc.) para agregar texto a las imágenes generadas. Abra la imagen generada por AI, seleccione la herramienta adecuada (como la herramienta de texto) en el modo de edición, configure la fuente, el tamaño, el color y otros parámetros, y luego agregue el texto especificado a la imagen. Este problema se puede evitar de manera efectiva y los novatos pueden evitar apresurarse.

Sin embargo, muchas personas han hecho demandas similares, como imprimir palabras específicas en marcas y ropa, o hacer tatuajes, marcas de agua, etc. específicos, que sí tienen un significado práctico. ¿Se dice? ¿Google? ¿Qué pasa? ¿AI? Sería mejor, ¿qué más? ¿NVIDIA? ¿abierto? ¿Edith-yo? Ya hay más resultados disponibles.

Creo que la idea general es utilizar un modelo de generación de texto, ingresar el texto que se mostrará en el modelo y luego generar la imagen correspondiente. Existen algunos modelos de generación de texto de código abierto (como AttnGAN, StackGAN, etc.) que se pueden utilizar para esta tarea.

Por ejemplo, en el ejemplo publicado por los internautas, ¿se puede utilizar directamente texto común y corriente? ¿Agotador? ¿respuesta? ¿camiseta? ¿leer? "¿Algunas? palabras"? Intenté generar, pero aun así es difícil configurar la fuente/tamaño/estilo, etc. Direccionalmente. ¿En ese caso? Logo o tatuaje, ¿es mejor usar algo parecido? ¿PD? Las películas positivas y negativas se pueden superponer de una manera

¿Estás en línea? ¿Estabilizar? ¿difusión? La generación automática es la mejor. Si no se puede integrar, puede esperar a que los grandes creen directamente funciones de complemento similares. Este método requiere algoritmos y datos de entrenamiento relevantes, y la tecnología de aprendizaje automático puede ayudar a lograr la asociación imagen-texto.

. De hecho, ahora existen muchas formas similares de pellizcar a las personas en los juegos. Lo que más me impresionó fue la "lealtad" de Ginzi, que en realidad es la superposición de una imagen y la unión del personaje. ¿En cuanto a los usos mencionados? controlNet? Sí, inicialmente pensé que tal vez no sería capaz de controlarlo con tanto detalle (o tal vez mi investigación no fue lo suficientemente exhaustiva...).

¿Actualmente? controlNet? ¿Cuáles son los modelos y funciones de preprocesamiento más prometedores proporcionados por la descripción del modelo? mlsd? Pero esa cosa se usa principalmente para detectar los bordes de los edificios... todavía tengo que probarlo. De todos modos, mi opinión es que no debería ser difícil para un gran jefe o un constructor de modelos. Intenté agregar entrenamiento de texto, pero es posible que el chino no sea muy bueno.

¿Qué pasa con el futuro? ¿pregunta? Cuando hay más personas, puede haber modelos o complementos más simples para implementarlo, por lo que es demasiado exigente encontrar algunas habilidades extrañas ahora.