ChatGpt Dalle 3 VS Stable Diffusion

preview_player
Показать описание
Extensa comparativa entre ChatGpt Dalle 3 y Stable Diffusion XL.

Рекомендации по теме
Комментарии
Автор

Pues yo siento discrepar, pero a mi Dalle 3 me ha sorprendido. En ciertas cosas lo veo peor que Stable Diffusion, como es en las capacidsades para editar y controlar lo que haces, pero Dalle 3 se ciñe de una manera absolutamente brutal al prompt. Le pedi un prompt donde me hiciese aun tio al lado de un coche, modelo X color Y con matricula Z, en un puente con un monumento famoso detrás, y TODAS las imagenes hizo exactamente lo que le pedí (independientemente de que en algunas al tio le puso barba o le puso una ropa que no queria, pero estamos hablando de un promtp SIMPLE y hecho a la carrera) Con Stable Difussion, ni siquiera con XL pude hacer algo parecido. Las conposiciones en general son mas complejas sin tampoco tener que estrujarse mucho el cerebro con prompts. Las manos salen bien en casi todas las imagenes que he generado. Como parte tambien negativa, decir que no se pueden usar prompts en negativo, o al menos no se como.
En resumidas cuentas, un DALLE3 de codigo abierto, sin censura y con controlnet e impanting y las capacidades de edición y personalizacion que tiene SD y funde a SD por todos los lados

josea.b
Автор

Se te echaba en falta. A lo bueno se acostumbra uno enseguida y se nota mucho la ausencia.

BestmanPi
Автор

Excelente video. Me gustaria que hicieras la comparativa con SD 1.5 ya que el 1.6 todavia no me esta andando muy bien, varios bugs y me volvi al 1.5 hasta que este mas maduro el 1.6. Gracias crack.

Crime-IA
Автор

Me hubiese gustado la comparativa de escribir Texto en la imagen, se me hace un gran valor de Dalle3, que sí bien le cuesta por lo menos lo hace y te hace letreros con el texto corto que quieras, a mi me gusta Dalle3 para hacer Chibi, le quedan genial pero una debilidad que le veo a Dalle3 es que no le gusga el peinado Ahoge, le cuesta una barbaridad hacerlo o de plano ni lo hace. Otra cosa es Derecho de Autor, en Stabledifussion puedes generar super heroes o personajes sin problema, pero en Dalle3 siempre salta el mensaje de que no puede generar la imagen por derechos de autor. Aun que lo puedes evirtar un poco dandole la vuelta con el prompt, por ejemplo para IronMan le puse "un hombre en una armadura de hierro roja y amarilla, parecida a un super heroe famoso" y con eso si me genera 1 o 2 imagenes con la armadura de Iron Man.

miguelangel-njcq
Автор

Si man pero la cagada es que SD en cuanto a la comprencion de prompts se querda re atras comparado con Dalle+ChatGPT. Proba un prompt complejo. Stable diffusion no lo entiende. Dalle-3 no se trata de calidad en si, se trata de lo bien que comprende el prompt.

loco
Автор

Que buena comparativa, en realismo dall-e 3 tiene carencias, pero esta semana aparecio adobe firefly 2 que para mi es muy bueno en fotos realistas.

jhonyful
Автор

ese asiatico es jesucristo por caminar en el agua, comprobado por las ias, jajajaa

Genshi-studio
Автор

Puedes pedir a ChatGPT que te genera el prompt sobre lo que tú quieras. Midjourney internamente tiene una IA que modifica el prompt y por eso salen muy buenas imágenes (no os penséis que es el modelo en sí solamente), stable diffusion también tiene algo parecido (prompt generator) aunque no es lo mismo. Dalle-3 en el tema de los textos es muy bueno y en eso supera a stable diffusión. Stable diffusion te permite hacer muchísimas más cosas que Dall-E no permite, además que no tiene censura, permite crear personajes propios, tiene openpose, te permite modificar las imágenes o expandirlas, tienes una gran variedad de modelos y LoRas... y toda una comunidad trabajando para mejorarlo día a día. Ahora Bing (el buscador) te permite generar imágenes con Dall-E. Pero no le pidas que genere imágenes con estilos parecidos a gente de este último siglo o cosas con copyright que no os dejará (salvo que le deis un buen rodeo para saltar la restricción). En lo personal prefiero mil veces stable diffusion, a fin de cuentas se trata de afinar con el prompt (y los negative prompt)

JoseMiguelOrtolaTello
Автор

si quieres crear tu mismo el prompt, , por ahora tienes que usar Bing Create gratis... lo malo es que solo genera imagenes en 1024x10204. Saludos!

jl
Автор

Excelente video, solo que me gustaría que pusiera los prompts utilizados en las imágenes, porque hay algunas que me gustaron mucho y quisiera poder replicarlo, pero no puedo porque no sé qué tipo de prompt fue el qué utilizo, por todo lo demás excelente video

alexfabricio.
Автор

Muy buen video!! la siguiente comparación podrías hacerla con adobe firefly2 vs XL por favor!!

endecoder
Автор

11:10 Como no va a estar preocupada la chica si bucea sin máscara y de paso usa una Canon para tomar fotos debajo del agua jajaj

obi-wan-afro
Автор

Curiosamente el xenomorph en dalle sale muchísimo más apegado en aspecto a cómo es realmente, el SDXL hace más bien una interpretación o versión más knockoff como si de la película turca se tratara 😝😅🤣 aunque pues esto se puede arreglar con un Lora probablemente

fallensoildier
Автор

Ninguna de la imágenes de Dalle 3 Me gustaron, estan como Stable Difussion en su versión 1.4, la manos (FORMA RECTANGULAR) y el cuerpo no tienen una correcta anatomía, y XL está mejorando pero tienen que superar lo de las manos, el grado de realismo aún sigue estando mal representado 5:52 las casa en el fondo se ve mal, no se lo puede dar 10 si no un 7.
Sobre el asunto del mapache y el perro (lobo siberiano), ambos tienen una cierta similitud por lo cual XL asumió siempre un mapache pero no respecto la orden o el prompt. Creo ese gran error en el código no respetar nuestra orden escrita, aquí se ve claro que no es del prompt, si no de interpretación visual de la IA.

canaljoseg
Автор

en la ultima actuializacion grande de windows 11 version 22h2 o algo asi ya viene con dale 3 con la IA de bing en vez de chat gpt. No hay que pagar nada, es gratis.. Esto aparece abajo en la barra de tareas en un icono que dice "pre"..pre copilot o algo asi. si le pides generar imangen de tgenera imagenes con dall 3.. Genra de 4 imagenes al mismo tiempo. .... Esta weno...y como dices, por su flexibilidad y que no viene capado stable diffusion es "mejor persona"..

SolracNaujMauriiDS
Автор

Quisiera también saber si hay algún tipo de modelo similar al utilizado en XL en el vídeo, pero para 1.5

alexfabricio.
Автор

8:33 la mano siempre sera el problema de SD

ferhf
Автор

Mete imagenes de Anime cuando compares el 1.5

SheigonSheffield
Автор

Bro con Xl se puede generar imágenes de un modelo entrenado personalizado?

isaacmartinez
Автор

Pelea de inválidos! Hay que hacer la comparativa con 1.5

jdesanti