OpenAI anunciou DALL-E 3a mais recente iteração de seu modelo de IA para criar imagens a partir de texto, que agora se integra ao ChatGPT. DALL-E 3 é capaz de gerar imagens detalhadas a partir de descrições complexas, incluindo elementos de texto como etiquetas e sinais, superando desafios anteriores. Embora esteja em fase preliminar de pesquisa, estará disponível para usuários ChatGPT Plus e Enterprise a partir de outubro.
Tal como o seu antecessor, DALL-E 3 Transforme descrições em imagens exclusivas. Embora nenhum detalhe técnico tenha sido revelado, presume-se que continue a treinar com milhões de imagens de artistas e fotógrafos, potencialmente com novas técnicas e mais tempo de treinamento computacional.
DALL-E 3 com integração nativa ChatGPT
DALL-E 3 vem com uma novidade: o integração total com ChatGPT. Agora, você não precisa se esforçar para criar uma descrição detalhada para orientar o DALL-E 3. Você pode simplesmente pedir ao ChatGPT para ajudá-lo a formular uma mensagem, e o chatbot irá gerar um parágrafo que DALL-E 3 continuará ao pé da letra. No entanto, você também pode usar seus próprios prompts se tiver ideias específicas em mente.
OpenAI colocou grande ênfase em Segurança DALL-E 3 para evitar a geração de conteúdo impróprio. Eles trabalharam com equipes de segurança externas e implementaram medidas como classificadores de entrada para evitar avisos explícitos ou violentos. Além disso, DALL-E 3 Você não poderá recriar imagens de figuras públicas.
Quando o DALL-E chegará? 3? Esta atualização estará disponível primeiro para usuários ChatGPT Plus e ChatGPT Enterprise em outubro. Em seguida, chegará aos laboratórios de pesquisa e ao seu serviço de API no outono. Embora OpenAI planeja um lançamento gradualainda não anunciou uma data para a disponibilização gratuita da ferramenta ao público em geral.
Novidades do DALL-E 3
De acordo com os exemplos apresentados no Blog promocional OpenAIDALL-E 3 destaca-se como um modelo de síntese de imagem notavelmente superior em termos de acompanhamento de pistas. Embora os exemplos OpenAI tenham sido cuidadosamente escolhidos pela sua eficácia, nota-se que este modelo siga as instruções com precisão e retrata objetos de forma convincente com deformações mínimas.
Comparado com seu antecessor, DALL-E 2OpenAI afirma que DALL-E 3 detalhes perfeitos menores, como mãos, criando imagens atraentes de forma natural, sem a necessidade de truques ou ajustes rápidos.
Em contraste, outros modelos de IA que também permitem criar imagens a partir de texto, como Midjourney, obtêm detalhes fotorrealistas, mas exigem configurações não intuitivas usando prompts para controlar a saída da imagem.
Além disso, DALL-E 3 pode incluir texto dentro de imagens, algo que seu antecessor não conseguiu fazer, embora alguns concorrentes como Stable Diffusion e DeepFloyd estejam melhorando nesse aspecto. Esse avanço sugere maior potencial na geração de imagens enriquecidas com texto.
Por exemplo, a primeira imagem na galeria acima foi criada com uma mensagem que incluía as palavras: “uma ilustração de um abacate sentado na cadeira de um terapeuta, dizendo ‘Sinto-me tão vazio por dentro’ com um buraco nas costas”. de um buraco no centro. Pode-se ver que DALL-E 3 criou perfeitamente um abacate de desenho animado com o citação de personagem encapsulado em um balão de fala.
OpenAI lança imagens DALL-E 3 de direitos autorais
Atualmente, a política de direitos autorais dos Estados Unidos e da União Europeia afirma que as obras de arte geradas exclusivamente por inteligência artificial não podem receber proteção de direitos autorais. Isto significa que qualquer imagem criada usando DALL-E 3 é considerado de domínio público.
Embora a OpenAI não afirme isso explicitamente, ela afirma que “imagens geradas com DALL-E 3 Eles são seus para uso e você não precisa de nossa permissão para reimprimi-los, vendê-los ou comercializá-los.” Isto marca um mudança significativa em comparação com o ano passado, quando OpenAI restringiu o uso de imagens DALL-E 2 sob uma licença que lhes concedia propriedade de todas as gerações.
A OpenAI colaborou com especialistas, conhecidos como “red teamers”, para identificar e mitigar riscos potenciais, como preconceitos prejudiciais ou geração de propaganda e desinformação. Embora a OpenAI não tenha abordado a possibilidade de sua ferramenta alterar o registro histórico com criações atraentes, ela menciona que está experimentando um “classificador de proveniência” que poderia ajudar a determinar se uma imagem foi gerada pelo DALL-E. 3 ou não.
Definitivamente DALL-E 3 É uma ferramenta poderosa que tem o potencial de gerar imagens detalhadas, incluindo elementos de texto como rótulos e sinais. Certamente abrirá novas possibilidades de criatividade e expressão.