Como criar imagens no ChatGPT: guia completo 2026

Q: Posso usar as imagens geradas comercialmente?

Sim. Segundo os termos de uso da OpenAI , as imagens geradas são de propriedade do usuário e podem ser usadas comercialmente, inclusive para venda e publicação.

O ChatGPT consegue criar imagens desde dezembro de 2023, quando a OpenAI integrou o DALL-E 3 diretamente ao chat. Hoje o modelo por trás é o GPT Image 2, lançado em abril de 2026 — bem mais capaz que o DALL-E 3 original, especialmente em texto legível e resolução. Você descreve o que quer, ele gera. Sem precisar aprender comandos especiais, sem precisar criar conta em outro serviço.

Para quem está começando agora: é a forma mais simples de criar imagens com IA que existe hoje. Para quem já usa outras ferramentas: o diferencial do ChatGPT é que você conversa com a IA para refinar a imagem — algo que o Midjourney, por exemplo, não permite da mesma forma.

O plano gratuito do ChatGPT já gera imagens, mas com limite baixo — cerca de 2 a 3 por dia. Se você quer volume maior sem pagar nada, vale olhar o Meta AI pelo WhatsApp, que não tem esse teto tão apertado.

O que você precisa para começar

Requisitos:

Conta no ChatGPT (gratuita para criar em chatgpt.com)
Acesso pelo site chatgpt.com ou pelo app móvel
Nenhum software adicional — funciona no navegador

Limites de geração (julho 2026):

Plano Free: aproximadamente 2–3 imagens por dia
Plano Go (US$ 8/mês): ~20–30 por dia
Plano Plus (US$ 20/mês): ~50 imagens a cada 3 horas
Plano Pro (US$ 200/mês): uso essencialmente ilimitado

A OpenAI não publica esses números oficialmente — são baseados em relatos de usuários e testes independentes.

Modelo atual: O GPT Image 2, lançado em abril de 2026, roda em todos os planos pagos e no gratuito. Ele substituiu o GPT Image 1.5 (que por sua vez já havia substituído o DALL-E 3 em março de 2025) e trouxe resolução nativa de até 2K no ChatGPT (4K via API), faixa de proporção bem mais ampla e mais de 99% de precisão em texto curto dentro da imagem.

Passo a passo: primeiras imagens em 5 minutos

1. Acesse o ChatGPT

Entre em chatgpt.com com sua conta — gratuita ou paga, tanto faz para começar. A geração de imagens já vem habilitada por padrão nos modelos principais; não é preciso trocar de modelo manualmente como era necessário nas versões antigas da interface.

2. Peça a imagem em linguagem natural

Diferente do Midjourney, você não precisa de prompts técnicos. Basta descrever o que quer como faria para um designer:

“Crie uma imagem de um gato laranja dormindo em cima de uma pilha de livros antigos, luz de tarde entrando pela janela, estilo fotográfico.”

O ChatGPT vai interpretar sua descrição e gerar a imagem. Vai aparecer diretamente na conversa.

3. Refine com a conversa

Esta é a maior vantagem sobre outras ferramentas: você pode pedir ajustes sem reescrever o prompt do zero.

“Mantenha tudo igual, mas muda a cor dos livros para azul.”

“Agora coloca uma xícara de café na mesa ao lado.”

“Faz uma versão mais escura, como se fosse noite.”

A IA guarda o contexto da conversa. Você não perde o que já estava bom.

4. Baixe a imagem

Passe o mouse sobre a imagem gerada. Vai aparecer um botão de download no canto. Clique para salvar em PNG no seu dispositivo.

Como escrever prompts que funcionam

O ChatGPT é mais tolerante com prompts vagos do que outras ferramentas, mas a qualidade sobe muito com alguns ajustes simples. Para uma visão mais completa sobre técnicas de prompt, veja o guia de prompts para IA.

A estrutura básica

Um bom prompt tem três partes:

Sujeito: o que aparece na imagem
Contexto: onde está, quando, como
Estilo: fotográfico, ilustração, pintura, etc.

Exemplo fraco:

“Um cachorro na praia”

Exemplo forte:

“Um golden retriever correndo na beira do mar ao pôr do sol, areia molhada refletindo a luz laranja, perspectiva ao nível do chão, estilo fotografia de natureza”

A diferença entre os dois não é o tamanho — é a especificidade. Cada detalhe que você adiciona é um detalhe que a IA não precisa inventar por conta própria.

Especificando o estilo visual

O ChatGPT entende bem referências de estilo. Exemplos que funcionam consistentemente:

estilo fotografia profissional, câmera Sony A7R
ilustração vetorial minimalista
aquarela com cores suaves
arte digital no estilo anos 80
pintura a óleo realista
flat design, cores sólidas
sketch a lápis, preto e branco

Controlando proporção e tamanho

Por padrão, o ChatGPT gera imagens quadradas. Para mudar, você pede diretamente:

"Crie em formato horizontal (paisagem)" — bom para banners e wallpapers
"Crie em formato vertical (retrato)" — bom para stories e reels
"Crie em formato quadrado" — padrão para posts

O GPT Image 2 aceita uma faixa bem mais ampla que as versões anteriores do DALL-E — de proporções bem panorâmicas a bem verticais. Se quiser uma proporção exata (como 9:16), é só pedir o número diretamente: "proporção 9:16". Veja o guia de aspect ratio em imagens com IA para a sintaxe usada em outras ferramentas.

Técnicas intermediárias

Iteração inteligente

A maioria das pessoas descarta imagens que estavam quase boas. A abordagem certa é iterar:

Gere com um prompt base
Identifique o que está errado (cor, composição, estilo, elemento específico)
Peça mudança cirúrgica: “mantém tudo, mas…”
Repita até chegar onde quer

No plano Plus, com cerca de 50 gerações disponíveis a cada 3 horas, você tem espaço de sobra para experimentar.

Pedindo variações

Se uma imagem ficou boa mas você quer explorar outras possibilidades:

“Gere 3 variações desta mesma cena com estilos diferentes: uma fotorrealista, uma em aquarela e uma como ilustração de livro infantil.”

O ChatGPT vai gerar cada uma, e você escolhe ou combina elementos das três.

Usando referências de estilo sem citar artistas específicos

O modelo tem restrições quanto a imitar o estilo de artistas vivos. A saída é descrever o estilo em vez de citar o nome:

Em vez de: "no estilo de [artista]"

Use: "traços finos e detalhados, cores pastel suaves, composição centralizda com muito espaço negativo" — que é como você descreveria o estilo de ilustração que quer.

Texto dentro das imagens

O GPT Image 2 é hoje um dos modelos mais precisos do mercado para gerar texto em imagens — a OpenAI reporta mais de 99% de acerto em textos curtos. Para melhores resultados:

Use aspas ao redor do texto que quer na imagem: com a palavra "Café" escrita na placa
Textos curtos (1-4 palavras) saem quase perfeitos; frases mais longas funcionam bem, mas com mais variação
Fontes sem serifa tendem a sair mais legíveis

É um dos pontos fortes do ChatGPT comparado ao Midjourney, que ainda tem dificuldade com tipografia — veja o guia de texto em imagens com IA para a comparação completa entre ferramentas.

Técnicas avançadas

Prompts com seed consistente (via API)

Pelo chat, não é possível definir um seed manualmente — cada geração é aleatória. Para quem precisa de consistência entre imagens (ex: personagens que aparecem em várias cenas), a saída pela interface é pedir ao ChatGPT:

“Preciso criar várias cenas com o mesmo personagem: um homem de 40 anos, cabelo grisalho curto, barba por fazer, óculos redondos. Primeiro, crie uma imagem dele em um escritório moderno. Depois vou pedir outras cenas e preciso que o personagem seja visualmente consistente.”

O ChatGPT vai tentar manter a consistência ao longo da conversa, mas não é garantia — ele não tem memória visual precisa como algumas ferramentas especializadas.

Integração com uploads

Você pode enviar uma foto e pedir que a IA crie algo baseado nela:

"Cria uma versão ilustrada desta foto no estilo cartoon" (envia foto)
"Qual seria essa mesma cena ambientada nos anos 1920?" (envia paisagem urbana)
"Mantém o layout desta apresentação mas recria em estilo moderno" (envia screenshot)

O modelo não vai copiar rostos de pessoas reais para outras cenas — mas vai usar elementos de composição, paleta de cores e estilo.

Usando como rascunho para outras ferramentas

Um fluxo que funciona bem: usar o ChatGPT para chegar rápido em uma composição que você gosta, e depois levar o conceito (não a imagem) para o Midjourney ou Stable Diffusion com prompts mais elaborados para refinamento técnico.

Limitações e problemas comuns

Mãos e dedos: O modelo melhorou bastante em relação ao DALL-E 3 original, mas ainda erra de vez em quando em mãos humanas — dedos extras, proporções erradas, posições impossíveis. Se mãos são importantes na imagem, gere várias versões e escolha a melhor.

Consistência entre gerações: Como mencionado, cada geração é independente. Dois prompts idênticos vão gerar imagens diferentes. Isso é diferente do Stable Diffusion, onde você pode fixar o seed para reproduzir resultados.

Restrições de conteúdo: O filtro do ChatGPT é mais restritivo que outras ferramentas. Imagens que envolvam violência, conteúdo adulto ou certas figuras públicas são bloqueadas. Isso é uma limitação real para alguns casos de uso profissional.

Resolução: nativa de até 2K no ChatGPT, com 4K disponível via API (verificar disponibilidade — listado como beta em parte da documentação da OpenAI). Para impressão em grande formato, ainda pode ser necessário upscaling externo dependendo do tamanho final.

Sem controle de parâmetros: Não dá para controlar steps, CFG scale, sampler ou qualquer parâmetro técnico como no Stable Diffusion. O que você vê é o que tem.

Quando usar o ChatGPT vs outras ferramentas

Use o ChatGPT quando:

Está começando e quer simplicidade
Precisa combinar geração de texto e imagem no mesmo fluxo
Quer iterar conversacionalmente até chegar no resultado
Precisa de texto legível dentro da imagem
Já paga o ChatGPT Plus por outros motivos

Considere outras ferramentas quando:

Quer controle técnico fino sobre o processo (Stable Diffusion)
Precisa de volume alto de imagens com consistência (Midjourney)
Quer resultado sem pagar nada e sem limite tão apertado (Meta AI no WhatsApp)
Trabalha com ilustração vetorial ou design gráfico (Adobe Firefly)

Se você está escolhendo sua primeira ferramenta, o comparativo de melhor IA para iniciantes coloca o ChatGPT lado a lado com as alternativas — e o de ferramentas gratuitas mostra o que dá para fazer sem pagar.

FAQ

O ChatGPT gratuito gera imagens? Sim. O plano Free gera cerca de 2 a 3 imagens por dia. Para volume maior, os planos Go (US$ 8/mês), Plus (US$ 20/mês) e Pro (US$ 200/mês) aumentam bastante o limite.

Posso usar as imagens geradas comercialmente? Sim. Segundo os termos de uso da OpenAI, as imagens geradas são de propriedade do usuário e podem ser usadas comercialmente, inclusive para venda e publicação.

Por que meu prompt em português às vezes gera imagens com texto em inglês? O modelo é treinado majoritariamente em inglês e tende a gerar texto em inglês dentro das imagens, mesmo quando o prompt é em português. Para forçar texto em português, especifique: com a palavra "[palavra]" escrita em português.

Dá para editar uma parte específica da imagem (inpainting)? Pela interface do chat, não. O ChatGPT não tem ferramenta de inpainting como o Stable Diffusion ou o Adobe Firefly. Você pode pedir modificações por texto, mas a IA vai regerar a imagem inteira. Para edição de regiões específicas, o Adobe Firefly é a melhor opção entre as ferramentas dessa lista.

Qual a diferença entre DALL-E 3 e o modelo atual do ChatGPT? O ChatGPT não usa mais o DALL-E 3 — desde março de 2025 o modelo é o GPT Image (primeiro a versão 1.5, depois o GPT Image 2 a partir de abril de 2026). A diferença é grande: texto muito mais legível, resolução maior (até 4K via API) e edição conversacional mais precisa. O DALL-E 3 continua existindo apenas no Microsoft Copilot, gratuitamente.

O ChatGPT guarda o histórico das imagens que gerei? Sim, as imagens ficam no histórico da conversa enquanto ela existir. Mas a OpenAI pode limpar ou comprimir históricos antigos. Se a imagem for importante, baixe na hora.

Consigo gerar imagens no app do celular também? Sim. O app do ChatGPT para iOS e Android tem o mesmo recurso de geração de imagens, com as mesmas limitações de plano. A experiência de uso é praticamente idêntica à versão web.

O ChatGPT é a porta de entrada mais natural para criação de imagens com IA. Não é a ferramenta com mais controle, nem a mais barata, mas é a mais acessível para quem já usa o chat no dia a dia. Se você quiser explorar mais possibilidades, o próximo passo natural é experimentar o Midjourney para qualidade profissional ou o Stable Diffusion para controle total sem custo por geração.