Blog > Read Our Blog in Português

Como Transformar Notas de Voz do WhatsApp em Imagens de Anúncios com IA (Make.com + GPT 1.5)

Posted by Axel M | January 4, 2026

Como Transformar Notas de Voz do WhatsApp em Imagens de Anúncios com IA (Make.com + GPT 1.5)

Transforme suas ideias rápidas de voz em criativos profissionais de anúncios para Facebook usando Make.com, GPT 1.5 da OpenAI e automação WhatsApp

Índice

  1. Introdução
  2. O Que Você Vai Construir
  3. Pré-requisitos
  4. Entendendo o Fluxo de Trabalho
  5. Passo 1: Configurar Conexão WhatsApp
  6. Passo 2: Receber Mensagens de Voz
  7. Passo 3: Transcrever Áudio para Texto
  8. Passo 4: Gerar Prompts de Imagem com IA
  9. Passo 5: Criar Imagens com GPT 1.5
  10. Passo 6: Salvar no Google Drive
  11. Passo 7: Enviar Resultados de Volta ao WhatsApp
  12. Otimizando Sua Automação
  13. Casos de Uso Avançados
  14. Solução de Problemas

Introdução

A OpenAI acabou de lançar o GPT 1.5, seu novo modelo de geração de imagens que está recebendo ótimas avaliações pela renderização de texto e qualidade geral. Mas e se você pudesse combinar essa IA poderosa com a conveniência das mensagens de voz do WhatsApp para criar imagens de anúncios do Facebook em movimento?

Imagine isso: Você está em um evento de skate, a inspiração surge, e você grava uma nota de voz rápida no WhatsApp descrevendo sua ideia de anúncio. Em segundos, você recebe uma imagem de anúncio gerada profissionalmente pronta para usar. É exatamente isso que vamos construir neste tutorial.

Este não é apenas mais um tutorial de geração de imagens com IA. Estamos criando uma automação completa que pega suas ideias faladas e as transforma em criativos de anúncios finalizados, tudo enquanto você está móvel.

Por Que Esta Automação Importa

Para Profissionais de Marketing: Crie conceitos de anúncios em qualquer lugar, a qualquer hora - sem software de design necessário
Para Agências: Prototipagem rápida com clientes durante reuniões ou visitas ao local
Para Gerentes de Redes Sociais: Criação rápida de conteúdo a partir de ideias de voz
Para Donos de Negócios: Transforme ideias espontâneas em conteúdo visual instantaneamente

O Que Você Vai Construir

Ao final deste tutorial, você terá um sistema totalmente automatizado que:

  1. Recebe mensagens de voz na sua conta WhatsApp Business
  2. Baixa e transcreve o áudio usando OpenAI Whisper
  3. Transforma a transcrição em um prompt otimizado de geração de imagem
  4. Gera imagens profissionais de anúncios usando GPT 1.5
  5. Salva imagens no seu Google Drive para organização
  6. Envia a imagem final de volta para você no WhatsApp

Exemplo de Fluxo de Trabalho:

Você envia uma nota de voz: "Quero mostrar um skate park super legal e uma barraca de paella na frente. O evento se chama Skate Park Late into the New Year. Mostre um skate park animado na praia com palmeiras e uma atmosfera legal."

Dentro de 30-60 segundos, você recebe uma imagem de pôster de evento gerada profissionalmente correspondente à sua descrição.

Tempo para Construir: 30-45 minutos
Nível Técnico: Intermediário (alguma experiência com Make.com é útil)

🎥 Assista ao Tutorial Completo em Vídeo

Acompanhe o vídeo ou use este guia escrito - ambos cobrem a configuração completa da automação!

Pré-requisitos

Antes de começar, certifique-se de ter:

Contas Necessárias

  • Conta WhatsApp Business - Configure em business.whatsapp.com
  • Conta WhatsAble - Cadastre-se em whatsable.app para sistema Notifyer
  • Conta Make.com - Plano gratuito ou pago
  • Conta OpenAI - Com acesso à API e créditos
  • Conta Google Drive - Para armazenar imagens geradas

Chaves API Necessárias

  • Chave API WhatsAble (do seu painel)
  • Chave API OpenAI (de platform.openai.com)
  • Conexão Google Drive (autorizada através do Make.com)

Requisitos Técnicos

  • Compreensão básica de cenários Make.com
  • Familiaridade com conceitos de API
  • Número WhatsApp Business conectado ao WhatsAble

Entendendo o Fluxo de Trabalho

Vamos detalhar o que acontece nesta automação:

O Fluxo Completo

Entrada de Voz: Você envia uma mensagem de voz WhatsApp com sua ideia de anúncio

Download de Áudio: Make.com recebe a mensagem e baixa o arquivo de áudio

Transcrição: OpenAI Whisper converte fala em texto

Aprimoramento de Prompt: Outra camada de IA transforma sua descrição casual em um prompt detalhado de geração de imagem

Geração de Imagem: GPT 1.5 cria a imagem com base no prompt aprimorado

Armazenamento: Imagem é salva no Google Drive com um link compartilhável

Entrega: Imagem final é enviada de volta para você no WhatsApp

Por Que Esta Abordagem Funciona

A chave para resultados de qualidade é a etapa de aprimoramento do prompt. Sua transcrição de voz bruta pode dizer "mostre um skate park legal com comida." O aprimorador de prompt IA transforma isso em algo como "Pôster de evento profissional apresentando um vibrante skate park à beira-mar ao pôr do sol, palmeiras balançando, uma colorida barraca de paella em primeiro plano, atmosfera energética, design moderno, renderização de alta qualidade."

Esta camada intermediária melhora dramaticamente a qualidade da sua imagem final.

Passo 1: Configurar Conexão WhatsApp

Escolhendo Sua Solução WhatsApp

WhatsAble oferece dois produtos principais para automação WhatsApp:

Sistema Notifyer - Use seu próprio número WhatsApp Business com controle total. É isso que usaremos neste tutorial. Perfeito se você quer uma configuração profissional com o número da sua marca.

Bot WhatsApp - Use o número WhatsApp da WhatsAble para automação. Bom para testes ou se você ainda não tem uma conta Business.

Ambos funcionam com Make.com, mas a seleção de módulo difere ligeiramente.

Instalando o Módulo WhatsAble no Make.com

  1. Faça login na sua conta WhatsAble
  2. Navegue para Configurações → Integrações
  3. Clique em "Conectar ao Make"
  4. Siga o processo de autorização com Make.com
  5. Selecione seu espaço de trabalho ou organização
  6. O módulo WhatsAble agora está disponível no Make.com

Conectando Sua Conta

No Make.com, quando você adiciona o gatilho WhatsAble, precisará conectar sua conta usando sua chave API do painel WhatsAble. O webhook é configurado automaticamente - quando você recebe uma mensagem WhatsApp, Make.com é notificado instantaneamente.

Passo 2: Receber Mensagens de Voz

Configurando o Gatilho

No Make.com, crie um novo cenário e adicione seu módulo de gatilho:

Para usuários do Sistema Notifyer: Procure por "NotifierSystem by WhatsAble" e selecione "Watch Incoming Messages"

Para usuários do Bot WhatsApp: Procure por "Notifyer Bot" e selecione o gatilho apropriado

Entendendo os Dados

Quando uma mensagem de voz chega, WhatsAble fornece:

  • Número de telefone do remetente
  • Tipo de mensagem (neste caso, áudio)
  • URL do anexo (link para o arquivo de áudio)
  • Timestamp
  • Nome do remetente
  • Contexto da conversa

A URL do anexo é o que precisamos - é um link direto para baixar o arquivo de áudio da mensagem de voz.

Testando Seu Gatilho

Antes de construir o resto da automação, teste o gatilho. Ative seu cenário, envie uma mensagem de voz para si mesmo no WhatsApp e verifique se Make.com recebe os dados. Você deve ver a URL do anexo na saída do gatilho.

Passo 3: Transcrever Áudio para Texto

Baixando o Arquivo de Áudio

Antes de transcrever, precisamos baixar o arquivo de áudio da URL de anexo da WhatsAble.

Adicione um módulo HTTP após seu gatilho. Configure-o para solicitação GET e use a URL do anexo do passo anterior. Isso baixa o arquivo de áudio completo como dados codificados em base64.

Usando OpenAI Whisper para Transcrição

Adicione o módulo OpenAI chamado "Generate a Transcription" (você o encontrará procurando por "transcribe" no Make.com).

Configuração:

Nome do Arquivo: Você pode nomeá-lo como quiser, mas a extensão DEVE ser.ogg (este é o formato oficialmente suportado)

Dados do Arquivo: Mapeie todos os dados de resposta do módulo de download HTTP

Modelo: Escolha o modelo Whisper (geralmente whisper-1)

A saída será sua mensagem de voz convertida em texto. Por exemplo, se você disse "Quero mostrar um skate park super legal e uma barraca de paella," é exatamente isso que você receberá em formato de texto.

Passo 4: Gerar Prompts de Imagem com IA

Por Que Aprimorar o Prompt?

Transcrições brutas são casuais e geralmente carecem do detalhe descritivo necessário para geração de imagens de qualidade. Uma camada de aprimoramento transforma sua fala casual em prompts profissionais.

Configurando o Aprimoramento de Prompt

Adicione outro módulo OpenAI chamado "Generate a Response" (encontrado sob módulos genéricos OpenAI).

Seu Prompt de Sistema:

Você é um especialista em criar prompts detalhados de geração de imagens para publicidade e marketing. Pegue a descrição casual do usuário e transforme-a em um prompt vívido e detalhado que gerará imagens de anúncios de qualidade profissional. Foque em detalhes visuais, atmosfera, composição e estilo.

Entrada do Usuário:

Mapeie o texto de transcrição do passo anterior.

A IA transformará "mostre um skate park legal com comida" em algo como "Fotografia publicitária profissional de um vibrante skate park à beira-mar durante a hora dourada, arquitetura moderna, atmosfera energética com skatistas em ação, colorida barraca de paella em primeiro plano com panelas fumegantes, palmeiras, iluminação quente, qualidade de revista, alta resolução, adequado para promoção de eventos."

Passo 5: Criar Imagens com GPT 1.5

Por Que Usar o Módulo API Genérico

Make.com tem um módulo padrão "Generate Image" para OpenAI, mas ainda não foi atualizado para incluir GPT 1.5. Não se preocupe - há uma solução simples usando o módulo de chamada API genérico.

Preparando a Solicitação JSON

Primeiro, adicione um módulo "Create JSON". Isso estrutura sua solicitação API corretamente.

Crie uma nova estrutura de dados com esses campos (todos texto exceto onde indicado):

  • model (texto): "dall-e-3" ou seu identificador de modelo escolhido
  • prompt (texto): Mapeie seu prompt aprimorado do Passo 4
  • n (número): 1 (quantas imagens gerar)
  • quality (texto): "hd" para alta qualidade
  • response_format (texto): "b64_json" (queremos base64 para upload fácil)
  • size (texto): "1024x1024" ou suas dimensões preferidas

Fazendo a Chamada API

Adicione o módulo OpenAI "Make an API Call".

Configuração:

Endpoint URL: /v1/images/generations

Método: POST

Cabeçalhos: Content-Type = application/json

Body: Mapeie a saída JSON do seu passo anterior

O que você recebe de volta é um arquivo de imagem codificado em base64 pronto para ser salvo ou enviado.

Passo 6: Salvar no Google Drive

Por Que Salvar no Drive Primeiro

Salvar no Google Drive fornece uma URL compartilhável e organiza todas as suas imagens geradas em um só lugar. Também é útil para revisar e selecionar quais imagens realmente usar em anúncios.

Fazendo Upload da Imagem

Adicione um módulo Google Drive "Upload a File".

Configuração:

Selecionar Pasta: Escolha ou crie uma pasta para seus anúncios gerados por IA

Nome do Arquivo: Use algo dinâmico como o timestamp ou um ID único da resposta OpenAI, seguido de.png

Converter Dados: Isso é importante! Use esta fórmula para decodificar os dados de imagem base64:

toBinary(base64(seu_campo_dados_base64))

Isso converte os dados de imagem codificados em um arquivo PNG real que o Google Drive pode exibir corretamente.

O módulo gera um "web content link" - esta é a URL direta para sua imagem que você pode compartilhar ou enviar via WhatsApp.

Passo 7: Enviar Resultados de Volta ao WhatsApp

Compondo Sua Resposta

Adicione outro módulo WhatsAble, desta vez "Send Message Without Template."

Configuração:

Conexão: Use sua conexão WhatsAble existente

Número do Destinatário: Mapeie o número de telefone do seu gatilho original (a pessoa que enviou a nota de voz)

Tipo de Mensagem: Imagem

URL da Imagem: Use o web content link do Google Drive

Legenda: Opcional - você pode adicionar texto como "Aqui está sua imagem de anúncio gerada!"

Segundos após enviar sua nota de voz, você receberá a imagem finalizada de volta no WhatsApp, pronta para revisar e usar.

Testando o Fluxo Completo

  1. Ative seu cenário Make.com
  2. Envie uma mensagem de voz WhatsApp para si mesmo com uma descrição de anúncio
  3. Aguarde 30-60 segundos
  4. Receba sua imagem gerada por IA
  5. Verifique sua pasta Google Drive para o arquivo salvo

Otimizando Sua Automação

Melhorando a Qualidade da Imagem

Melhores Descrições de Voz: Seja específico sobre estilo, humor, cores e composição em suas notas de voz. Em vez de "praia legal," diga "praia na hora dourada com iluminação laranja quente."

Refinar o Prompt de Aprimoramento: Experimente com seu prompt de sistema no Passo 4. Adicione preferências de estilo como "fotorrealista," "estilo ilustração," ou "design minimalista moderno."

Ajustar Parâmetros de Imagem: Experimente diferentes tamanhos, configurações de qualidade e versões de modelo para encontrar o que funciona melhor para suas necessidades.

Lidando com Múltiplas Imagens

Modifique o parâmetro "n" no seu JSON para gerar múltiplas variações. Configure para 3 ou 4, depois atualize seu passo Google Drive para lidar com múltiplos arquivos, e envie todas as opções de volta ao WhatsApp.

Adicionando Elementos de Marca

Considere adicionar uma etapa que sobrepõe seu logotipo ou cores da marca em imagens geradas usando uma API de edição de imagem ou serviço antes de enviar de volta.

Camada de Controle de Qualidade

Adicione um filtro condicional que apenas envia imagens se elas atenderem a certos critérios, ou adicione uma etapa de aprovação manual onde imagens são salvas no Drive mas você escolhe quais enviar de volta.

Casos de Uso Avançados

Criação Direta de Anúncios Facebook

Leve esta automação além conectando à API de Marketing do Facebook. Após gerar a imagem, crie automaticamente um rascunho de anúncio no seu Gerenciador de Anúncios com a imagem e texto sugerido.

Adicione módulos da API de Marketing do Facebook após a etapa de geração de imagem. Use o prompt aprimorado para também gerar texto do anúncio, depois crie um rascunho completo de anúncio incluindo imagem, título, descrição e sugestões de segmentação.

Suporte Multi-idioma

Adicione detecção de idioma à transcrição. Com base no idioma detectado, ajuste o aprimoramento do prompt para gerar imagens apropriadas para a região e salve em pastas Drive diferentes para mercados diferentes.

Colaboração em Equipe

Configure um grupo WhatsApp compartilhado onde membros da equipe podem enviar ideias de voz. A automação gera imagens e as posta em um canal Slack da equipe ou pasta compartilhada para revisão e votação.

Variações de Teste A/B

Gere múltiplas variações de imagem com estilos diferentes automaticamente. Um prompt pode gerar uma versão fotorrealista, outro uma ilustração, outro um design minimalista - tudo da mesma nota de voz.

Anúncios Baseados em Template

Integre com templates de design. Em vez de gerar imagens completas, gere imagens de fundo que são automaticamente colocadas em templates de anúncios pré-projetados com sua marca, sobreposições de texto e CTAs.

Solução de Problemas

Mensagem de Voz Não Aciona Cenário

Verifique se seu número WhatsApp está conectado corretamente ao WhatsAble. Verifique se o webhook está ativo no seu painel WhatsAble. Certifique-se de que o cenário Make.com está LIGADO.

Erros de Transcrição

Certifique-se de que a extensão do arquivo é.ogg quando você transcreve. Verifique se sua chave API OpenAI tem créditos suficientes. Verifique se o módulo de download HTTP recuperou com sucesso o arquivo de áudio.

Imagens de Má Qualidade

O problema geralmente está na etapa de aprimoramento do prompt. Revise qual prompt está sendo enviado ao gerador de imagem. Tente ser mais descritivo em suas notas de voz. Ajuste seu prompt de sistema de aprimoramento para enfatizar as qualidades visuais que você deseja.

Imagem Não Aparece no WhatsApp

Verifique se o link do Google Drive está publicamente acessível ou compartilhado corretamente. Verifique se você está usando o web content link, não o link regular do Drive. Certifique-se de que o campo URL da imagem está mapeado corretamente.

GPT 1.5 Não Disponível

Lembre-se de que estamos usando o método de chamada API genérico porque Make.com ainda não atualizou seu módulo oficial. Verifique novamente sua URL de endpoint e identificador de modelo. Certifique-se de que sua conta OpenAI tem acesso ao modelo.

Erros de Conversão Base64

A fórmula para converter para binário deve ser exata. Certifique-se de estar usando as funções toBinary e base64 corretamente. Teste com uma imagem pequena primeiro.

Obtendo Ajuda

Para problemas de conexão WhatsApp, contate team@whatsable.app para suporte. Para problemas de cenário Make.com, verifique seus fóruns da comunidade. Para perguntas da API OpenAI, revise sua documentação em platform.openai.com.

Conclusão

Você acabou de construir uma automação poderosa que transforma ideias espontâneas de voz em imagens profissionais de anúncios. Este é o tipo de ferramenta que parecia impossível apenas alguns anos atrás - agora é algo que você pode construir em uma tarde.

O Que Você Realizou

Você criou uma automação de ponta a ponta conectando mensagens de voz WhatsApp, transcrição IA, aprimoramento inteligente de prompt, geração de imagem de ponta, armazenamento em nuvem e entrega instantânea. São cinco tecnologias diferentes trabalhando perfeitamente juntas.

O Panorama Geral

Este tutorial demonstra o princípio de automação "voz para visual". O mesmo fluxo de trabalho pode ser adaptado para descrições de fotografia de produto, postagens de mídia social, slides de apresentação, mockups de sites, ou qualquer conteúdo visual que você precise criar rapidamente.

Leve Além

Agora que você entende o fluxo de trabalho, experimente com ele. Experimente diferentes modelos de imagem, adicione geradores de variação, conecte às suas contas de anúncios, ou construa uma galeria de todas as suas imagens geradas. A base está lá - agora torne-a sua.

Pronto para Começar a Criar?

Configure sua automação hoje:

  1. Cadastre-se no WhatsAble Notifyer para conectar seu WhatsApp Business
  2. Obtenha sua chave API OpenAI e adicione créditos à sua conta
  3. Crie seu cenário Make.com seguindo este tutorial
  4. Envie sua primeira nota de voz e veja a mágica acontecer
  5. Precisa de ajuda? Entre em contato com team@whatsable.app

Transforme sua voz em visuais - comece a automatizar seu processo criativo hoje! 🚀

Perguntas Frequentes

P: Preciso de uma conta WhatsApp Business?
R: Sim, mas WhatsAble facilita a configuração. Você pode usar o sistema Notifyer deles com seu próprio número ou o serviço Bot deles com o número deles.

P: Quanto custa executar isso?
R: Você precisará de assinatura WhatsAble (começa em torno de $29/mês), Make.com (plano gratuito funciona para testes), e créditos API OpenAI (varia por uso, aproximadamente $0.04-0.08 por imagem).

P: Posso usar isso para trabalho com clientes?
R: Absolutamente! Isso é perfeito para agências mostrando conceitos rápidos para clientes ou criando múltiplas variações de anúncios rapidamente.

P: Quanto tempo leva para gerar uma imagem?
R: Geralmente 30-60 segundos desde o envio da sua nota de voz até receber a imagem, dependendo dos tempos de resposta da API.

P: Quais idiomas são suportados para notas de voz?
R: OpenAI Whisper suporta mais de 50 idiomas para transcrição, então você pode falar no seu idioma preferido.

P: Posso personalizar o estilo da imagem?
R: Sim! Modifique a mensagem do sistema de aprimoramento de prompt para enfatizar estilos específicos como "fotorrealista," "ilustração," "minimalista," etc.

P: E se eu quiser gerar múltiplas versões?
R: Altere o parâmetro "n" no seu JSON para 2, 3 ou 4 para gerar múltiplas variações de uma nota de voz.

P: Existe um limite para o comprimento da mensagem de voz?
R: WhatsApp permite mensagens de voz de até 15 minutos, mas mantenha descrições concisas (30-60 segundos) para melhores resultados.

Última Atualização: Janeiro 2025 | Contatar Suporte | Documentação WhatsAble

Palavras-chave SEO: #VozParaImagem #AutomaçãoAnúnciosIA #TutorialMakeCom #GPT15 #AutomaçãoWhatsApp #WhatsAbleNotifyer #AutomaçãoCriativoAnúncio #GeraçãoImagemOpenAI #AnúnciosNotaVoz #AutomaçãoCriativa