Envie áudios por Whatsapp usando IA

5.84k views3033 WordsCopy TextShare
André Prado
Lista de Espera Curso AI Builders https://tinysaas.com.br/lista-aulas-gratis Zapster API - API não ...
Video Transcript:
E aí pessoal tudo bem Hoje eu vou direto ao ponto eu quero mostrar para você uma coisinha que eu acabei de fazer aqui usando a criação de discurso né criação de fala com openi e o WhatsApp tá eu tô usando a zst que é uma API do WhatsApp parceira Nossa aqui eu vou deixar o link aqui embaixo para você acessar lá também mas deixa eu te mostrar vamos vamos direto ao ponto eu vou entrar aqui no meu WhatsApp eu vou mandar um áudio tá então isso que eu vou falar agora é o áudio que eu
vou mandar pro meu bot tá Oi eu queria um livro do Isaac azimov por favor olha só o que vai acontecer agora nosso workflow vai começar a rodar nas últimas aulas nos últimos vídeos que que eu coloquei aqui a gente já tá tratando o áudio eu vou deixar aqui embaixo a playlist para você acessar também qual foi essa última etapa que nós fizemos aqui e ele foi lá no meu banco de dados buscar esse áudio e ele tá agora me respondendo tá você deve ter escutado aí que recebi a mensagem no WhatsApp né então vamos
lá vou mostrar o que que aconteceu Então olha só ele mandou aqui para mim Eh eu encontrei alguns livros do autorizar mol para você blá blá blá né mostrou para mim os os livros por favor escolh os livros acima pelo nome para PR seguirmos com o pedido mas o mais legal isso aqui ele já fazia antes mas o mais legal é que agora ele tá gerando um áudio aqui para nós então agora se o usuário manda um áudio pro nosso bot ele responde com áudio também se ele manda só texto o bot não responde com
áudio tá pode fazer da forma que você quiser mas eu decidi fazer assim só para mostrar as possibilidades Olha só eu vamos ver se vocês conseguem ouvir esse áudio eu encontrei alguns livros do autor Isaac asimov para você um livro Fundação preço R 55 dá pr metar velocidade dois livro Fundação e Império preço 55 três livro Eu Robô preço 60 por favor Escolha um dos livros acima pelo nome para prosseguirmos com o pedido Qual deles você deseja adquirir Então olha só e o mais legal é que vem com as funcionalidades nativas do WhatsApp né eu
tava testando aqui em cima vocês podem ver que ele tava mandando eh sem aquela funcionalidade Nativa de mudar o a velocidade também não VM com com as ondinhas né ó vem aqui com as ondinhas do áudio aqui não tava vindo eh mas enfim depois de mexer um pouquinho com a api eu consegui descobrir como que faz isso tá eh então agora nosso bot pode falar também então ele pode ver com o Vision aqui em cima também nós fizemos uma aula específica para isso eu vou deixar de novo a Playlist aqui embaixo para você ver ele
entende texto e agora e ele também entende áudio e agora além dela eu foi uma voz de mulher porque foi padrão da da openi tá eu tem várias vozes lá eu vou mostrar para você eh mas a agora ele envia o áudio pro WhatsApp e também via texto tá se o usuário responde só com texto ele vai mandar só um texto se o usuário quer falar via texto ele não vai mandar áudio se o usuário manda um áudio ele vai mandar um áudio do texto que foi criado pela openi legal né muito interessante eh eu
vou mostrar para você aqui uma versão mais simplificada disso aqui que eu tava testando e tudo isso aqui é o suficiente pra gente começar pra gente mandar áudio eh no WhatsApp tá claro que eu tô usando as apster de novo né é o e cada API de WhatsApp tem uma forma diferente de lidar com áudios tá eu confesso que eu apanhei um pouquinho aqui porque é meio complicado meio complicado de enviar arquivos via WhatsApp tá é meio chatinho como o N8 n trata isso e como as apis entendem isso Tá Mas vamos lá o que
que acontece eh quando eu clico aqui em testar ele eu tô batendo nesse http request aqui tá eu vou até mudar o nome dele eu vou colocar aqui ó gera áudio porque é isso que ele faz que que esse http request aqui na documentação da openi eu fui lá em Create Speech e eu basicamente copiei esse Curl aqui e coloquei lá tá foi a única coisa que eu fiz eu não precisei mudar mais nada além de um detalhe que eu já vou falar para você como que que detalhe foi esse que eu mudei então Aqui
nós temos essa a batendo nesse um post aqui nessa URL né tem as credenciais da openi aqui se você não sabe do que eu tô falando dá uma olhada nos me nas minhas playlists anteriores aqui que eu explico detalhadamente como que isso funciona e também né aproveitando se você quer ir mais a fundo nisso aqui entender com detalhes do que tá acontecendo e criar suas próprias automações Eu e meu sócio Felipe raitano temos um curso voltado à criação de produtos usando n8n e ia está com vagas abertas hoje eu também vou deixar o link aqui
na descrição para você entrar na nossa lista de espera no nosso grupo e lá você vai ter acesso a todas as informações que você precisa sobre o curso beleza Eh Então olha só Qual que é o modelo que eu tô usando o TTS 1 que é o único modelo hoje disponível o input aqui eu coloquei um teste né Olá tudo bem Eu sou uma vendedora de livros A voicez é a voz do nosso bot da nossa automação né E por padrão é essa aloy aqui mas você pode mudar para Eco FAB Ônix nova e shimmer
tá você pode ver o preview delas aqui nas Voice options tá então por exemplo a então tem vários tipos de vozes aqui para você escolher eu fui na padrão mesmo que não tem dor de cabeça tá mas pode escolher a voz que você quiser Se você deixar por só o o input o Model e o voice que são obrigatórios ele já vai funcionar Tá mas no WhatsApp ele vai acabar mandando a aquela linha reta ele não vai mandar com as ondinhas tá por qu porque por padrão a Open gera o mp3 para nós e o
WhatsApp trata o MP3 de uma forma diferente por sorte a openi também tem para nós aqui um campo chamado response Format olha só aqui em cima tem ó response Format e o padrão dela é o MP3 e ele é opcional então se você não colocar nada ele sempre vai criar um MP3 mas eu coloquei lá o response Format e por sorte a Open também lida com Opus e Opus é o que a gente precisa mandar no WhatsApp para que Ele apareça com as ondinhas e que você consiga mudar a velocidade então isso já melhora í
muito a experiência do usuário com a nossa com a nossa automação né então ele vai poder aumentar a velocidade diminuir a velocidade não parece um áudio Pronto né Parece que foi um áudio que realmente foi gerado ali na hora importante também que você deve ter notado no teste que essa voz é uma voz em inglês né E ela tá falando português então ela tem meio que um sotaque meio diferente eh mas é o risco que a gente corre né de usar um modelo em inglês para falar português tem outras opções para você fazer isso também
tem o Eleven Labs por exemplo que é uma uma API praticamente né basicamente que você po criar vozes até mais bem tratadas mais bonitas e tudo mais só que ele é um pouquinho mais caro tá E aqui como é para testes eu quero mostrar para você a possibilidade de fazer isso eu tô usando realmente a Open Tá mas não não se prenda só nela tem mais opções também então tô pedindo para ele me mandar aqui como Opus tá e depois que a gente gera esse áudio não é só mandar pro WhatsApp a gente precisa fazer
duas coisas antes tá tem um nó chamado extract from file que que esse nó aqui faz ele é super simples a única coisa que ele faz é pegar um arquivo e criar uma string em base 64 tá então ele assim bem Lego tá Não não é uma não é uma aula de base 64 nem criptografia e tudo mais mas basicamente ele tá tá criando eh ele tá pegando a representação desse áudio numa string num texto eh com base 64 tá que é um não sei nem como explicar mas é uma ele vai pegar o o
arquivo e vai transformar em uma string então ele vai pegar aquele arquivo que é um um objeto realmente é um binário né que a gente chama e ele vai transformar numa string e essa string pode ser manipulado por nós tá então Olha só eu vou até rodar ele aqui vou rodar só só até ele e você vai ver o que que vai acontecer então aqui no gerar áudio ele gerou né o áudio ele gerou nesse arquivo aqui se você clicar no viu você vai poder ouvir ele ou não porque eu acho que o n8n não
toca Opus tá mas se for no MP3 ele toca e mas ele gerou esse arquivo e aqui no extract from file o que ele fez foi pegar esse data aqui ó o input binary Field é o data é esse nome aqui em cima e o destinate output Field eu deixei como data também tá eu não mudei o nome deixei igual mas ele criou toda essa string aqui beleza e depois que ele cria essa string a gente não pode mandar ela diretamente pro WhatsApp por qu eu vou vou entrar aqui no WhatsApp antes para te mostrar
tá então a gente tem aqui ó eh na zst né que a app aí que eu tô usando a gente precisa mandar um arquivo imagem áudio ou Sticker como mídia não é como message tá E essa mídia ela não pode ser uma string ele é um objeto tá então ele é um um objeto que tem um formato específico que eu já vou mostrar para você o que que é então eu não posso simplesmente jogar uma string aqui que vai funcionar Tá eu tenho que criar um objeto e bem desenhado para que isso funcione é por
isso que eu criei esse Edit Fields aqui tá que é o set né que é o no set e que que eu faço aqui é super simples a gente faz o mapeamento manual dele eu criei um campo chamado payload como uma string e o que eu faço é criar esse objeto aqui ó E por que que é o objeto né porque ele tem e as chaves né de abre abre aspas base 64 fecha aspas dois pontos abre aspas colocamos toda aquela Nossa string gerada da base 64 fecha aspas e fecha Chaves então isso aqui agora
é um novo objeto então a gente acabou de criar um objeto que vai ser enviado pra nossa Open tá então eu criei tudo isso aqui agora aqui no nosso até deixa eu rodar ele aqui você vai ver que ele já gerou então ele gerou aqui o nosso payload com esse objeto aqui embaixo e esse objeto aqui embaixo é o que vai ser enviado para pro nosso WhatsApp então aqui no nosso envia WhatsApp a gente pega eh o nosso valor né que é o json p payload só que se eu mandar ele do jeito que tá
ele também vai dar erro porque ele continua sendo uma string o que eu preciso é que ele se torne o objeto então eu coloquei no final da nossa string aqui um pars json eu vou até tirar ele aqui para você ver o que que acontece Então olha só quando eu tiro ele ele vai ele é uma string Opa perdão ele é só uma string se eu testar esse step olha só ele deu um erro porque ele esperava o objeto e recebeu uma string ele não pode receber um texto uma string é um texto tá se
você não sabe a string é um texto Então como ele esperam um objeto e ele recebeu uma string a zaper falou para nós cara tá errado você precisa corrigir isso aqui isso a gente resolve criando usando esse pars Jon no final da nossa string que que isso aqui vai fazer ele vai criar um objeto ver que tem o objeto aqui se eu tirar não tem mais Se eu colocar volta ao objeto então a gente basicamente acabou de criar um objeto em cima dessa nossa string E agora se eu testar o step aqui eh ele vai
dar certo tá ele não responde nada aqui você deve ter ouvido que chegou uma mensagem e ele mandou aqui a nossa mensagem ó Olá tudo bem Eu sou uma vendedora de livros Olá tudo bem Eu sou uma vendedora de livros Beleza então funcionando a gente já tem a nossa lógica pronta eu já criei aqui um eu vou até salvar aqui então eu já Criei um módulo né para mandar áudio então sempre que eu precisar mandar áudio para alguma coisa usando as zst eu já tenho esse módulo pronto aqui aí o que eu fiz aqui no
nosso bookkeeper foi basicamente e essa parte final tá então eu não mexi mais nada lá para trás se você quer ver com detalhes como foi criada essa automação aqui eh a gente não tem vídeo no YouTube explicando como que ela foi criada do zero tá o que a gente tem é o nosso curso a gente mostra como foi criada essa automação a gente mantém essa automação lá é com detalhes para você entender do zero como que ela funciona tá então toda a lógica de chamar funções que nós temos aqui em cima toda a lógica de
gerenciar usuário de criar um assistent de rodar o assistent de receber as mensagens a gente ensina lá no nosso curso Ele tá com as inscrições abertas agora então Eh se você quer saber mais se você quer baixar essa automação aqui pronta e usando no seus projetos ela é um bônus também do nosso curso você entra lá você já pode baixar ela tá então você pode começar a usar nos seus projetos assim que você eh virar o nosso aluno beleza mas olha só o que que eu fiz aqui eu resolvi mandar áudio somente quando o usuário
manda áudio Mas você pode mandar áudio Sempre que você quiser não tem nenhum problema a única coisa que eu fiz foi criar aqui ó antes ele pegava a última mensagem que a openi trazia para nós né então a resposta da Open eu já mandava essa resposta via WhatsApp agora a única coisa que eu faço é ver se o que vem lá no web Hook na nossa primeira mensagem se o tipo dela que é o que tá aqui em algum lugar ã Ah tá aqui perdão eu tô pegando do último nó né tem que pegar lá
do Web Hook Então olha só se o tipo for um áudio tá aqui embaixo eu vou pro caminho true que é esse aqui embaixo eu vou aqui pro true aí Segue aquele processo que eu mostrei para vocês eu vou criar o áudio baseado na mensagem que a openi respondeu para nós então se eu entrar aqui você você vai ver que a resposta da openi no completed foi eh aqui ó eu encontrei alguns livros do autor isx imó para você que foi aquele áudio que nós recebemos no nosso teste tá então eu vou pegar esse teste
e eu vou mandar para openi aí eu vou transformar isso aqui num base 64 eu vou criar o payload e eu vou enviar o áudio no WhatsApp e eu também envio o texto tá caso o usuário queira ler é o áudio mas eu envio o áudio e envio o texto aí vocês podem ver que não envia áudio pro WhatsApp aqui a gente está pegando o número do usuário e a gente está mandando o json ppay load ppars json para pegar o nosso base 64 transformar no objeto então é super simples agora nosso Nossa automação Pode
vamos lá vamos vamos fazer uma recapitulação né a gente pode analisar uma imagem e responder a gente pode analisar o texto do cliente né o cliente pode conversar via texto e a nosso nosso bot vai procurar do banco de dados e retornar pro nosso cliente e a gente pode entender áudio tá e o nosso bot pode buscar no banco de dados livros tá Qualquer coisa na verdade mas no nosso caso aqui é livro e ele também pode agora responder via texto ou responder via áudio e texto pro nosso cliente legal né um bot super completo
você pode dar voz pro teu bot pode deixar ele mais pessoal também usando outros modelos de text to Speech né que transforma texto em discurso em fala enque cada vez mais a automação Beleza então espero que você tenham gostado desse vídeo se ficou com qualquer dúvida deixa um comentário aqui embaixo não deixe de de de entrar no nosso curso é um eu acho que vale muito a pena lá muita gente tem criado vários várias automações já e a gente sempre tá atualizando a gente sempre tá criando novas funcionalidades para nossas automações para encaixar melhor no
teu negócio beleza é isso aí Espero que vocês tenham gostado qualquer dúvida manda um comentário aqui embaixo que a gente sempre tá de olho para ter responder beleza abração e até mais
Copyright © 2025. Made with ♥ in London by YTScribe.com