fala automatizador beleza Hugo aqui da aoti olha nesse vídeo aqui eu quero falar sobre transcrição de áudios do WhatsApp você que está construindo aí chatbots né com inteligência artificial para o WhatsApp e tem esse esbarrado aí né nessa questão de como transcrever o áudio do WhatsApp uma vez que o áudio ele não vem ali no formato binário né você não tem acesso ali a uma url remota né de um áudio geralmente eles vêm como base 64 tá e se você não sabe como lidar com esse formato de áudio né Como converter ele para Então você
conseguir transcrever esse vídeo aqui é para você tá então fique até o final comigo que vai valer muito a pena não se esquecendo de se inscrever aí no nosso canal Ok para você acompanhar aí todos os nossos tutoriais né semanalmente estamos lançando aqui novos tutoriais né com dicas incríveis que dificilmente você vai ver aí em outro canal tá bom e não se esquecendo de curtir também o vídeo e agora hypar tá ou seja assim que você curtir o vídeo logo embaixo vai aparecer uma opção de hypar onde você vai est ajudando né o nosso vídeo
ganhar mais impulso ainda né ou seja ganhar mais visibilidade aqui no YouTube pois se trata de um programa aí que tá em fase de teste tá então o YouTube aí já disponibilizou essa função no nosso canal e pode usar à vontade beleza bom então vamos lá e eu tô aqui com a automação já aberta aqui no ntn tá lembrando que esse conceito aqui que eu vou te ensinar Hoje ele faz parte do nosso curso de chatbot inteligente tá é claro que o curso não se resume só isso aqui tá o curso é para ensinar do
zero né ao avançado como você Construir ali um chatbot inteligente usando o l chain né o l chain se você não sabe ainda né um Framework né que está ali incorporado no ntn você poder trabalhar com múltipla múltiplos modelos de inteligências artificiais tá E uma delas é o chat GPT que é o modelo que a gente usa nesse curso tá bom então depois você pode acessar lá a o nosso site né que é auto.com.br bar cursos E aí você vai poder se matricular nesse curso aqui tá bom mas eh basicamente isso aqui que eu vou
mostrar agora como eu falei ele faz parte eh do curso tá Ou seja é uma etapa ali do fluxo do bot tá onde por exemplo se o o contato né Por exemplo mandar um áudio ali no WhatsApp o bot ele tem a capacidade de entender esse áudio né ou seja ele consegue interpretar esse áudio e aí você determina como o seu bote vai responder se o bot vai responder em texto ou se vai responder em áudio Tá e é justamente nessa parte aqui de inter tá áudio que eu quero que você preste muito atenção tá
então por exemplo nós temos aqui eh um node de web Hook tá que geralmente é o node que vem as informações ali do WhatsApp né então se você utiliza o Zap ou qualquer outra API de WhatsApp inclusive até api oficial eh as mensagens dos contatos né elas vêm aqui pelo web Hook tá E sendo que aqui a gente vai est vai estar usando um code que vai simular um web Hook então é como um web Hook que tivesse gerado ali um evento de áudio recebido no WhatsApp e aí simplesmente eu copiei ali o Jon e
coloquei aqui no code né Ou seja eu tipo mocki né moi Os dados aqui para poder utilizar aqui durante a a automação tá eh Então vamos lá deixa eu limpar aqui eu vou executando passo a passo para você entender tá então por exemplo ó primeiro nós temos aqui o output de um web Hook tá de uma page WhatsApp que recebe áudio tá então por exemplo aqui na Zap eh geralmente né o Web Hook ele vem com type PTT tá isso significa que é uma mensagem de áudio ok E aí se você for reparar ele vem
aqui com o mim Type né que é o tipo ali do do da da mídia né no caso é um um áudio no formato ogg tá E sendo que ele não te apresenta ali uma URL do áudio né ou seja não é um áudio que foi hospedado ali em um servidor e gerou ali uma url de acesso para ele não na maioria dos casos tá as apis elas entregam o base 64 do áudio tá o base 64 na verdade é a mídia né no caso aqui o áudio cript fado tá então ele acaba tendo esse
código aqui gigantesco tá então esse base 64 aqui ele ele é um base 64 URI né Por que URI porque ele vem eh com essas informações aqui antes do base 64 né o base 64 é basicamente isso aqui ó tá isso aqui tudo isso aqui para trás é como se fosse ali ah informações gerais né desse áudio né então aqui como você pode ver o o data u né ele mostra aqui também o mim Type né mostra aqui o codec utilizado né nesse nesse áudio tá e em seguida o base 64 dele que é essa
Rech aqui gigante tá então até aqui beleza tá conseguindo entender Ok então output aqui com o base 64 de um áudio que vende uma ap de WhatsApp tá E aí em seguida a gente coloca aqui um node de parâmetros tá ó vou executar de novo e esse node parâmetros ele é uma boa prática tá sempre que você vai fazer algum tipo de automação né que você precisa ali usar determinados valores né do Web Hook é interessante que você mapeie somente os campos que você vai usar tá então o Web Hook ele retorna aqui um monte
de informações tá Como você pode ver aqui porém nem todos aqui a gente vai utilizar tá então eu criei aqui esse node set né que é o node de parâmetros para mapear apenas três informações tá então eu tenho aqui o base 64 tá que é o o meu áudio né em formato base 64 eu criei também aqui uma constante né um parâmetro chamado grupo que ele é do tipo boleano né ou seja true felse eh para saber se aquela mensagem é proveniente de um contato ou de um grupo Tá Hugo por que isso porque é
muito importante você fazer essa filtragem ali do seu chatbot né para que ele não venha eh ficar por exemplo interagindo com grupos Às vezes você faz parte ali de um grupo e seu e se seu bot tiver ativado sem essa filtragem aqui ele vai ficar mandando mensagem pro grupo tá então A ideia é que você crie essa constante pra gente poder filtrar e considerar somente áudios enviados por contatos Tá e por último Aqui nós temos o tipo de mensagem que como eu informei né quando é um web Hook de áudio do do WhatsApp ao Zap
né que é a nossa pi ela entrega a mensagem com o tipo PTT Pode ser que api que você esteja utilizando venha apresentar um outro tipo tá pode ser que seja áudio Pode ser que seja sei lá qualquer outro nome aqui tá no nosso caso é PTT beleza OK então já tenho aqui os três parâmetros tá ó base 64 grupo e tipo mensagem ok só uma observação aqui no base 64 quando a gente for tratar ele aqui no NN a gente tem que passar somente a rest do base 64 então lembra que eu falei para
você que que tem a a a data ure ali do base 64 lembra que o base 64 aqui ó ele vem com esse prefixo aqui ó tá isso aqui não não vai ser utilizado tá se você tentar passar isso aqui no conversor aqui do ntn né ou seja o node que faz essa conversão que gera o binário ele vai dar erro tá então basicamente eu fiz o seguinte eu coloquei ess essa expressão aqui tá ó que seria a minha inspeção do base 64 tá E aí Usei uma função chamado split tá onde eu passo aqui
por parâmetro o delimitador tá o delimitador é basicamente ponto e vírgula base 64 vírgula tá E aí por que eu coloquei o índice um porque o split ele pega uma string e divide em duas partes então é como ele pegasse coisas que vem antes desse delimitador aqui tá que aí seria o índice zero e coisas que vemm depois desse delimitador que aí seria o índice um tá e o meu índice um na verdade é minha hash base 64 Ok ó como mostra aqui ó isso aqui seria índice zero tá ó índice zero e isso aqui
seria o meu índice um tá que é o código que realmente eu vou utilizar para gerar o binário beleza OK então depois que eu tenho os parâmetros né eu vou fazer uma verificação para saber se esse áudio aqui que a gente vai tratar ele vem de um contato né ou seja primeiro a gente vai saber se realmente é um áudio porque o Web Hook pode gerar vários eventos e esses eventos podde ser outros tipos de mensagem pode ser um texto pode ser um documento pode ser um vídeo pode ser um link tá então é muito
importante você também filtre não só se é contato Mas também se é áudio tá E aí quando eu abro aqui esse meu if tá eh repare que eu tenho uma condição que verifica o tipo da mensagem ou seja tem que ser PTT tá E que é o end né o grupo que é do tipo boleano ele tem que retornar felse por quê se vir felse é porque é um contato se vir true é porque aquela mensagem aquele áudio ele foi enviado em algum grupo e a api acabou pegando aquele evento tá então é somente se
for mensagem do tipo áudio e se for enviado por algum contato beleza bom até aqui está ok caso tiver aí um pouco confuso pode usar os comentários aí do vídeo para deixar aí sua dúvida tá bom que aí depois eu vou esclarecendo você ok E aí depois que eu faço essa filtragem né esperando que atenda aqui o a saída true né E a gente vai fazer a eu não vou falar nem a espécie de conversão é claro que ao gerar o binário tá do do áudio a gente já meio que já vai converter ele tá
então o que que você precisa entender eh quando a gente vai transcrever um áudio usando um modelo de inteligência artificial no caso aqui eu tô usando o open Eye tá o open Eye ele tem uma operação chamado transcribe Record tá onde ele espera aqui é um binário tá você tem que passar um binário tá eh e aí como a gente tem o base 64 a gente tem que transformar esse base 64 em binário tá que no caso binário é o arquivo em si né Por exemplo audio. MP3 Ok eh a gente vai utilizar esse node
aqui chamado convert file tá ó convert file tá que se eu não me engano é é o era o antigo data MOV binary né é um node que a gente utilizava muito para fazer essa transformação né de binário para para base 64 então base 64 para binário e o ntn acabou isolando né Essa função do data e move binary data né acabou isolando essa função e transformando em um node mesmo tá E aí se chama convert to file Então você vai clicar aqui tá E aí ele vai ter essa operação chamado move base 64 string
to file você pode ver que tem várias formas de converter eh aliás tem vários tipos de arquivos para você poder converter você pode por exemplo gerar um um binário de um csv de um HTML de um json de um XLS que é uma planilha tá E além de gerar esses arquivos né com base em em Jon né Você pode também gerar um arquivo a sua escolha aí você vai determinar qual vai ser a extensão dele ali eh baseado em um base 64 tá então no caso eu vou escolher essa opção aqui tá E aí quando
o node for adicionado ele já vai ser adicionado apontando aqui paraa operação que eu escolhi que é base 64 para binário né para arquivo Ok E aí aqui em base 64 input eu vou deixar a base 64 tá Por quê Porque foi o mesmo nome de constante que eu coloquei aqui tá ó lembra que eu criei uma constante aqui com o nome base me4 então então é ela que vai estar sendo referenciada aqui no meu convert to file tá então eu vou deixar aqui base 64 e aqui o nome do campo que vai ser impresso
né que vai ser gerado eu posso deixar como data mesmo tá porque data é um nome ali eh padrão para binários né quando a gente utiliza eh binários tá E aí você vai adicionar dois apption aqui tá que são os únicos né que seria o nome do do arquivo né que no caso vai ser um áudio e o mim Type dele tá então eu simplesmente coloco o nome aqui no caso eu poderia botar qualquer nome tá mas eu resolvi colocar áudio E aí eu complemento com a extensão do arquivo Ou seja eu coloco audio. MP3
Ok e o mim Type da do MP3 é áudio bar me Peg tá é claro que se você tivesse usando aqui outras extensões algo Eu quero converter para Wave eu quero converter para qual outro tipo de áudio tem tantos formatos de áudio que eu acabo até esquecendo eh enfim o tipo de áudio que você quiser eh converter aqui tá por exemplo o próprio ogg né também é um outro tipo de áudio porém o áudio ogg ele já está sendo originado pela pi tá porém ele não vem como binário ele vem como e um base 64
É claro que eu poderia aqui gerar um binário do mesmo formato ou seja ponto ogg mas se eu não me engano talvez esteja e equivocado aqui mas a maioria dos modelos de Inteligência Artificial Quando você vai passar um áudio ali com o parâmetro elas exigem que seja MP3 Tá bom então MP3 assim como o MP4 é um padrão de tipo de arquivo tá então sempre MP3 E aí o mim Type dele como eu falei é audio bar mpeg tá então basicamente só isso aqui e aí se eu executar isso aqui olha só que interessante ó
aqui ele vai ele vai bater true né porque é um áudio de um contato na verdade foi um áudio meu né Eu mandei próprio WhatsApp da Auto dando um boa noite né então é um áudio de contato consegui gerar aqui o binário dele tá então se eu chegar aqui ó abrir ó eu já vou ver o áudio gerado aqui ó em MP3 tá eu posso pré-visualizar Oi boa noite tudo bem com você Ah Esso aqui sou eu dando boa noite aí perguntando se tá tudo bem né OK E aí repare né que quando você clica
aqui em binary ó ele já vem com o nome data né que geralmente é o nome padrão como eu informei E aí você finaliza colocando esse node aqui do Open Eye tá tá no caso aqui eu estou usando o o chat GPT tá mas se você tiver usando outro outra Inteligência Artificial aí você pode usar aqui aí eu acho que você teria que usar o htp request né porque node mesmo de de inteligência artificial para transcrever áudio se eu não me engano é só Open ey se você quiser usar por exemplo o Gini né do
Google ou entre outros Sei lá o lama 3 do Aí talvez você tem que usar o htp request usando ali a api deles tá então eu vou colocar aqui o open ey tá E aí eu vou escolher essa opção aqui ó de transcribe a Record né ou seja transcrever um áudio ou uma gravação de áudio tá E aí quando você adicionar ele já vai setar essa operação aqui tá ó resarce áudio na operação transcrever áudio tá E aí por padrão ele já espera aqui um arquivo binário né com o nome data que é justamente o
nosso binário que foi gerado ali pelo convert to F tá E aí você não precisa fazer mais nada aqui tá você não precisa adicionar apption aqui só deixar assim tá E aí quando você for Executar tudo né Por exemplo ó ó lá ele gerou o binário E aí o chá de GPT já vai conseguir transcrever ele tá então vai ver que é um binário aqui aceitável né que é do tipo MP3 e ele vai conseguir transcrever aqui tá então no áudio ó oi boa noite tudo bem com você eu falo o qu Oi boa noite
tudo bem com você tá aqui ó oi boa noite tudo bem com você tá é claro que isso aqui é só um exemplo porém o áudio do contato ali poderia por exemplo ser poderia ser algo perguntando sobre algum produto ou serviço da sua empresa tá então poderia ser por exemplo um áudio assim eh Oi tudo bem Eu gostaria de mais informações sobre o seu curso ou sobre o curso X ok queria mais informações sobre a sua consultoria tá então essa mensagem aqui da pessoa né já transcrita ela já poderia entrar dentro de um agente tá
é claro que eu não vou me aprofundar nisso aqui agora até porque não é o foco do vídeo Tá mas né se você tem um agente eh de Inteligência Artificial né Você pode muito bem pegar aqui ó e apontar né o texto da pessoa transcrito como prompt tá Para quê Para que o seu agente possa responder de acordo com o que a pessoa perguntou ali pelo áudio tá então Hoje os chatbot eles não só interpretam texto né a pessoa pode mandar áudio ali que o chatbot vai conseguir se interagir com a pessoa tranquilamente tá e
como eu falei né lá no nosso curso de chatbot inteligente aqui ainda você pode determinar se o teu agente vai responder em texto ou se ele também vai responder em áudio e esse áudio pode ser por exemplo uma voz pré-definida né que já existe lá no chat GPT uma voz masculina uma voz feminina né como também pode ser uma voz clonada Hugo Como assim voz clonada você pode usar a tua própria voz para poder responder a pessoa Ok então é como o bote tivesse respondendo no seu lugar e a pessoa Ali vai pensar que é
você que está falando tá você pode também usar a voz de uma outra pessoa se você tiver desenvolvendo automação para ela tá E aí você pode por exemplo aqui em Tools né associar até uma base de conhecimento seja de um banco vetorial né onde você sobe ali por exemplo os PDF dos seus produtos dos seus serviços como também pode ser até um um banco de eh uma base de conhecimento eh armazenada em algum workflow tá você pode armazenar as informações ali em um workflow né dentro de um set e chamar esse workflow para que o
seu bot possa ter ali informações sobre a sua empresa sobre o seu produto sobre o seu serviço para poder responder de forma assertiva a pessoa tá bom então é isso aí Espero que você tenha gostado basicamente é assim que você transcreve udios do WhatsApp tá se ficou alguma dúvida deixa aí nos comentários mas se não ficou você entendeu perfeitamente e gostou não esqueça de dar um like e de hypar o vídeo para poder aí apoiar o nosso trabalho tá bom um forte abraço e te vejo em um próximo tutorial