Cara, depois que esse conceito foi inventado de short memory e long memory, qualquer jeito de fazer a sua memória do teu agente ficou obsoleto. Eu vou mostrar para vocês nesse vídeo o porquê, o jeito que a gente fazia e o jeito que agora eu estou fazendo em meus agentes de a posso dizer com tranquilidade que eu sou um dos pioneiros a trazer isso no YouTube. Você pode procurar o conceito long memory, short memory aqui no YouTube, você não vai achar.
Então, sejam bem-vindos a um conteúdo extremamente exclusivo e conteúdo de ouro aqui para vocês. Para você que não me conhece, eu me chamo Marcelo Anders, trabalho com automação IA há 2 anos, sou pioneiro em agentes de A dentro do N8N. Já criei mais de 52 implementações para clientes, já criei inteligência artificial que vendeu mais de R$ 100.
000 R$ 1000 para clientes e tenho autoridade para falar para vocês que esse é um dos melhores jeitos de dar memória e contexto sobre o lead, a pessoa que o agente de A está interagindo e a gente conseguir também visualizar isso aqui de uma maneira mais macro, né? Então vou mostrar para vocês, vamos direto pra tela do meu computador. Vou explicar para vocês o jeito que a gente fazia, o jeito que a gente tá fazendo aqui hoje, tá?
E eu acho que vocês vão gostar bastante desse vídeo. Então eu acredito que por isso já merece seu like, já merece sua inscrição aqui no canal, onde a gente traz conceitos e coisas que eu geralmente o pessoal não fala por aí para vocês trazerem nos seus agentes já. Então vocês aprender com quem realmente implementa, realmente faz automações, muda de fato o jogo.
Então cara, é gratuito, não custa nada. Se inscreve no canal e vamos pro conceito e depois vou mostrar para vocês como que eu fiz, tá? Então existe hoje duas maneiras de você criar a memória pro seu agente de A, que existe a buffer, né?
A memória buffer, janela de contexto ali, que você pode colocar o heads, pode colocar o Simple Memory, pode colocar o Push Grez, né? Pode colocar até o Super Base, ã ali. Só que ela tem um problema e uma alimentação que é a sessão de tempo de vida.
Você pode até deixar zero, ela ficar infinita, mas o comprimento comprimento da janela de contexto, isso aqui faz o teu agente lembrar só cinco mensagens anteriores. Se você colocar 10, beleza, ele vai lembrar 10, vai consumir mais tokens, vai consumir mais crédito, não vai ficar tão assertivo, vai dar mais problema, vai dar mais erro, tá? Então se você aumentar muito isso aqui também não dá certo, tá?
Então o pessoal trabalha entre 5, 7, no máximo 10. E essa limitação e essa janela de contexto, vou explicar para vocês. É como eu falasse com vocês cinco vezes.
Eu falei aqui cinco frases com vocês. As a quando eu bater na sexta frase que eu tô falando, a primeira que eu falei com vocês, vocês não vão lembrar mais. Então tá aqui uma das principais limitações de você usar a memória buffer.
A janela de contexto é configurável, não é muito grande. Então o agente acaba não lembrando as mensagens lá de cima, as mensagens que passaram muito tempo, né? Então a gente acaba não lembrando.
Essa é uma das principais imitações que eu vejo no buffer, tá? E aí existe outra maneira também de você dar a memória pro seu agente, que é a maneira de colocando a threads. Então você pode ir lá no N8N, em vez de colocar use memory, você vai colocar use thread ID, que aí você vai passar uma thread ID e aí vai ter um número de identificador único.
Funciona basicamente igual o chat GPT, tá? Ele tem uma janela de contexto maior, ele vira uma tradesca, né? Então é a própria memória da inteligência artificial do chatt, mas por conta disso acaba batendo que a gente só pode utilizar o modelo do chatt.
A gente não pode utilizar outros modelos como cloud, Gemini, né? Então o threads, a o jeito de memória da threads, ele é limitado a open e o chatpt. Esse é um dos principais limitações.
E outra também que são muitos nodes, né, cara, para você fazer isso aqui acontecer, tem até um vídeo meu aqui no YouTube explicando sobre a threads, seu guia de threads, como fazer, como criar, como atualizar, né? Porém, são bastante nodes, acaba ficando complicado para quem tá iniciando agora no mercado, para quem não quer, realmente quer fazer rápido o a gente de Aar, tá? Então o trads acaba batendo nessas duas limitações.
É complicado e bastante nodes para criar, para atualizar, para mexer na threads e acaba dando erros também. que eu já implementei para clientes e acabou dando mais erros do que o buffer. Ã, mas como com erros a gente vem com melhorias e é justamente isso que eu quero falar para vocês nesse vídeo, tá?
Qual que é a solução? Como fazer isso parar de acontecer, o meu agente me lembrar melhor do meu lead, né? Ele não alucinar tanto sobre ele.
Quando a conversa tiver muito extensa, não dá problema ele continuar funcionando bem. Então pessoal, eu desenvolvi, tá, pioneiro aqui no Brasil sobre isso, que é um agente especialista na memória do LIT, tá? Então como que ele funciona?
Já vou abrir o node para vocês mostrando realmente como ele funciona. Não vou fazer o passo a passo e como realmente montar ele do zero, nem abrindo os promptos, mas se você quiser que eu traga isso aqui no YouTube, você vai comentar memória boa aqui nos comentários, que eu vou saber que vocês querem muito que eu traga um tutorial passo a passo para vocês, tá? Então comenta aqui embaixo memória boa que eu vou saber que vocês querem realmente um passo a passo.
Não gosto de soltar muito vídeo longo aqui porque acaba estragando o algoritmo do meu YouTube, mas se eu vê que vai valer a pena, que vocês estão comentando bastante, eu trago aqui para vocês. Então se inscreve, comenta aqui e entra no grupo do WhatsApp também que eu sempre solto lá quando saiu um vídeo novo, combinado? Então como que funciona?
Existem duas coisas também que eu tô utilizando já nesse agente, que é o Think, tá? Que a gente dá um contexto melhor sobre o prompt, tá? O agente acaba pensando antes de responder, ele acaba ativando, sabe o A1, o deep seek que ele aparece lá pensando resorning, né?
Acho que é assim que fala. Ele fica pensando e depois ele responde o think. Depois dessa atualização do N2N 1.
88, se eu não me engano, chegou o Think, que você pode colocar para qualquer modelo de A, pensar antes de responder. Funciona muito bem para promps complexos e ajudar a sua a pirar, né? não ficar maluco, responder coisas erradas, sair de fora do contexto do prompt, quando tem muita instrução dentro do seu prompt, o tin acaba funcionando muito bem para isso parar de acontecer, tá?
E o modelo 4. 1 da Open que acabou de sair, saiu ontem mesmo, saiu, já tô utilizando, tá mais barato, tá com uma janela de contexto maior, tá mais rápido também, tá? Então tá, coloquem de fato na sua, nos seus agentes de se você utilizava o 4 ou 4 mini.
Agora eu uso o 4. 1 mini porque tá sinistro, tá mais barato, tem mais, tem mais nada de contexto e pessoal melhor, utilizem mais barato. Fechou?
Então vamos lá, eu vou mostrar para vocês como é que ele funciona na prática, como que ele acontece. Mas resumindo para vocês, existe a memória curta, tá? Aonde essa memória curta lembra os contextos até cinco mensagens.
E aí a memóri, né, o memory longe é para lembrar informações essenciais sobre o lead. Fechou? Vamos lá então pra tela do meu TN que eu vou mostrar para vocês como que isso fica organizado e vocês vão pirar com essa solução.
Fechou? Tô aqui agora na tela do meu Nender, onde eu tô desenvolvendo essa solução já para um cliente real, tá? Onde a gente tá fazendo todo o desenvolvimento dele, tá?
Então vamos lá. Vou vou começar a conversar, vocês vão ver como que vai ficar organizada essa memória, fechou? Então, tô aqui no WhatsApp, vou mandar uma mensagem com o meu número mesmo.
Vou mandar aqui. Vamos lá. Então, mandei um olá.
Vai chegar aqui. O agente começou a funcionar, começou a processar, pegou o memóri short, né? Porque é só um olá, não tem nenhuma informação essencial sobre o lead para armazenar.
Então, deixa ele responder. Respondeu em áudio aqui. Vamos ver.
Opa, tudo bem? Pode me chamar de Lucas, posso te chamar de Marcelo Anders mesmo? Que que você se interessou em um dos nossos produtos?
Qual deles chamou mais sua? Tá? Então ele já respondeu em áudio ali.
Tem algumas coisas que a gente precisa melhorar em questão do Eleven Labs em si para ficar um áudio mais humanizado, tá? Ele tá em fase ainda de teste, a gente tá desenvolvendo. Mas vamos lá.
Então eu vou mandar uma mensagem, vou falar, pode me chamar de Marcelo, vou dar um um contexto para ele chamar lá, né? Vamos ligar ele aqui primeiro. Vamos ligar ele e vou responder aqui para ele em áudio.
Sim, sim. pode me chamar de Marcelo. É minha principal dúvida é se vocês entregam via motoboy aqui na minha região de Curitiba.
Mandei aqui para ele, tá? Acabei de fazer esse envio. OK.
Fiz o envio. Tá vendo que ele acabou de chamar o memóri? Ele acabou de armazenar informações essenciais sobre o lead, tá?
Eu vou abrir para vocês aqui, vou mostrar o que que ele armazenou, tá? Então, tá aqui a execução, já ativou o memóri, fechou. Vou dar um zoom aqui, ó, e vocês vão ver.
Então, chegou a informação nova, ó. A informação nova tá aqui, ó. O nome do Lídia é Marcelo.
Ele está em Curitiba e quer saber se entregamos via motoboy na região dele. Pegou o que tinha, não tinha nada, era minha primeira interação. Foi lá, passou pelo agente especialista em sumário e organizar a memória do lead, organizou, deletou o que tinha e aí publicou, né, a nova memória sobre ele.
Tá aqui, ó, a nova memória tá aqui sobre ele. Vou abrir aqui para vocês, para vocês ver como é que fica. Lead Summary, nome Marcelo, localização Curitiba.
Interesse saber se entregamos via motoboy na região dele, tá? Então, tá vendo que ela tá organizando tudo certinho sobre as informações cruciais sobre o lead no long é isso. Isso justamente o que tá acontecendo, tá?
Vou conversar aqui mais um pouco, vamos ver que que ele me respondeu aqui no WhatsApp. Então, tá aqui, já respondeu um áudio. Entregamos sim via motoboy na região de Curitiba.
Marcelo, fica bem mais rápido e prático. Já pensou em qual produto deseja receber aí? Fechou.
Então ele já tá ali, já tá respondendo em áudio, né? Tá em fase de teste, ainda não está melhorada essa voz, mas eu vou mandar aqui agora. Ã, tenho interesse no show rugas.
Minha mãe precisa. Vou comprar para ela. Então vou mandar aqui, ó.
Tem interesse no shorrugas? Minha mãe precisa. Acabei esquecendo de ativar, né?
Deixa eu ativar ali o fluxo antes de enviar. Vamos vir aqui, ativar o fluxo e vou enviar a mensagem novamente, tá? Beleza?
Ativei, já tá executando. Vamos ver aqui, ó. Vai achar, ó.
Acabou de chamar o memória long de novo. Então, por tem informação legal que é interessante. Eu defini as informações interessantes que é legal, que é legal armazenar no memóri, tá?
E ele foi lá e armazenou. Vamos ver quem ele respondeu. É ótima escolha, Marcelo.
O show rugas é perfeito para ajudar a suavizar rugas e dar firmeza na pele. A sua mãe vai amar o resultado. Você busca um efeito mais rápido ou está pensando em algo para cuidar contínuo para ela.
Fechou? E aí vamos abrir lá o que ele executou de long memory, tá? Vamos abrir ele ali.
Vamos ver que que ele armazenou, o jeitinho que ele deixou. Então ele pegou o que tinha, lembro que o que tinha era isso aqui, certo? Passou aqui a memória nova.
deletou o anterior e publicou o atualizado. Então, ó, Marcelo, deixa eu abrir aqui para ficar mais organizado. Marcelo, localização, interesse, produto, interesse, ó, chorrugas, né?
E para apresentar a mãe. Então, pessoal, já tá armazenando. Então, tudo que eu fosse conversando com ele aqui, vou fazer a última interação para vocês ver que realmente tá funcionando.
Fazer minha última interação, passar o último dado aqui para ele e aí ele vai ligar de fato o Long Memory, vai armazenar a informação minha, vai deixar ali. Lembrando, tá, pessoal, não fica aqui essa essa informação que ele armaa, fica no Reds mesmo. Então, ficaria fácil para mim colocar no follow-up, para mim colocar no relatório.
Ó, esse aqui é o lead. Essa aqui são as informações. Faça um follow-up personalizado para ele, pessoal.
Faria um follow up personalizado para o lead com as informações dele. Vou mostrar para vocês no finalzinho desse vídeo aqui para para vocês entenderem melhor, mas vou ligar aqui, vou testar a última informação, tá? Vou enviar aqui para ele agora.
Então, é que minha mãe tem na região aqui da da questão da testa, ela tem bastante rua, só que ela quer prevenir, sabe? Porque eu não sei se vai adiantar muito agora na idade dela para tirar, mas prevenir, dar uma ajudada, dar um fortalecimento na pele. Eu queria saber se esse chorrugas serve para isso, né?
Ã, e aí eu tava querendo dar de dia das mães agora para elas, entendeu? Vou mandar, acabei de mandar essas informações bem detalhado do que que eu preciso. Ele vai ligar e é para ligar o memory long e armazenar essas informações novas, né?
Então, beleza, chamou o memory short, beleza, passou pra frente, era para ele ter chamado memory long. Vamos ver que ele mandou aqui. Vamos abrir o WhatsApp.
Já falou assim: "Entendi certinho, Marcelo. O chorruga serve sim, tanto para suavilidade da suuga já existente, tal". Explicou sobre ele, a diferença.
É um presententão de Dia das Mães, viu? E muita gente compra para dar esse cuidado especial para quem ama. Quer garantir agora correr o risco de acabar o estoque nessa época.
Então, beleza, vou ligar aqui de novo. Era para ele ter ligado isso aqui, tá? Eu posso deixar uma regra mais específica.
Então, é justamente isso que a gente faz quando a gente cria agente de ág. A gente testa bastante, testa bastante até chegar no máximo assertivo possível, mas eu vou ligar aqui e passar mais uma informação. Beleza?
Pode ser. Eh, eu queria pagar então na entrega, né? Eu queria pagar pro motoboy mesmo.
Eh, e eu queria ver com vocês se vocês conseguem entregar para mim na semana que vem, na segunda-feira, pela parte da manhã. Vou mandar essa informação aqui. Ele vai transcrever.
Então, se vocês verem aqui, tem a transcrição do áudio, tá? Tem a transcrição do áudio. Chamou memória long, tá?
Acabou de chamar memóri. Vamos agora ver. Tá pegando do 4.
1, tá ligando ali e já respondeu. Me respondeu aqui no WhatsApp. Falou: "Ó, Marcelo, consigo sim agendar a entrega para motob em Curitiba.
O pagamento pode ser feito direto na entrega, sem burocracia, tá? Então, beleza. Ele chamou também as regiões, né, que atendem o cash on delivery, o pagamento na entrega e chamou o memory long.
O memory long que armazena as informações do le. Vamos ver o que que ele armazenou aqui. Ah, vamos ver que que tá armazenado.
Vamos abrir aqui. Vamos dar um expandir. Então, Marcelo, localização em Curitiba.
Entrega via motoboy em Curitiba. Produto de interesse ao Shorrugas, presidente para mãe. Modalidade de pagamento.
Pagamento na entrega. Preferência de entrega segunda-feira de manhã, próxima semana. Pessoal, tá vendo como ele deixa organizadinho?
Então, se eu quisesse, por exemplo, vir aqui, ó, vou só mostrar para vocês um exemplo, pegar o que tinha, fazer um agente de relatório, de relatório, não, né? Um agente de follow-up. Dá um conttrl D aqui.
Vou pegar aqui. Certo. Deixa eu ligar esse esse o pegar o que tinha, né?
Ele não vai pegar nada porque tem que est ali para pegar. Deixa eu pegar aqui então o número para pegar a informação, né? Aonde que tá?
Então, beleza. Vou colocar aqui para pegar as informações do lead. Fechou?
Voltou as informações do lead, correto? Eu poderia fazer aqui um agente de follow-up, tá? Então, informações do lead, tá?
Aqui as informações do lead. Vou fazer um follow-up bem básico aqui, só para vocês entenderem. Faça um follow up personalizado para o lead.
tá destacando a urgência e que a promoção vai acabar. Fechou? Então vou ligar agora esse agente aqui de follow-up, né?
Então ele seria um agente especialista nisso. Deixa eu tirar esse system aqui, tá? Eu preciso colocar um traigerzinho aqui só para ativar ali mesmo, ó.
Só para ele conseguir ativar ali. Então, tá, vamos testar. Então, fechou.
E esse aqui agora vai fazer um follow-up. Eu poderia dar um prompt mais personalizado para fazer um follow-up bem absurdo, sabe? Mas já tá aqui.
Ele já fez um follow-up, ó. Claro, segue sugestão de mensagem pro follow-up com o Marcelo. Olá, Marcelo, tudo bem?
Passando rapidinho para te lembrar que a nossa super promoção do Shorrugas está quase acabando. Vi que você demonstrou interesse em presentear sua mãe e prefere entrega via motoboy em Curitiba na segunda-feira de manhã. Como estoque profissional é limitado e a demanda está bem alta, queria garantir sua reserva, principalmente porque você optou.
Então, pessoal, ele acabou de fazer um follow-up personalizado com as informações que ele tinha sobre mim. Isso aqui é absurdo. A gente já conseguia fazer isso na threads, só que agora a gente consegue fazer muito melhor porque a gente faz um agente especialista na memória, especialista em lembrar as coisas sobre o lead.
Então o buffer fica livre de lembrar esse tipo de informação, lembra só o que tava conversando e caso seja necessário lembrar alguma informação sobre o lead, ele vai e chama o memóri também e obtém as informações novas, tá bom? Então esse é o novo jeito, é o novo conceito de fazer memória pro seu agente de A, bem revolucionário, que vai atender demais o seu agente de A, tá bom? E se você quer aprender de fato fazer esse tipo de agente, tá à frente com pioneiros, com pessoas que implementam, com pessoas realmente vendem implementações e tem clientes reais, você pode conhecer o checklist, que é a minha comunidade, onde tem mais de 100 membros ali que sempre estão postando sobre eles, postando vagas, postando ã conhecimentos, tá?
Lá dentro a gente faz competições para quem quem mais ajuda a comunidade, quem tem postou o melhor flow, tá? Então, a comunidade do checklist é uma das tá se tornando uma das melhores e uma das maiores do Brasil. Então, clica aqui embaixo, conheça o checklist.
Também vou deixar o miniurso para você acessar junto com o checklist, que vai te ajudar muito se você tá no início dessa jornada, tá bom? Então é isso, pessoal. Muito obrigado por ter ficado até o final desse vídeo.
Não esqueça de comentar o que eu falei um pouquinho no início desse vídeo, tá? Para se vocês quiserem que eu traga um tutorial passo a passo de como montar long memory e short memory, tá? masir lá dentro da comunidade antecipadamente para meus alunos.
Fechou? É isso, pessoal. Muito obrigado por ter ficado até aqui nesse vídeo e vejo vocês em breve.