Vamos falar aqui então de multiiagentes. Já quero ir adiantando vocês que esse vídeo aqui é para quem realmente quer aprender a criar um chatbot que realmente seja profissional. Então aí se você tá querendo criar um chatbot que apenas seja para poder tirar dúvidas ali dos seus leos, do seu cliente, fazer aquela conversinha, oi tchau, tenho isso, tenho aquilo, esse vídeo aqui não é para você, pois aqui você vai aprender como é que a gente consegue aqui criar toda uma equipe de atendimento, onde você vai ter um agente especializado ali pelo atendimento inicial, descobrir o que
que o lead está buscando, né, o motivo do contato dele ali com você. você vai ter o seu agente ali de apresentação de serviços ou produtos aí da sua empresa ou nicho para qual você tá criando aí esse agente. Você vai ter ali também o agente ali responsável por poder tirar dúvidas, tanto ali as dúvidas da empresa como também dúvidas de serviços e tudo mais. Você pode também ter um agente ali especializado para venda, que pode gerar um link de pagamento ali pro usuário, um agente que pode ali marcar uma consulta daquele usuário ali em
específico, né, que entrou em contato ali com você. Ou seja, todo um time de atendimento, todos eles conectado dentro de como se fosse um só ali atendente. E o melhor de tudo isso é que você pode simplesmente personalizar o seu time de atendimento à vontade. Você pode criar ali quantos agentes você quiser e pode também criar ali a função de cada um deles, ou seja, totalmente personalizado pro seu nicho, para qualquer nicho, você consegue estar montando aqui essa estrutura que eu vou apresentar aqui para vocês. E se tá difícil de acreditar em mim e você
tem dúvida de que isso é possível, me acompanha aqui então nesse vídeo onde eu vou apresentar aqui para vocês toda essa estrutura e de como vocês conseguem implementar ela aí dentro do seu ambiente. Vou deixar também aqui na descrição desse vídeo o material de apoio que vocês podem baixar e exportar aí para dentro do SN, que é essa ferramenta maravilhosa que a gente tá utilizando aqui para poder montar essa estrutura. Então acompanha aqui esse vídeo do zero, não pule nenhum trecho porque cada passo é muito importante. Fala pessoal, aqui quem fala é o Arman. Estamos
aqui com mais um conteúdo sensacional aqui para vocês. E eu preparei aqui um material bem especial pra gente entender um pouco melhor do que é esse sistema de multiagentes, quais são as suas vantagens e desvantagens que a gente tem na sua implementação e quais são as suas principais diferenças aí que a gente tem do modelo tradicional. Então aqui eu preparei esse material pra gente poder se aprofundar um pouco melhor, entender também como é que funciona ali dentro do Newbot de inteligência artificial e como é que o sistema de multiagente soluciona esse grande problema que todo
mundo que já criou chatbot de inteligência artificial já passou por isso. Então vamos começar aqui então a nossa apresentação. E aqui eu tô trazendo aqui para vocês um exemplo, né, de como é que funciona ali um chatpot dentro de unit, um agente só, um único só agente que vai fazer o atendimento aí dos seus leads e dos seus usuários, onde a gente vai ter aqui basicamente a questão do usuário, temos ali o prompt, a questão do usuário, né, a creding que no caso ali a mensagem que o usuário enviou pro nosso agente. Nós temos ali
o prompt, que é as configurações, funções, instruções, o perfil de como aquele agente vai responder aquele usuário e tudo mais, né? Toda a configuração do seu agente a gente passa dentro desse prompt. E temos ali também a memória, que é basicamente ali as conversas que você tem entre esse agente e esse usuário. Temos aqui o hag, né, que são basicamente os conhecimentos vetoriais que a gente vai adicionando ali dentro dessa nossa estrutura, onde a gente pode colocar ali e fax caso, né, que é perguntas e respostas, eh informações da empresa. A gente pode colocar também
ali informações sobre os teus produtos ou serviços que você apresenta, né, aí dentro da sua empresa e tudo mais. Beleza? O reg é basicamente isso. E temos ali as tools, né, que são as ferramentas que a gente tem ali dentro do nosso agente. E tudo isso, pessoal, né, a memória, o regs, tools, o prompt credit, tudo isso daqui gera o contexto, que é o que é passado pro nosso agente, e o nosso agente vai processar ali todo esse contexto para poder gerar uma resposta. Esse é o modelo tradicional que a gente tem de um único
só agente, né, o modelo mais simples que a gente cria ali dentro do unit N. E a limitação, pessoal, que a gente tem seguindo esse modelo é que esse modelo ele acaba sendo um modelo que ele pode ter um contexto muito grande quando você vai trabalhar com funções avançadas, um prompto, onde eu vou ter ali, né, basicamente dentro do meu regários arquivos, no caso ali é fac, termos de conduta, n serviços que eu apresento. Eu vou ter dentro do meu prompt diversas funções, onde meu agente vai ter que atuar com atendimento inicial, ele vai ter
que tirar dúvida, ele vai ter que apresentar um serviço, ele vai ter que fazer uma recomendação, tudo isso daqui. E além do mais ainda vou ter as ferramentas que basicamente a minha inteligência artificial vai utilizar para fazer algumas funções. Por exemplo, se ela vai fazer um agendamento, a gente vai ter lá a minha ferramenta que pode fazer uma requisição post ou get ou salvar aquilo dentro de uma base de dados. Então, quanto mais a gente vai crescendo a nossa estrutura, quanto mais funções, instruções e regras a gente vai passando dentro da nossa inteligência artificial, a
gente vai ter um contexto muito, muito grande. E esse contexto grande pode gerar vários problemas paraa sua inteligência artificial, porque ela tem ali, obviamente, tá, um limite de toques, ela vai ficar sobrecarregada com aquela quantidade de informação e vai acabar quebrando, né? trouxe aqui para vocês os cinco principais problemas que a gente pode ter aí fazendo aí eh uma estrutura de único só agente, né, e passando diversas instruções para ele, onde ele vai ter, obviamente, sua memória reduzida ou descartada, porque o contexto dele vai estar tão grande, tão grande, que o modelo pode esquecer partes
anteriores dessa conversa com o usuário, trocando aí informações ou dados importantes que o usuário mencionou lá anteriormente. Ou seja, se eu tenho um início de atendimento e nesse início de atendimento a minha a minha inteligência artificial e o diálogo que eu tive com ela, eu passei ali o meu nome, minha data, meu a data de nascimento, passei o meu e-mail, diversas informações importantes que futuramente lá no final do atendimento ela vai usar, ela pode acabar esquecendo porque esse contexto ficou gigantesco. Então ela seguiam vários passos, passo um, passo dois, passo três, passo quatro e lá
no passo cinco, onde ela ia usar essas informações, ela acabou esquecendo, porque esse contexto ficou gigantesco. Dificuldade também para poder executar funções corretamente, porque o seu prompto, óbvio que ele vai estar lá gigantesco, ele vai est enorme, porque você criou ali diversos setores de atendimento, né, diversas formas de como essa IAR vai atender. E aí ela vai ter dificuldade em saber quando executar aquela função. Ah, você tem uma função que tu vai buscar ali os horários disponíveis de uma agenda. Ah, tu tem uma função que tu vai buscar as informações de um produto específico. Ah,
você tem uma função que ela faz isso, aquilo. Ela vai ter dificuldade para poder executar isso. Esse é um dos grandes problemas que muita gente sofre também, né? Ainda mais também a gente tem aqui outro problema que a gente vai ter, né? aí a nossa inteligência mais suscetível a inconsistências, onde a Iala pode acabar basicamente aí se contradizendo com algumas informações, ela acaba ali embaralhando algumas informações que ela teve essa conversa com o usuário. Por exemplo, o usuário pergunta: "Ah, você tem esse produto aqui?" A IA ela não conseguiu, né, dizer, ó, não tenho esse
produto porque não conseguiu executar ali a a informação, né, da função. E mais para frente ali, o usuário pede uma recomendação de um produto ali semelhante, ela acaba recomendando esse produto ali que ela inicialmente falou que não tinha. Então aí a gente acaba tendo aí essa inconsistência, beleza? perda de foco também, onde ela pode acabar perdendo o foco dela, das instruções que você passou para ela, onde você passou lá de forma bem detalhada. Ah, primeiro inicie ali entendendo o que que o usuário tá buscando, depois tira a dúvida dele, se tiver alguma dúvida, depois faça
isso, depois faça aquilo. Ela pode acabar se embaralhando com isso, acabar perdendo o foco do que ela realmente deveria fazer. Beleza? Sem falar também na dificuldade para poder resumir ou esclarecer ideias aí pelo usuário, né? onde ela tem ali um contexto tão gigantesco e ela vai ter, né, obviamente que priorizar algumas informações mais importante, porque você tem muita informação ali e o que ela lê vai ser o que vai ser mais importante e o que também teria ali algum outro detalhe que ela possivelmente poderia passar ali pros usados, ela acaba deixando de passar. Então, aí
esses são basicamente os cinco principais erros que a gente tem aqui quando a gente usa um sistema de um único só agente, onde a gente passa diversas instruções e diversas funções, diversas ferramentas, diversos arquivos, onde esse agente é um agente, né, mais avançado que deveria fazer essa minha essa minha instrução de deveria fazer, né, essas necessidades que eu passei para ele. E obviamente com isso muita gente se pergunta, né, como é que a gente consegue então solucionar esse problema. Pra gente solucionar isso, pessoal, a gente cria um ambiente de multiagentes, onde a gente vai ter
basicamente esse exemplo que eu tô passando aqui para vocês, onde a gente vai ter a questão do usuário e vamos ter um carinha chamado divisor, né? um carinha onde ele vai se responsável por direcionar esse atendimento de acordo ali com a questão do usuário, de acordo com o contexto dessa conversa para uma ramificação mais adequada, que onde essas ramificações vão ser agentes diferentes, onde a gente vai ter ali um prompt A, um prompt B, um prompt C, D e E, onde cada um desses promptes obviamente vai ser para uma função específica, onde eu vou Vou
ter ali um prompt de atendimento inicial, onde eu vou ter um promp ali de tirúvidas, onde eu posso ter um promp ali para uma IAR que apresenta os meus serviços, onde eu vou ter um promp ali de recomendação, onde eu vou ter ali um promp de consulta, né, e agendamentos. Beleza? Tudo isso daqui eu posso dividir em outras inteligências artificiais, né? Então eu posso fazer aí esse divisor, tanto uma lógica de automação, né, uma lógica simples que eu posso fazer, como também eu poderia utilizar uma inteligência artificial para poder fazer isso, que é isso que
a gente vai aprender aqui nessa videoaula que eu tô trazendo aqui para vocês, né, onde a inteligência artificial, ela pode analisar todo esse contexto da conversa e direcionar essa conversa para um agente mais específico, onde esse agente obviamente ele vai utilizar, né, o um dos prompts selecionado pelo divisor, onde cada um também desses agentes, beleza, eles vão ter aí as suas próprias ferramentas e regs, onde a gente deixa basicamente ali eh uma das coisas mais importantes que mais consome ali dentro do do nosso do nosso contexto geral, que é o prompt, as ferramentas e os
arquivos, que é onde a gente faz ali o nosso conhecimento vetorial. Então, através disso, nós cria aqui basicamente contextos onde eles são basicamente divididos, né? A gente tem ali tanto prompt de atendimento inicial como as ferramentas e regs apenas para aquele agente específico de atendimento inicial, de tira dúvidas, de apresentação de serviços, recomendações e tudo mais, até porque não tem motivo eu ter um atendimento inicial onde ele vai usar as minhas ferramentas de agendamento, onde eu vou ter a minha apresentação de serviço, onde vai usar as minhas ferramentas de recomendação. Não tem por eu ter,
né, tudo isso dentro de um agente só, porque se eu tivesse dentro de um agente só, a gente estaria ali montando contexto à toa com informações que a mim e aquele atendimento que o usuário tá tendo ali agora não vai precisar e além do mais aí gastando mais caro por causa disso. Então através de um divisor a gente consegue fazer isso, né? basicamente ter diversos agentes, cada um ali com uma função específica, uma uma finalidade específica, né, mais adequado para aquela conversa atual, com aquele contexto atual. E aqui, pessoal, a única coisa que a gente
deixa ligado, né, entre esses todos esses agentes é a memória. Por que a memória? Porque a memória é algo que eu preciso manter dentro desse contexto com esses agentes. Se eu tenho um agente para atendimento inicial, um agente de tira dúvidas, um agente de apresentação de serviço, eu quero que o meu apresentação de serviço entenda que ele teve dúvidas sobre um produto específico lá anteriormente. Então eu posso começar o atendimento inicial descobrindo o que que o usuário está buscando. Ó, o usuário tá com dúvida de um produto tal. A, então a gente executa o tira
dúvidas, usar, ó, eu quero comprar esse produto. Ele falou isso lá, não tira dúvidas. Aí quando ele for vir aqui, ó, paraa apresentação de apresentação ou venda ou algo do tipo, o próximo agente conseguir entender essas conversas anteriores, esses contextos anteriores. Então, a memória é uma das únicas coisas que a gente deixa linkado entre todos esses agentes, né, que são compartilhad para depois gerar um contexto reduzido de acordo com o que a gente tem ali, eh, com essa conversa do usuário e assim executando aí o nosso agente, né, seja aí eh agentes também ramificados ou
aí prontos que a gente ramifica para depois executar um agente específico. Então tudo isso a gente consegue montar dentro ali do N2N, né, montando uma estrutura de diversos agentes, cada um especializado para um setor, um atendimento específico ali, que sempre vai est direcionando esse usuário, né, pra questão mais adequada. E basicamente as vantagens que a gente tem dentro dessa estrutura pessoal é basicamente resolver aqueles problemas que a gente viu ali anteriormente usando um único só agente e também aí que a gente consegue tá tendo também uma manutenção mais fácil dessa estrutura, onde a gente vai
conseguir trabalhar melhor um prompt, né, ali de um determinado atendimento específico, não saiu legal. Por exemplo, a meiala tá com problema de recomendação, eu já vou direto ali no meu agente de recomendação, já ajusto aquilo e também, né, a questão da organização, né, dentro de uma estrutura aí mais avançada, estrutura mais complexa. Beleza? A desvantagem que a gente tem num ambiente como esse é justamente aí a gente montar ele, né? Porque tem vários detalhe, diversas atenções que devem se ter para poder montar esse ambiente. Ele acaba sendo um ambiente um pouquinho mais complexo, né? Para
quem ainda eh não entrou nesse mundo da automação, não ainda não tá montando agente de inteligência artificial, mas depois que você entende toda a lógica, você pegou ali a pegada, você consegue montar esse ambiente de forma bem prática e bem fácil, né? É só apenas questão de lógica, questão aí também de diversos detalhes, refinamento que você faz dentro da sua estrutura. Beleza? E bom pessoal, entendendo isso, vamos aqui então aqui pro N2N e ver esse ambiente aqui na prática. Já tô com meu N aqui conectado e os fluxos que eu utilizo dentro desse ambiente são
esses daqui que vocês estão vendo, né? Basicamente eu tenho um MCP serve que mais para frente eu vou trazer detalhes, né, de como ele tá funcionando aqui dentro da nossa estrutura. Temos aqui os nossos chats de agendamento, dúvidas, atendimento inicial, beleza? E temos ferramentas, né, de agendamentos que é utilizado pel um chat em específico. E temos também um chat principal, um chat mine. Eu já trouxe ali anteriormente aqui no canal um vídeo de um sistema de multiagênos, que é um pouco semelhante com esse daqui, só que esse daqui é atualizado, né? Uma nova versão onde
a gente já faz o uso do próprio MCP para poder fazer essa ação de dividir aí esse esses nossos agentes e tá direcionando aí pra questão mais adequada, né? O agente mais adequado para aquela questão do usuário. Beleza? Então vamos ver aqui então como é que funciona toda essa estrutura de forma mais detalhada. E vamos começar aqui então pessoal pela parte aqui principal dessa nossa estrutura que é o chat principal chat main. Beleza? E aqui dentro dele pessoal a gente já vê aqui que é uma estrutura bem simples, é um fluxo bem simples, onde a
gente tem aqui preparação de valores e o nosso agente de chat principal. Esse fluxo aqui, pessoal, ele vai atuar como o divisor. Junto com o meu MCP server, ele vai ter essa função de divisor, onde ele vai fazer uma chamada pro nosso MCP serve, buscando qual o chat mais adequado para ele poder executar de acordo com o contexto e questão do usuário. Então ele é o cara que vai receber ali aquele primeiro contato, aquela primeira mensagem do usuário e ali ele vai basicamente direcionar para qual chat que vai responder aquela questão do usuário de acordo
com o contexto, de acordo com a questão. Basicamente ele tem essa finalidade, beleza? Atuando junto com o nosso MCP para que isso seja possível. E aqui dentro desse fluxo, pessoal, nós temos aqui a preparação de valores, como vocês podem ver. Opa, acabei executando aqui sem querer. Enfim, temos aqui a preparação de valores e temos aqui a execução em produção, né, que basicamente eu posso tanto aqui é basicamente fazer o teste dessa minha estrutura diretamente aqui pelo Open Chat dentro do próprio fluxo, como também eu já poderia linkar ele dentro do meu WhatsApp, poderia ali linkar
ele dentro do meu chatwot, né, fazer a integração aonde eu quero de forma bem simples e bem prática. apenas ali criando um novo fluxo que seria responsável pela chamada desse chat principal. Então esse chat principal, né, ele é basicamente é o primeiro contato aí com essa questão do usuário. Beleza? E aqui, pessoal, a gente já vai então testar aqui esse fluxo pra gente entender um pouco melhor dele. Só que antes disso, vamos fazer aqui uma análise aqui do nosso prompt, né? Do que que eu passei aqui dentro do promptente. Eu tô utilizando aqui a Openhout
como modelo e botei ali um 3.7, beleza? E temos aqui a memória, que é basicamente ali a memória responsável, né, por armazenar tanto ali a conversa do agente como do usuário, né? Então ele armazena basicamente isso, né? De acordo aí com o identificador do usuário. Cada usuário tem o seu identificador, o seu identify, que pode ser o número, pode ser ali o eh o ID ali da conversa, do chatut, enfim, onde você tiver entregando isso você pode personalizar à vontade. E aqui dentro, pessoal, vou pegar aqui o prompt, a gente entender como é que atua.
um pouco melhor que esse nosso chat principal. Beleza? Deixa eu só colocar aqui pro formato 100 páginas e OK. Aqui, pessoal, nesse prompt, eu passo aqui de forma bem detalhada e minuciosa, né, a função principal e o perfil, onde eu falo que você é um sistema de roteamento de chest inteligente. Deixa eu até elem aqui para ele poder entender, né, dando aquela ênfase com a responsabilidade exclusiva de direcionar as questões dos usuários paraos chats mais especializados. Importante, você não responde diretamente o usuário, você apenas analisa a questão do usuário, seleciona um chat especializado apropriado e
retorna a resposta gerada para esse chat sem modificações. Então, através disso, pessoal, através desse início, a gente já consegue entender que o objetivo desse prompt é o quê? Objetivo de atuar como um divisor, um roteador, onde ele vai pegar essa questão do usuário, analisar e executar o chat mais específico. E aqui tudo a partir disso, né, a partir dessa parte aqui de baixo, tudo isso aqui, pessoal, é apenas dando uma ênfase melhor e detalhando um pouco melhor de como é que ele vai fazer isso, né? Por exemplo, aqui, responsabilidades centrais, análise é a análise à
intenção do usuário, identificar com precisão o contexto e a necessidade do usuário. Seleciona o chat de eh seleciona o chat onde vai determinar qual é o chat especializado e mais adequado para essa questão. Execução de chat. Aciona o chat selecionado para gerar a resposta. Entrega de resposta fornece a resposta exata gerada pelo chat especializado sem alterações. E eu criei aqui apenas uma regrinha de meno de repetições. Isso daqui é detalhe. Isso daqui é personalizações que vocês podem fazer. Não vou nem entrar em detalhe nisso daqui não, porque isso daqui são apenas personalizações que você faz
dentro da sua estrutura. Beleza? Vocês podem personalizar isso à vontade. É apenas para quando o usuário manda essa resposta de forma muito repetitiva, eu basicamente ali direcionar para um humano. Basicamente seria isso. Para isso que eu uso esse sistema de monitoramento de repetições na maioria dos meus agentes. Fluxo de operações. Basicamente a gente detalha um pouco melhor o que que ele vai fazer, né? Ele vai receber ali a questão do usuário, analisar a intenção e contexto da conversa, verificar se tem alguma repetição, né? Se tiver alguma repetição, ele vai basicamente transferir esse atendimento. Beleza? Entrega
a resposta gerada pelo usuário, processo as instruções especiais se a resposta contiver sistema info. Isso daqui é uma regra que eu criei também, apenas personalizadas, para que eu também possa utilizar além do meu chat principal como direcionamento de atendimento, como também um chat especializado. Ou seja, eu poderia ter o meu chat ali de atendimento inicial, identifico o que que o usuário está buscando. E aí quando o usuário fala: "Ó, gostaria de saber de determinado produto, gostaria de saber de onde vocês estão localizados. esse meu atendimento, ele poder fazer a transferência do dessa conversa para um
outro chat especializado. Então eu consigo além do meu chat principal fazer essa transferência automática através do que aquele usuário está conversando ou aquela questão que ele tá fazendo, como também eu posso possar um direcionamento através de um outro chat específico, né, manualmente, né, eu posso implementar isso dentro do prompt e fazer com que a IA venha fazer isso em determinadas questões. Por exemplo, se eu tô ali tirando as dúvidas do usuário e o usuário ele basicamente faz o quê? Ele faz a mesma pergunta duas ou três vezes. Aí eu poderia direcionar isso para um outro
chat, entendeu? Eu poderia fazer isso. Ou aquele usuário, ele ele tá perguntando ali, ah, vocês são golpe, vocês são uma empresa golpista ou algo do tipo? Direcionar para um outro chat que faria algo em específico, né? tratareia uma melhor, uma resposta melhor do que o meu agente de dúvidas. Então, eu poderia, por exemplo, dividir o meu agente de dúvidas para algumas questões específicas e ter um outro agente de dúvida para outros tipos de questões específicas. Através disso, né, utilizando uma tag sistema info, onde meu agente responde com sistema info. É muito legal essa essa lógica
aqui, a gente vai entender um pouco melhor sobre ela. Processamento de instruções especiais. Basicamente isso daqui é apenas para quando nós temos ali várias mensagens que o usuário manda ali repetidamente para eu poder direcionar ele para um chat em específico, né? Ou também ali, como também eu acabei de mencionar anteriormente, algum chat fez aí esse direcionamento forçado, que aí no caso ele vai pegar o quê? ele vai extrair eh dessa minha mensagem que que começa com o sistema info, qual chat o meu chat principal deveria executar. E aí ele vai executar esse chat que foi
aí forçado, né, direcionado esse usuário aí de forma forçada. E temos aqui a parte mais importante que são os chats especializados, né, disponíveis, que são basicamente as ferramentas que a gente vai ter lá dentro do nosso MCP, que cada uma delas eu trato de forma bem detalhada. passando aí qual é a sua função principal, como por exemplo aqui o atendimento inicial, que ele é o ponto de entrada para as novas conversas, onde eu digo quando usar e quando não usar, de forma bem detalhada, de forma bem minuciosa, como vocês podem ver aqui, porque isso é
muito importante, é importante demais se detalhar isso para que o nosso chat principal ele não tenha dúvida quando for transferir esse usuário para um chat especializado e nunca também errar, né, a execução desse chat. Então, através dessa lógica aqui, vocês podem pegar, refinar, refazer aí à vontade. Aqui temos aqui, né, o nosso chat de atendimento inicial, esclarecimento de dúvidas, beleza? E temos aqui, ó, eu passo aqui o nome do chat e também o ID desse chat, porque lá na no MCP é o mesmo ID de cada uma das ferramentas, porque cada um dos meus chats
são ferramentas, né? Logo logo a gente vai ver ali o MCP, como é que ele funciona, quando não usar, quando usar. Beleza? E basicamente seria isso. Passo aqui umas regras também do que fazer, o que nunca fazer e passo algumas informações auxiliares onde eu passo aqui o identificador do usuário. Isso para eu sempre saber, independentemente de qual chat eu tô executando, quem é aquele usuário na qual aquele chat tá conversando com ele, para que assim a gente sempre use a memória que corresponde à aquele usuário. Beleza? E aqui, pessoal, vou trazer aqui o meu MCP
pra gente poder entender o que que tem o que que tem configurado lá dentro dele, né? Como é que ele funciona junto com o meu chat principal, nosso chat min. Aqui dentro do meu MCP server, pessoal, nós temos aqui funções que é utilizada pel um chat especializado, que são funções de agendamento. E temos aqui as funções que são utilizadas pelo meu chat principal, que é o nosso to chat main, onde aqui eu passo todos os meus chats, chat de atendimento inicial, chat de dúvidas e chat de agendamento, que são agentes especializados para aquele tipo de
atendimento. Então, basicamente, eu utilizo o MCP para poder adicionar essas tools. E dentro dessas tools, eu sempre vou ter aqui a nossa cred, que é a questão do usuário, e o identificador desse usuário, seja aí o o número dele, o ID da conversa ali do chatut, enfim, isso aí vocês podem tratar à vontade, né? personalizar à vontade, mas eu sempre tenho esse identificador justamente ali para poder saber ali de quem é pertence ali aquela memória, né? Sempre consumir a memória do usuário em específico, porque eu não quero informações trocadas, né? Que meu agente troca as
informações desses usuários. Então aí é por isso que a gente tem esse identificador. E basicamente o nosso to chat mine, que é o nosso chat principal, ele trabalha junto com o nosso MCP para poder identificar qual é o chat mais adequado aí para essa questão do usuário. E bom, pessoal, entendendo teoricamente melhor como é que funciona aqui o nosso chat principal e o nosso MCP serve, vamos entender aqui agora de forma mais aprofundada na prática, né, como é que funciona essa execução, como é que o meu chat principal faz a chamada pro meu MCP server,
que vai fazer a chamada pro meu chat especializado. Pra gente testar é muito simples. Eu vou vir aqui em executar, beleza? pra gente visualizar aqui a resposta que a IA vai retornar pra gente. Vou fazer um teste aqui. Eu vou falar oi. Nisso que eu vou falar oi, o nosso agente vai executar, vai fazer a chamada, né, aqui pro nosso modelo que vai também buscar a memória. E através desse contexto ali da memória e a questão atual do usuário, a gente vai fazer a execução do MCP, né? A IAR vai fazer a chamada do MCP.
E aí nisso que ela vai fazer essa chamada do MCP. Nosso MCP vai ser executado e vai junto com AAR decidir qual é o chat mais adequado para essa execução. Então aqui, ó, vamos ver o que que a nossa nossa MCP retornou. Retornou Output, né? No caso ali é a resposta que outra IA retornou, que no caso é uma IA especializada. Lembrando que essa IA é IA de divisão, né, que vai selecionar a IA especializada junto com o MCP. E assim ele vai retornar a mesma resposta dessa IA. E aqui a outra IA respondeu: "Olá,
que prazer em recebê-lo. Como está se sentindo hoje? Posso te ajudar com algum tratamento específico?" Foi a resposta que a nossa IAR trouxe através ali do MCP, que no caso é a mesma que a IAR aqui também está me respondendo. "Olá, que prazer recebê-lo, como está se sentindo hoje? Posso te ajudar com algum tratamento em específico?" E no caso também o meu agente principal retornou a mesma coisa que foi a mesma coisa retornada, né? A mesma informação retornada lá pelo chat específico. Aqui no meu MCP, se eu clicar aqui em execuções, eu vou conseguir visualizar
o que foi que aconteceu aqui. No caso aqui, ó, última execução foi essa. E aqui a gente vê, ó, atendimento inicial. Lembra que eu mandei um oi aqui? Se eu vir aqui, ó, no meu MCP, no caso aqui, se eu vir aqui na na minha ferramenta do chat especializado, lá tá sendo passado oi, né, que no caso aqui a cred será a questão enviada pelo usuário e será aqui também é o identificador desse usuário, né, justamente ali para poder auxiliar na questão das memórias. E aqui eu vou agora acessar o fluxo desse chat, que no
caso é o chat de atendimento inicial. A decisão que o meu MCP junto com que o meu agente decidiu, né, de qual chat executar, foi baseado no contexto lá no meu prompt, tá? Que para atendimentos iniciais vai ser direcionado pro chat especializado de atendimento inicial. E aí, então, ele executou esse chat aqui, né, o chat a atendimento inicial, que é um fluxo de chat lá dos meus chats, né, como eu mostrei para vocês, no chat especializados. E ele executou aqui, ó, uma execução de produção e veio aqui oi, que no caso foi a minha cry,
a mesma cry enviada aqui, como vocês podem ver. Olha que legal. E aqui o meu identificador. Então, basicamente funciona dessa forma. Todas as execuções que eu vou ter lá com a minha integração, seja com WhatsApp, um chatwood ou algo do tipo, eu vou linkar ele com o meu chat principal. O meu chat principal vai receber essa requisição, vai executar o meu agente, o meu agente que vai ter o a função de classificador, né, de divisor, que vai analisar o contexto, a memória, a questão atual do usuário para decidir junto com a gente o MCP, qual
o melhor chat, né, executar para aquela questão. Então funciona dessa forma o sistema de multiagentes, onde aqui a gente vai ter dentro do nosso N8N, deixa eu mostrar aqui para vocês, dentro do nosso N, só recapitulando aqui, todos os meus chats. Olha, eu tenho um chat aqui especializado de atendimento inicial, tenho um chat especializado de dúvidas, tem um chat especializado de agendamento. Eu tenho esses três chats especializado que todos os três estão conectados dentro do meu MCP. Beleza? E esse meu chat de atendimento inicial, ele tem como objetivo apenas identificar a questão do usuário, o
que que o usuário está buscando, para que assim eh o próprio chat principal, como também o próprio chat de atendimento inicial fazer esse direcionamento, sendo possível fazer esse direcionamento pelos dois lados, que logo logo a gente vai ver mais para frente como é que eu utilizo isso, né, esse multidirecionamento que eu posso tanto direcionar do atendimento inicial para dúvidas ou agendamento ou eu posso fazer com que o meu próprio chat principal faça esse rede de accionamento automático. Então vocês têm esses dois métodos que eu utilizo ele até mesmo como contingência. Mais para frente a gente
vai ver um pouco disso. Vamos agora aqui continuar conversando aqui com o nosso agente pra gente entender um pouco melhor, né, ainda mais como é que ele funciona, como é que o nosso MCP também faz essa troca ali de agentes, né? E aqui pra gente testar isso é muito simples. Eu vou falar aqui, ó. Eu gostaria de saber mais sobre, eu gostaria de saber mais sobre vocês. Foi essa a questão que eu enviei aqui pro meu chat principal. Veja aqui que eu tô executando o chat principal. Sempre eu vou executar ele, beleza? quando eu quero
testar o meu sistema de multiagentes. E aqui ele vai executar, obviamente o nosso agente, que vai executar o nosso MCP, que através deles dois aí, tanto do agente como MCP, vão decidir qual é o chat que vai ser executado. E vamos ver aqui, deixa carregar aqui, ó, a última execução. E estamos aqui, ó, executou o nosso chat de dúvidas. Então aqui o nosso chat principal novamente recebeu essa essa execução, analisou a questão atual do usuário e analisou também ali o contexto da conversa da memória. E aí em seguida, né, ele fez a execução do nosso
MCP, que o nosso MCP junto com o nosso agente escolheu qual seria o chat mais adequado para fazer essa execução, que no caso foi o dúvidas. Olha que legal. E assim ele vai executar o dúvidas até eu continuar tendo dúvidas. Eu tive dúvidas da empresa, beleza? Como eu tive dúvida da empresa, ele vai me responder as dúvidas sobre a empresa. Que ótimo. A bela estética é especializada em tratamentos faciais, corporais, personalizados. Você tem interesse em conhecer alguma área específica, facial ou corporal? Vou falar aqui. Eu quero saber sobre o botox. Então, enquanto eu tiver com
dúvidas, né, através do meu prompt analisando isso, entendendo isso, enquanto o meu prompt entender que eu estou com dúvidas, ele vai me permanecer no mesmo chat de dúvidas. Olha que legal. Então, acabei de fazer aqui essa questão, né, essa essa dúvida aqui, passei para IA. A IA, ela executou novamente o nosso MCP. Ela sempre vai fazer essa execução do MCP e continuar em dúvidas. enquanto eu estiver com dúvidas, vai continuar em dúvidas, beleza? E ali quando no momento quando eu tiver interessado em um produto, em fazer um agendamento ou algo do tipo, ela faz esse
direcionamento. Beleza? E aqui, ó, claro, botox é ótimo paraizar eh suavizar rugas e alinhar expressões. Você já fez a aplicação antes ou será a primeira vez? Posso explicar melhor como funciona. Olha que legal. Beleza? Então aqui nós temos aqui o nosso chat de, deixa eu localizar ele aqui, ó, dentro do nosso MCP de dúvidas, que dentro dele, pessoal, eu também posso personalizar ele à vontade, beleza? Eu posso colocar o meu prom para poder tirar as dúvidas de todos os serviços, como também eu posso adicionar o meu reg aqui, um conhecimento vitorial junto com quedrante. Olha
que legal, eu consigo fazer muita coisa aqui dentro desse chat especializado, consigo colocar funções aqui dentro dele e tudo mais. Eu posso personalizar à vontade esse chat, posso ter um prompt gigantesco ali para ele, a forma que ele vai abordar, se ele vai ser persuasivo ou não. Tudo isso eu consigo fazer aqui. Beleza? E o prompt que eu passei aqui dentro dele, pessoal, é um prompt que ele tem esse simples objetivo de apenas apresentar os produtos pro usuário, né? Eu coloquei as informações aqui dentro, beleza? Porque eu tô trazendo aqui um exemplo para vocês que
tem o quê? cinco serviço que eu criei, bem simples. Agora, se eu fosse trabalhar com serviços, com forma de bem mais detalhado, uma descrição maior, né, trazendo aí aquela qualidade melhor, e eu iria colocar dentro de um conhecimento vitorial, beleza? E aqui dentro ele tem esse objetivo de simplesmente aí apresentar esse serviço pro usuário e direcionar esse usuário para um agendamento após tirar todas as dúvidas dele relacionada a um produto que ele teve interesse. Então aqui eu criei uma regrazinha basicamente o quê? que ele vai ter a responsabilidade central de entender o que o usuário
está buscando, né? Realizar algumas perguntas que ajudam a entender melhor a necessidade, esclarecer as dúvidas do usuário, estimular o cliente a seguir a consulta de forma consultiva e, por último, direcionar para um agendamento, né, apenas quando o usuário tiver interesse naquele produto ou serviço que ele teve a dúvida. Então aqui, ó, ele tá basicamente criando aqui aquela empatia, entendendo um pouco melhor sobre a minha dúvida sobre o botox, né? Claro, é ótimo para eh suavizar rugas e alinhar expressões. Você já fez a aplicação antes a primeira vez? Vou falar aqui, ó. Primeira primeira vez. E
a gente vai ver ele continuar no chat de dúvida e executar ali o nosso funil de fazer aquela pessoazão, de querer jogar um usuário para um agendamento. Olha que legal. Entendi. Para a primeira aplicação essencial fazer uma avaliação personalizada. Posso agendar uma consulta para você conhecer os detalhes e tirar suas dúvidas com os nossos especialistas. Gostaria. Então ali ele entendeu as dúvidas do usuário, tirou a dúvida ali sobre o Botox, né, em específico, um produto em específico que o usuário mencionou e entendeu que o usuário estava interessado naquele produto e fez uma sugestão de marcar
uma consulta. E se o usuário quiser, né, se o usuário falar sim, o que que vai acontecer agora? Ele vai direcionar esse atendimento pro agendamento. Olha que legal. Então aqui, se a gente vir aqui em execuções, ó pessoal, vou interromper aqui esse vídeo para falar algo bastante importante aqui para vocês, que não é fácil a gente combater o algoritmo no YouTube, que quando a gente vai fazer uma busca por algo, normalmente ele nos recomenda vídeos que são apenas explicações ou reviews de uma tecnologia onde a gente não consegue colocar nada em prática. E meu objetivo
aqui no YouTube é justamente trazer esses conteúdos escassos, onde a gente vai conseguir colocar eles em práticas e enriquecer também a nossa comunidade. Então, se você tá entrando agora nesse mundo da automação ou já pertence a ele, assim como muitos que já me seguem e ainda não é inscrito nesse canal, se inscreva no botão aqui logo abaixo. E se você for inscrito, não esqueça de curtir esse vídeo e compartilhar para quem está precisando bastante desse conteúdo, até porque a sua ajuda aqui será muito mais do que bem apreciada, porque estamos com a meta de 10.000
inscritos. E batendo essa meta, eu vou trazer aqui para vocês dois vídeos por semana. Isso mesmo, o dobro de conteúdo, o dobro de desenvolvimento, o dobro de conhecimento aqui para vocês. Então vamos juntos aqui bater essa meta de 10.000 1000 inscrito. E vamos voltar aqui pro vídeo. Vou vir aqui em execuções. Ele já tá executando o nosso MCP aqui. Se eu vir em execuções, o que que vai acontecer? Vamos visualizar aqui, ó. Ele pegou, executou lá o de dúvidas. Beleza? Vamos ver aqui, ó. No caso, tá aqui a última execução. Foi no caso aqui o
de agendamento. Só que, na verdade, observa aqui, ó. Eu tive essas duas execuções aqui, que no caso foi o quê? Ele executou o nosso carinha de agendamento, nosso produto de agendamento e executou também a nossa função de buscar disponibilidade, porque eu coloquei tanto chats especializados como também o chat é de o chat, não, as funções, na verdade dos chats especializados aqui dentro, ou seja, tem chats especializados aqui em cima que é atendimento, dúvidas e agendamento, e tem as funções desses chats especializados aqui embaixo. Então aqui basicamente ele primeiro executou o nosso chat de agendamento, que
o nosso chat de agendamento, eu vou abrir ele aqui pra gente entender um pouco melhor sobre ele, que ele tem uma função lá de buscar os horários disponíveis, no caso aqui, ó, MCP Agendamentos, onde eu tenho as funções de buscar os horários disponíveis, marcar a consulta e cancelar uma uma consulta ou fazer a remarcação dessa consulta, que são ferramentas que estão aqui também dentro do meu MCP, como vocês podem visualizar aqui dentro, beleza? Beleza? Então ele fez a execução do chat de de agendamento, chat especializado através do MCP e também o chat de agendamento, que
é um chat especializado, executou aí as nossas funções que também estão dentro do MCP. Olha que legal. Então eu consigo cobrar também tudo isso aqui dentro do meu MCP e deixar o nosso MCP trabalham com todas as funções, seja aí com questões de regra, funções aí de agendar consulta, fazer uma requisição, salvar alguma coisa na base de dados, né? Registrar aquele usuário dentro de um CRM. Tudo isso eu consigo fazer aqui dentro do meu MCP também ali junto com meus chats especializados. Olha que legal. Então, basicamente ele atua dessa forma, sempre entendendo ali a questão
do usuário e direcionando pro chat mais adequado. Beleza? Então eu poderia conversar aqui com um usuário, escolher um horário, beleza? Ali que eu quero e marcar essa consulta, né? Fazer o agendamento dessa consulta que vai agendar lá dentro do meu calendário, né? Esse exemplo aqui de agendamentos já mostrei anterior. Vou deixar até um card aqui em cima mostrando para vocês aí sobre esse vídeo, caso vocês queiram fazer um sistema de agendamento aqui dentro do new. Beleza? E bom, pessoal, ele trabalha basicamente dessa forma. E aqui dentro temos um pequeno detalhe, né, que eu falei que
ia mostrar para vocês. Agora eu vou apresentar aqui, que é um macete que eu utilizo também para que um chat especializado ele consiga fazer o direcionamento para um outro chat especializado quando o nosso chat principal cometer algumas falhas, né? Porque às vezes tem essa dificuldade pro nosso chat principal entender quando direcionar eh aquele lead de de um chat para outro. Beleza? Normalmente a gente vai usar isso quando a gente estiver consultando informações, eh, várias várias informações do usuário, né, gerando o formulário. Ou seja, se eu quero lá nas dúvidas coletar primeiro as informações dele depois
para direcionar pro chat de agendamento, eu poderia fazer com que o meu chat de dúvidas primeiro coletasse todas as informações e depois direcionasse ele para um chat específico, que aqui entra aquela questão que eu mencionei anteriormente para vocês, que é o quê? que é a questão do nosso sistema info. Observa aqui que eu tenho aqui basicamente, né, é um processo, deixa eu localizar aqui, fluxo de operações aqui, ó, processar instruções especiais se a resposta contiver sistema info. Então, se algum chat especializado meu responder sistema info, isso significa que eu vou ter um fluxo de operação
especial para ele, que temos aqui, ó, processo de instruções especiais. Execuções de chats em sequência. Quando a resposta de um chat especializado contém sistema info, executar, e aqui eu passo o nome do chat. Aí o que que ele vai fazer? Ele vai executar esse chat. O nosso chat principal, ele vai receber essa resposta para um chat especializado e vai executar esse outro chat aqui, aquele chat especializado anterior fez a solicitação. E isso é muito legal porque a gente tem uma contingência melhor. Beleza? Esse chat aqui principal, ele não ele não tá cometendo os erros, né?
Porque eu fiz um prompt bem documentado, bem detalhado, entendeu? Então, dificilmente ele vai cometer algum erro, dificilmente ele vai repetir ali um chat e quando ele deveria executar outro, beleza? Mas a gente pode utilizar isso como uma segunda camada de proteção, OK? Que aí no caso, quando a gente receber, ele vai extrair o nome do chat que ele detalhou, beleza? e executar esse chat e responder o usuário com a resposta desse outro chat sequencial. Então ele pode ter uma execução cascata, né, que ele vai executar vários chats até ter ali aquela resposta que ele precisa
ter. E eu utilizo isso tanto no meu chat de dúvidas como no meu chat de atendimento inicial. Vamos ver aqui, ó. Chat atendimento inicial. Eu vou abrir o prompt dele aqui e mostrar para vocês como é que eu estruturei esse esse prompt aqui desse chat, ó. Opa, deixa eu colar aqui certinho. Beleza. Aqui, pessoal, passei aqui função principal, responsabilidades centrais, o perfil, padrão de comunicação, né, e os exemplos de interações e o fluxo de atendimento. O que importa aqui esse fluxo de atendimento? O fluxo de atendimento dela é o quê? Primeiro esclarecer ali as dúvidas
do usuário, né? A gente vai ter uma um protocolo que vai trabalhar aqui com dois fáis principais, né? quer entender primeiro o nosso fluxo de dúvidas e o nosso fluxo de agendamento de consultas, beleza? Onde ela entende, eu passo aqui para pro nosso pra nossa IA através do prompt, passando para ela aqui, eu tenho um chat que ele, a função dele vai ser o quê? Um agente que a função dele é o quê? Identificar o que o usuário tá buscando e direcionar para uma outra etapa quando entender o que esse usuário está buscando. Então aqui
eu passo para ela o quê? Ó, Amanda tem a função principal de identificar com precisão que os o que o cliente tá buscando e direcionar pro chat mais adequado de forma acolhedora, eficiente, consultiva. Seu atendimento visaem sempre garantir que o cliente encontra a orientação certa, seja para esclarecer dúvidas, receber uma consultoria estética ou agendar um procedimento. Beleza? Então, basicamente através disso aqui, a gente já entende que ela apenas deve entender o que o usuário está buscando, é direcionar esse usuário para um outro chat especializado. Então aqui a gente tem essa função e normalmente o chat
principal ele já entende isso de cara. Quando eu falo que eu tô com dúvida de uma empresa, ele já entende para qual direcionar. Mas caso ele tenha alguma dúvida ou caso ele acabe errando, nós vamos ter aqui essa contingência de possar, porque o nosso chat inicial de atendimento inicial passa o direcionamento para o chat de dúvidas, quando o usuário tiver dúvidas ou para agendamento quando o usuário quiser fazer um agendamento. Olha que legal. Então a gente também consegue estar fazendo isso dentro de um chat especializado, fazer com um chat especializado que consiga fazer a chamada
de outro chat. E bom, pessoal, é assim que a gente consegue criar uma estrutura de multiagentes aqui dentro do N2N. E esse método que eu ensinei aqui vocês utilizando o MCP é um dos melhores métodos, porque com ele a gente consegue ter uma precisão maior aqui dentro da execução dos nossos chats especializados. Existe outros métodos, é claro, já apresentei aqui outros métodos antes aí do lançamento do MCP, onde a gente utilizava os fluxos diretamente aqui dentro do agente. Só que hoje, como o MCP traz uma precisão melhor, obviamente que a gente não pode esquecer de
tanto documentar bem ali a nossa ferramenta, o nosso chat especializado, como também no prompt, qual chat a IA vai executar, quando executar e quando não executar, para que assim a gente tenha uma estrutura que ela sempre vai executar na etapa que a gente quer, no contexto que a gente quer, o chat mais adequado para aquela situação. E bom pessoal, chegamos aqui ao final desse conteúdo sensacional e eu gostaria de deixar um alerta aqui para vocês que eu vou deixar na descrição desse vídeo todos esses fluxos que eu fiz da utilização aqui desse conteúdo, beleza? Todos
os portes vão estar aí para vocês baixar e exportar pro seu Nin para vocês tanto testar ou adaptar aí pro seu nicho, onde vocês vão conseguir aí fazer a utilização aí da mesma forma que eu consegui utilizar aqui. E bom, pessoal, outra coisa que eu não posso deixar aqui de comentar é que se vocês gostaram desse vídeo, não esqueçam de deixar o like e comentar aí nos comentários se esse conteúdo te ajudou de alguma forma. E se vocês querem ver mais conteúdos como esse, também não se esqueça de se inscrever no canal e marcar o
sininho para que assim você consiga receber as notificações aí quando sair um conteúdo novo aqui no canal, onde toda semana eu vou estar lançando aí um vídeo