Criando AGENTES de IA: Entenda como FUNCIONA na prática

9.55k views2900 WordsCopy TextShare

Argonalyst

Um vídeo comentando sobre o conceito de agentes de IA, o conceito que muita gente está comentando e ...

Video Transcript:

bom tem um tema que tá muito em alta hoje em dia que é a questão dos agentes de ia né em vários lugares a gente ouve falar sobre isso da criação de Agentes que utilizam inteligência artificial para resolver problemas inclusive naquele vídeo que eu postei algumas semanas atrás eu falava sobre uma tecnologia que está sendo desenvolvida que utiliza agentes para fazer engenharia reversa de softwares de forma que você consegue recriar softwares utilizando agentes de ia o que é uma coisa bem revolucionária mas o que afinal é um agente como é que a gente cria isso

né parece um conceito meio abstrato Então nesse vídeo vamos ver o que que é um ag gente Pelo menos a minha perspectiva sobre isso como é que a gente consegue criar um vamos fazer alguns testes aqui e entender um pouco mais sobre esse conceito e o uso de inteligência artificial na prática Então vamos falar sobre isso nesse vídeo então assim né Tem um monte de site de empresa comentando sobre esse assunto por exemplo no blog do Bill Gates Ele publicou esse post onde ele fala sobre o futuro dos agentes como ia pode mudar completamente a

forma como a gente usa os computadores ou nesse post aqui do World economic Forum eles falam O que é um ai ent e que os especialistas explicam como é que esse negócio funciona ou nessa matéria aqui do Financial times que a Open ai tá apostando aí que os ai Agents vão se tornar mainstream em 2025 ou nessa outra postagem aqui da mckinsey de que por que os agentes são A Nova Fronteira no desenvolvimento da ia generativa ou até mesmo publicações de empresas como a se Force por exemplo e que inclusive naquele vídeo eu comentei que

estão utilizando agentes para fazer a engenharia reversa e recriar o seos force e bom e eles mesmos estão falando aqui de o que que é um ai Agent um guia completo então Afinal o que que é isso né porque que tá todo mundo comentando sobre esse assunto para quem já conhece de Inteligência Artificial já acompanha isso H algum tempo mesmo assim o conceito de ag gente pode ficar um pouco abstrato né mas em termos simples seria a ideia de usar recursos de ia permitir que a ia consiga resolver problemas para você de de uma forma

completamente autônoma sem necessariamente você ter que ficar conversando com a ia em um chat GPT da vida mas sim desenvolver o problema que você tem e a ia vai de forma autônoma resolver isso para você e trazer o resultado então enfim aqui eu vou desenhar um pouco como é que eu imagino que é a estrutura de um agente n na minha visão um agente é na verdade um código em Python que possui ali diversas funções vários códigos e que dentro desse código tem na verdade uma chamada para uma API de alguma ia que pode ser

sei lá api da Open eii ou de alguma outra empresa como a antropic por exemplo mesmo do Google Gemini então na minha visão isso daqui é um agente é na verdade um código em Python e que tem uma chamada para alguma dessas apis de ias só que a grande diferença de um agente para um código comum seria que esse agente tem a permissão de criar outros arquivos criar outros arquivos em Python por exemplo E que esse arquivo em Python que ele tá gerando tem a permissão de criar outputs e que a gente pode entender o

output como sendo sei lá um arquivo de texto por exemplo um arquivo TXT um arquivo de Excel um arquivo de imagem também ou até mesmo uma chamada para um banco de dados ou até mesmo a geração de outros códigos e tudo isso aqui seria o output que esse arquivo pode gerar e pode ser que até mesmo esse código em Python aqui permita a chamada para alguma API de uma ia por exemplo n que aqui dentro tem algum prompt que se comunica com api da Open ai ou de alguma outra empresa de ia por exemplo então

na minha opinião isso daqui é um agente um código mãe que consegue gerar outros códigos filhos e que esses códigos filhos tem o objetivo de resolver um problema gerando normalmente outputs ou executando ações bom mas um agente ele tem que ter um objetivo né E esse objetivo ele é condicionado por um prompt obviamente e esse prompt vai dar informação do que que você quer Qual o problema que você quer resolver mas também o output desejado que você quer que esse ia Gere para você esse agente Então esse prompt ele vai condicionar um agente que vai

gerar um resultado vai verificar se esse resultado faz sentido de acordo com o output que tu tá pedindo vai cruzar isso com as informações que tu colocou ali para ele em muitos casos na primeira tentativa desse agente ele não vai conseguir acertar ele vai no fundo errar e ele vai ter que gerar uma nova tentativa comparar isso novamente com o teu output que tu tá desejando ou que você realmente quer e pode ser que mesmo assim ele não consiga resolver o problema na segunda tentativa e ele vai ter que tentar de novo até eventualmente resolver

o seu problema então um ag gente é basicamente um pedaço de código que condicionado por um prompt tá tentando resolver um problema e que esse código consegue gerar outros códigos que eventualmente podem conter outros agentes e que vão ficar girando nesse looping eterno ou até um determinado número de tentativas para resolver um problema bom e o mais interessante é que pode ser que a ia principal que tu tá usando nesse agente seja por exemplo modelo o One que é o modelo mais inteligente aí da Open ai só que nada impede que esse modelo consiga spawnar

outros agentes de acordo ali com o objetivo com o prompt que eu tu pediu para alguma tarefa mais simples por exemplo ele pode spawnar um outro agente que tá utilizando a ia do GPT 4 Omni por exemplo ou se for para resolver algum problema muito básico ele pode spawnar um GPT 4 Omni mini que custa muito mais barato ou se for uma coisa muito mais complexa ele pode spawnar outro agente ow One ou ainda outro agente ow One mini isso é uma coisa meio louca né porque o código principal pode criar outros códigos que possuem

chamadas de api e que utilizam modelos diferentes se for uma tarefa mais simples dá para utilizar um modelo mais simples e se for uma tarefa mais complexa utilizar um modelo mais avançado ou mesmo se o modelo mais simples não conseguir resolver o problema ele pode fazer uma nova tentativa usando o modelo mais avançado Esse é o grande lance de um Agente né sei lá at modelo principal ali ou pede pro GPT 4 om mini gerar um código só que o GPT 4 om mini gera um código em Python que não funciona então a gente pode

tentar gerar esse mesmo código mas usando o modelo mais avançado e que se ele também gerar um código em Python que não funcionar ele pode tentar usar um outro modelo mais avançado ainda então esse é o Grande Lance né de um prompt Inicial que vai gerar um efeito em Cadeia que tem o objetivo de resolver o problema em vários looping consecutivos então assim vamos ver um ag gente funcionando na prática né Porque só esses desenhos aí não explica com muita coisa bom ten esse código aqui que foi gerado com a ajuda do próprio owan o

que faz todo sentido né já que a gente tá criando um agente obviamente que o código deveria ser gerado pela própria ia que a gente vai usar né esse é um paradoxo que faz sentido mas enfim é um código muito simples onde a gente tá importando aqui as bibliotecas da Open ai um código em Python a gente tá passando a nossa chave de api da Open a e esse agente ele na verdade ajuda o usuário a criar códigos Esse é o prompt do sistema que a gente tá fornecendo aqui para esse agente e o usuário

pode pedir qualquer tipo de código que seja em Python pelo menos para resolver qualquer tipo de problema e o usuário ainda pode fornecer a informação sobre um output o resultado que ele deseja que esse modelo Gere e esse código aqui ele vai ficar girando em loopings com máximo ali de cinco tentativas para conseguir criar esse código que o usuário tá pedindo e se na primeira tentativa ocorrer algum erro ele vai gerar um novo código tentando corrigir esse erro ou se o código não atingir o output que o usuário tá pedindo Ele vai tentar rodar novamente

para tentar resolver esse problema e aqui a gente tá usando o modelo GPT 4 om que é um dos modelos mais baratos aí da Open ai no consumo de api e assim isso aqui é bem simples né um exemplo simples de criar um gente mas vocês vão ver que isso daqui mesmo simples desse jeito é uma ferramenta extremamente poderosa então assim eu tenho essa pasta aqui onde está salvo esse arquivo em Python chamado de Agentes Open ai foi o nome que eu dei Então vamos rodar isso daqui para ver o que que acontece Então vou

colocar esse prompt aqui crie um código que gere uma sequência de Fibonacci 10 elementos na sequência e diga o décimo elemento então seu dou enter aqui ele pergunta se eu tenho um output esperado para esse código se eu quero que ele fique correndo atrás de um determinado valor ali no output final desse código bom por simplificação eu vou colocar aqui que não temos então ele vai rodar aqui o código e ele diz que o código foi gerado com sucesso na primeira tentativa e o código está pronto para uso e foi salvo como código gerado ppai

E se a gente vem aqui na pasta que a gente tinha salvo ali o nosso agente Olhem só código gerado ppai E se a gente abre isso daqui olha só ele gerou a princípio um código que gera uma sequência de Fibonacci E se a gente roda isso daqui ó ele gerou a sequência de Fibonacci aqui e o décimo elemento é o 34 então assim o agente ali conseguiu gerar um código para nós salvar um arquivo do problema que a gente queria resolver que ok era um problema simples ali né criar uma sequência de Fibonacci mas

ele conseguiu fazer isso mas assim vamos tentar agora uma coisa um pouco mais complexa que talvez a gente utilizasse no nosso dia a dia como programador por exemplo bom aqui a gente tem o site do hacker News que é um site que agrega várias notícias de tecnologia e vamos pedir ali pro nosso agente para ele criar um script em Python que vai selecionar aqui o primeiro link né A primeira notícia do hacker News vai acessar esse link aqui o que vai fazer com que ele caia nesse site aqui e eu quero que ele consiga extrair

desse site uma informação do código fonte mas precisamente eu quero que ele consiga pegar aqui a meta property a imagem dessa postagem aqui dessa notícia então quero que ele consiga recuperar essa imagem aqui que é a imagem da propriedade de meta da primeira notícia do hacker News Esse é o objetivo do que que a gente vai pedir para esse agente o que representaria um problema real que em alguns casos a gente tem que resolver né Fazer o Web scrape de um site salvar uma imagem por exemplo então beleza vou rodar aqui o agente de novo

e eu vou colocar esse prompt aqui agora de que eu quero que ele crie um código que irá acessar o hacker News e que os links das notícias estão dentro de uma tag de link a tag a e que fica dentro de um spam na classe title Line n se eu venho aqui no recer News eu venho aqui no código fonte só para facilitar a vida ali do agente eu sei que os links que eu quero obter estão dentro da esse spam aqui ó esse link aqui que eu quero pegar então que ele deve acessar

o primeiro link dessa lista de notícias e ao acessar o link eu quero que ele consiga extrair ali a propriedade da imagem da parte de meta e salvar isso na mesma pasta do código então vamos ver se o negócio funciona mesmo e dessa vez eu vou dizer que eu quero um output Vou colocar sim aqui e bom como eu já sei ali Qual que é a imagem que eu quero que ele salve eu vou passar aqui ó o arquivo do meta Image é esse daqui então se ele não encontrar essa imagem aqui dentro lá da

notícia do hacker News eu quero que ele fique tentando de novo até ele encontrar essa imagem até que o código realmente esteja funcionando então se eu mando isso daqui vamos ver o que que ele faz ó na primeira tentativa o código não produziu o output esperado Então teve um erro ali na primeira tentativa ó na segunda tentativa também o código não produziu o output esperado Na terceira tentativa também não deu certo quarta tentativa também não rolou tô começando a ficar preocupado aqui e não foi possível gerar vamos ver por quê é e o motivo é

porque o primeiro link já mudou de lugar né não tava pedindo ali o output desse link aqui mas ele não é mais mais o primeiro agora é esse daqui que é o primeiro e que é um link do github Então se a gente pega a meta imagem desse link aqui e a gente roda novamente mandando o mesmo prompt só trocando ali o output desejado vamos ver o que que acontece na primeira tentativa não deu certo na segunda tentativa também mas na terceira tentativa Ele disse que deu certo o código foi gerado com sucesso e se

a gente vem aqui na pasta a gente vê que ele salvou uma imagem aqui que é imagem do github que a gente queria né quando a gente vem no código fonte do github é exatamente a mesma imagem então o objetivo daquele output é com iar o resultado a gente faz com que o agente fique girando em looping até chegar no resultado que a gente quer que no caso era aquela imagem ali que eu queria e esse aqui foi o código final que ele gerou ali né que acessa o hacker News pega a primeira notícia e

puxa o conteúdo do meta imagem então poderia rodar isso aqui a qualquer momento ele iria puxar ali a imagem da primeira notícia do hacker News bom então vamos testar um outro exemplo aqui vamos tentar fazer esse a gente spaar um outro agente criar um outro agente vamos tentar fazer esse outro agente criar poesias usando ia V mandar esse prompt aqui ó crie um código que gere um arquivo de texto P TXT e nele deve estar escrito uma poesia gerada automaticamente utilizando ia vamos ver se isso aqui funciona bom na primeira tentativa deu um erro mas

na segunda tentativa ele conseguiu gerar o código com sucesso e Olhem só o código que ele gerou tem uma chamada interna pra própria pidda Open ai mandando um prompt ali pedindo para gerar uma poesia original Então o a gente criou um outro agente que faz também uma chamada para peida Open ai usando nesse caso aqui o GPT 3 .5 Turbo foi o modelo que ele escolheu aqui para resolver esse problema bom e Olhem só quando a gente abre o arquivo salvo por esse agente Ele criou essa poesia aqui no silêncio da noite estrelada o vento

sussurra Segredos antigos a lua brilha em sua beleza prateada e nos convida a sonhar com nossos abrigos então cada vez que eu rodar esse código novo gerado pelo primeiro agente ele vai gerar uma poesia diferente usando a comunicação ali com a peida Open ai e assim porque que usar agentes faria sentido se bom todos esses exemplos aqui a gente Poderia gerar usando o próprio chat GPT né bom esses exemplos aqui Claro são simples mas a gente consegue ver que coisas mais complexas talvez fosse melhor colocar na mão de um agente que vai ficar fazendo várias

tentativas para resolver o problema do que ficar ali necessariamente conversando com o chat GBT Mas seria possível aprimorar isso daqui aumentar a janela de contexto usar modelos mais inteligentes que iriam ficar rodando nesse Loop Infinito Até resolver o problema e muito provavelmente isso vai evoluir cada vez mais e vai ser a forma que as pessoas mais vão utilizar esses modelos de a do que ficar ali conversando no chat GPT e dando contol control V nas coisas que a ia gera definitivamente as coisas vão evoluir cada vez mais e os Agentes Talvez seja o futuro disso