Unknown

0 views10493 WordsCopy TextShare
Unknown
Video Transcript:
Boa noite seja muito bem-vindo a mais uma live aqui no canal ciência dos dados Meu nome é Eduardo Rocha e hoje eu tenho uma missão incrível que é tentar trazer para você um conteúdo denso um conteúdo que tende a ser pesado só pelo nome mas de uma forma leve e Baby Steps nós estamos aqui na semana de aquecimento do treinamento ai Experience que vai acontecer na semana que vem e o meu grande objetivo nessa semana nesse período de aquecimento é trazer para você aquele conteúdo que vai te ajudar no desenvolvimento do projeto que a gente
vai fazer junto então minha grande missão é compilo em uma semana um conteúdo que ele é hiper denso tem que trazer para você isso de uma forma bem simplória para quando a gente chegar lá na semana que vem a gente fazer um Case aí para você guardar no seu portfólio para você eh decidir se você quer dar um passo além e é isso aí agora Ah nós já estamos aqui na quarta aula então eu recomendo que você aproveite bem essa semana até domingão para você zerar esse conteúdo Então se deixou algum para trás dá uma
olhada no seu e-mail pega os anexos Ah pega todos os códigos refaça os cases que a gente tá desenvolvendo aqui já digo para você que Ah esses projetos que a gente tá fazendo aqui eles são muito valiosos mas muito valiosos mesmo eles trazem um conhecimento agregado Ah e é e eu ia falar incomensurável né nem sei se essa é a palavra mas ele traz um conhecimento agregado cabuloso coisa que talvez você demoraria alguns semestres estudando com afinco para compreender tudo isso então aproveite bastante esse conteúdo tamo junto combinado ah preciso de dizer para você que
na vai vai rolar o treinamento na semana que vem hoje nós vamos falar de aprendizado por reforço e o aprendizado por reforço ele é o coração dos agentes de ia né então a o tema do ai Experience é o fato da gente conseguir desenvolver agentes de Ea que navegam pela web ah de forma completamente customizável né então por isso a gente não tá utilizando no code a gente não tá utilizando aquelas ferramentas que porventura possam ingessar você muito pelo contrário a gente só tá desenvolvendo as aplicações aqui muito mão na massa de forma bem com
python para que você possa customizar E hoje você vai ver que se você quiser pegar esse conteúdo e dar um passo mais profundo de forma que você possa desenvolver aplicações mais profissionais mais alhadas mais personalizadas mais customizadas você vai conseguir hoje eu vou mostrar para você como que bibliotecas como crio ai foram desenvolvidas inclusive Tá bom então ó hoje você vai entender todo esse contexto Para quê Para que quando você se encontrar em um grande desafio de desenvolver algo bem direto para um problema Empresarial que eu tenho certeza que isso vai acontecer né é um
grande objetivo da grande maioria das pessoas que querem aprender esse conteúdo você vai estar aí com a um direcionamento ah que eu acredito que é um direcionamento que vai te ajudar a Navegar aí por onde você precisa tamos junto Beleza então o meu grande objetivo é isso é montar aqui os pilares para que depois Ah você consiga voar com as próprias asas e correr com as suas próprias pernas eh não quero você refém nem de ferramenta nem de uma programação específica Ah nem de de de Saas não aqui você eu quero trazer para você A
liberdade de você aprender essa parada e customizar do jeito que for necessário estamos junto beleza essa é a minha abordagem é uma abordagem que eu procuro trazer exatamente para diferenciar do mundão de conteúdo que você tem né eu tento encontrar uma forma de agregar o cono o conteúdo de uma forma diferente e eu espero que esteja te ajudando tamo junto Beleza cara ah você precisa estar inscrito no a Experience você vê que eu não falo com quem quem não está inscrito nós temos aqui aproximadamente umas 6 7.000 pessoas inscritas Então são muitas pessoas eu não
consigo ler todos os comentários eu não consigo mandar mensagem para todo mundo que me manda já vou pedindo perdão tá bom porque realmente é muita gente eu fico muito feliz mas por outro lado eu não consigo também responder todo mundo do jeito que eu gostaria de responder mas ah o meu time tá compilando tudo aqui da melhor forma possível para que a gente possa trazer ali o conteúdo mais direcionado possível tá bom Inclusive eu tô instigando você a fazer um treinamento que vale a pena e que você tenha resultado né eu a gente vai sortear
um notebook para todo mundo que participar dessa parada aqui de forma completa para todo mundo que engajar para todo mundo que quiser ter um resultado de verdade né eu vou sortear esse notebook então vai lá pegue as regrinhas que estão aqui beleza ó aqui já é o nosso material do aquecimento número quro só falta mais mais um e você vai ter aí mais dois dias que é o sábado e domingo BR zerar o conteúdo depois eu vou tirar do ar vou jogar dentro da formação a Experience é claro e você Ah precisa aproveitar então esse
conteúdo aqui enquanto você ah enquanto você tá aqui comigo nesse nesse grande aquecimento pro evento da semana que vem beleza cara tamo junto então bora para cima porque hoje a gente vai falar de aprendizado por reforço e cara se tem um conteúdo que é assim ele não é trabalhado com tanta profundidade na web Até mesmo porque ele é um conteúdo eh que tende a ser muito difícil de ser explicado então eu tenho uma missão muito grande aqui de explicar essa parada para você só fazendo uma pequena recapitulação a gente falou de Agentes criamos agentes com
uma biblioteca já pronta na primeira aula que é o Crew ai uma excelente biblioteca depois a gente trabalhou com os grandes modelos né Para que você conheça o mundo dos llms que são os modelos Ah que os agentes podem utilizar para fazer o seu o seu o seu trabalho né como os modelos do Google meta Open ai e por aí vai nós encontramos um grande um grande meio de fazer com que os agentes passam a ser um pouco mais espertos do que eles já são que é por meio do rag né que é o retrieval
aed Generation e esse essa técnica de e a generativa ela é muito boa você já conhecia algumas algumas ah Vertentes né dessa desse Ramo e eu te apresentei uma ontem diferente né que é trabalhando com os vlm né que são os visual language Model os modelos de linguagem ah visual é então cara tudo coisa muito nova e hoje eu tenho a missão de falar sobre aprendizado com reforço amanhã a gente bate uma martela no conteúdo que eu acho que é é importante você zerar pra gente fazer o treinamento na semana que vem tá bom vai
ter certificado também se você quiser Beleza vai ter certificado todo mundo que cumprir essa parada aqui vai ter o certificado aqui também a ciência dos dados ah sempre tá trazendo o certificado para todo mundo que precisa de de de alguma forma eh desses certificados né não que eu acha que isso seja a a melhor das coisas né mas é importante também eu inclusive tenho que compartilhar isso que hoje a a gente vem dando um valor muito grande nessa parada tamos junto Bora para cima Ah qualquer coisa joga nos comentários aí que eu no final vou
dar aquela zerada no no nosso chat se porventura você já ficar com uma dúvida enquanto eu vou falando aqui você já coloca no chat aí combinado tamo junto Bora para cima Então vamos lá cara eh se você porventura ficar com dúvida no sorteio do notebook vai tá aqui a regrinha tá bom a regrinha vai tá aqui nesse link esse link vai te falar O que que você precisa fazer amanhã o time deve liberar a o acesso à área do discord aonde a gente vai ter lá os materiais de cada uma das aulas bonitinho tudo separadinho
beleza bem direto ao ponto sem span não tem nada de span você sabe que eu também não gosto dessa parada é só pra gente se comunicar mesmo só para avisar Opa tô aqui Opa começou Opa toma script vocês vê que eu sou até seco no e-mail né e-mail chega lá fala galera Segue o script toma aí vamos S embora por quê Porque eu acho que a a gente tem que ter esse cuidado Beleza então vamos lá por que que você vai falar de aprendizado por reforço Eduardo porque aprendizado por reforço é exatamente a uma das
técnicas aí utilizadas para desenvolver esses agentes e cara eu queria mostrar para você exatamente a estrutura do que a gente vai fazer aqui hoje e eu usei uma ia bem interessante uma ia que cria essas apresentações bonitinhas aqui tá bom é uma I que pega o compilado do que eu quero explicar para vocês e transforma numa apresentação então a a minha missão foi eu tenho o conteúdo de aprendizado por reforço para passar para vocês a gente vai ter um Case bem interessante tá já digo diante mão que a gente tem um Case bem interessante a
gente vai criar essa parada e você vai entender como que o aprendizado por reforço Ah é desenvolvido é aplicado e como que a gente obtém o resultado disso tudo então Eh já já vou antecipando aí para que você Fique tranquilo que vai ter o mão na massa com codificação também mas eu preciso dar esse contexto aqui para você então vamos lá o aprendizado por reforço ele é só mais um dos Ramos Ah do aprendizado de máquina né a gente fala do machine learning que é o machine learning tradicional Ah tem aqueles aprendizados eh supervisionado não
supervisionado semi supervisionado não é assim ah a gente tem agora um outro braço que é o o aprendizado por reforço então esses braços aqui existem outros tá mas assim de forma bem eh deixando um mundo um pouco mais genérico o aprendizado por reforço é só mais um tipo de aprendizado de máquina e nesse contexto de aprendizado de máquina a gente hoje vai tentar desenvolver juntos aqui um um aprendizado por reforço que cria um agente de i a que faz a busca no ambiente da web então você já viu isso funcionando Tá bom você já a
gente já fez isso com o Crew ai só que eu sei que fica uma porrada de interrogação na cabeça das pessoas que que que se enveredam a para a tentar compreender como que funciona né Como que essa biblioteca tá trabalhando né como que ela toma as decisões E como que ela sabe que esse link é melhor do que o outro e cara se a web é gigantesca Por que que ele escolheu esses artigos aqui para falar ah sobre eu pedi para ele procurar sobre inteligência artificial e ele me trouxe esses links Por que que ele
trouxe esses links então a resposta você vai ter hoje e para trazer Exatamente esse Case a gente vai trazer aqui essa essa história aqui desse robô inteligente que ele tá aprendendo com a própria internet né Então imagina aí um robô inteligente ele ele é capaz de navegar pela internet encontrar as as melhores informações e aprender em cada busca né esse é o projeto que a gente vai desenvolver aqui agora utilizando aí a o aprendizado por reforço e uma parada muito massa é que o nosso sistema ele a cada passo a cada etapa que ele vence
ele fica mais eficiente porque a forma como ele é avaliado tem Total direção com a quantidade de coisas que vai acontecendo no processo de Treinamento Olha que legal né então à medida que ele vai evoluindo ele vai ficando mais eficiente com o tempo então beleza aí vamos lá que qu sãoos ferramentais aqui né que que a gente vai usar a gente vai utilizar o ambiente da web né então assim a gente vai fazer com que o robô navegue na web certo então a gente precisa de uma API de conexão a com a web né então
a gente já trabalhou com o serp a gente trabalhou Amanhã a gente vai conhecer melhor o cerp o exa Ai que são ali grandes apis que permitem que a gente faça esse trabalho Ah E aí a outra parte da estrutura desse projeto é a gente vai trabalhar numa parada que é muito comum nos jogos lembra aí quando você jogava Super Mario World eu tenho certeza que você já jogou Super Mario cara quando você jogava Super Mario você não tinha passar começava o joguinho aqui aí vinha as tartaruguinhas você pulava desviava pegava estrelinha ia pra fase
da estrela depois descia e tinha que atravessar a bandeirinha não era assim que você terminava a fase sei que você é da minha idade quase aí tá por volta dos 40 50 anos se você for mais novo tá valendo pensa aí num joguinho que tem início meio fim é que esses dias eu tava brincando com o Marcos meu filho mais velho né tem 14 anos e aí o Marcos tá ali na era do Playstation 5 aquela coisa de de jogo que não acaba nunca você fica só Jogando e jogando e comprando e comprando e comprando
né E aí não acaba nunca não tem fim você não tem a vitória né você fica só jogando então assim a nossa fase a nossa época videogame era muito melhor né eu falava para elas cara como era fera acabar um jogo zerado vai falar ah terminei essa parada zerei agora cara como é que os moleques comemora isso o jogo tá ali na web 24 hora por dia Ele fica o tempo inteiro é é o infinito ele nunca fica bom o suficiente Sempre tem alguém melhor assim cara então é uma vida muito sofrida desses moleques Então
olhe para essa estratégia de jogo aqui da nossa época Super Mario World para você entender como que o nosso agente vai eh ficar safo vai entender por quê Porque a gente vai trabalhar com a recompensa né a gente pegava lá o cogum melozinho a gente crescia se a gente crescia a gente ficava mais forte né aquela coisa toda então o nosso agente também vai trabalhar desse jeito recompensa por meio de acertos Tá bom então a gente vai dar uma pontuação para ele à medida que ele encontra uma informação que seja útil a gente vai dar
uma pontuação melhor do que se ele faz muitas buscas e não encontra informação do que se ele não encontra informação isso é aprendizado por reforço a cada acerto que ele tiver a gente vai dar uma pontuação melhor para ele e é óbvio se ele fizer cagada a gente vai dar uma penalidade né a gente vai falar assim cara você você tá zic com nós aqui então a gente vai lá dar uma penalidade e aí a gente vai ajudando no processo de Treinamento desse robô Beleza então como é que vai funcionar né a gente dá um
um mundo pro robô o mundo é a web só que cara eu sei que uma das dúvidas suas é cara como é que eu faço o meu robô trabalhar na web né a web tem muita coisa E aí eu quero trazer a sua visão de ser humano para uma coisa mais simples Tá bom porque aí ajuda a compreender cara você enxerga em 3D você tem olfato você tem tato Você tem muitos órgãos de de que te ajudam na na percepção do ambiente onde você está então qualquer coisa que eu for trazer e se você fizer
uma comparação com a sua experiência de ser ser humano vai ficar difícil de entender então vamos pensar agora num ambiente mais simples um ambiente onde você tem três decisões a fazer pensa que você está aberto diante de uma porta e nessa porta você pode fazer uma escolha que é ir para uma direção eh desse lado que é a nova busca você pode ir reto que é Opa eu confio nesse link eu quero esse link ou você pode ir pro outro lado que é assim não eu já sei o que eu quero eu vou ficar parado
sabe então são três decisões pensa no mundo onde você vai ter três decisões Esse é o ambiente de tomada de decisão que o nosso agente vai ter o nosso o nosso agente de ele vai fazer o seguinte cara eu ele vai achar ele vai começar o ambiente do zero ele vai jogar query a pesquisa Então imagina que o nosso agente vai buscar a inteligência artificial ele vai receber um link e ele vai ter a decisão cara eu quero esse link ou eu quero fazer uma nova busca para trazer outras informações afinal de contas a gente
tá falando de streaming de dados se ele jogar uma busca agora já surgiu outros posts com outras informações outros vídeos e o stream da web não para faz sentido ou não faz agora tem gente postando uma coisa daqui do segundos com determinar de falar isso outra pessoa postou outra então ele precisa decidir se ele vai seguir o link ou se ele vai fazer uma nova busca ou se ele já tá feliz com a busca que ele queria ter Beleza então tomada de decisão do nosso agente tá é muito simples beleza aí Ah que que a
gente vai fazer o aprendizado por reforço ele utiliza essa experiência de recompensa de escolhas que ele precisa fazer com Ah uma forma da gente utilizar esse mecanismo de entrada como se fosse os D lembra do machine learning eu vou tentar trazer o machine learning de uma forma bem bem bem simples Pensa numa numa numa regressão onde você tem ali a taxa de juros e você quer prever a inflação Beleza então é uma variável só é a taxa de juros e aí o que que você vai fazer com o histórico vai colocar os dados dos dados
da série histórica para o o algoritmo treinar com essa variável e tentar prever a inflação Isso é o que o aprendizado de máquina faz para nos ajudar a fazer um trabalho preditivo agora no aprendizado por reforço a experiência que ele vai ter o resultado que ele vai ter com o ambiente em ah atribuir os valores das Recompensas ele vai jogar isso de uma forma dentro do algoritmo de de e de aprendizado por reforço e a gente vai trabalhar com um deles existem n algoritmos esse algoritmo ele é um dos melhores E se eu não me
engano ele é o mais utilizado no momento que é o proximal policy optimization a gente tem um Case bem interessante desse de aprendizado por reforço dentro das formações é claro eh e aí o que a gente vai fazer aqui hoje é utilizar esse algoritmo para entender e fazer com que o robô de acordo com as tomadas de decisão que ele teve ali ao longo do processo de Treinamento ele possa escolher a melhor ah rota né que é isso que a gente quer a gente quer que ele traga as melhores respostas pra gente de acordo com
a pesquisa que eu tô fazendo eu quero que ele vai na web e traz uma informação que seja relevante para mim imagina que o nosso agente de a ele tem uma missão ele vai entrar num ambiente da web e ele precisa trazer pra gente a informação mais relevante a respeito de um tema né Isso é trazendo de uma forma bem simpl só para você entender o quão Ah o quão cheio de detalhes o nosso o nosso trabalho né o nosso aprendizado por reforço pode ter Beleza então de forma simples a gente só quer que o
nosso ag gente vá na web e traz a informação o nosso robô a estrutura interna dele é exatamente essa aqui ele tem tem o estado Inicial as ações que eu acabei de te explicar a recompensa e o treinamento então não tem não tem muito não tem muito mais detalhe que que ele vai fazer ele vai fazer a pesquisa vai buscar os resultados E aí a gente vai avaliar ali o resultado se foi bom ou se não foi Beleza então cara esse é o nosso robozinho inteligente essa é a nossa estrutura eu vou falar para você
qual foi o a a ferramenta de ia que eu fiz essa apresentação o nome dela é Gama Gama Gama app g. app beleza aí eu cheguei aqui só coloquei o contexto da história beleza Cheguei aqui e coloquei a história Ah eu quero que faça isso explique aprendizado por reforço blá blá blá blá blá blá cliquei em continuar continuar Escolhi um tema E aí ele criou essa apresentação aqui beleza essa apresentação O link tá aqui para você depois eh fazer aí o a a utilização dessa ferramenta também beleza ótimo beleza excelente aí cara que que eu
fiz também eu aproveitei e Criei um marmaid que é aquela aquela estrutura né aquela estrutura lá que o o o próprio JavaScript nos ajuda a entender né é isso aqui é é só o marate para mostrar o o fluxograma do aprendizado por reforço né a gente tem a ação depois da ação ele vai fazer ou uma nova busca ou ele vai seguir o link porque ele gostou ou ele vai parar e vai falar bem assim não cara Eu já escolhi Essa é a busca mesmo eu não quero continuar E aí para cada coisinha ele vai
ter um ponto ó o resultado da busca dele se ele ah quiser fazer uma nova consulta Se ele quiser fazer uma nova consulta e tiver sucesso ele vai ganhar meio ponto que nem árvore de decisão mais ou menos Olha só se o resultado da busca foi uma falha ih cara ele vai ter uma penalidade E aí você já já vai entender o que que é falha também tá bom Tem vários tipos de falha a gente vai vai olhar aqui agora Ah não eu eu vou seguir o link ah Opa a recompensa é essa eu vou
concluir a busca n Então você gostou do que você viu vai ser isso aqui e aí e a gente vai ah seguir até chegar no final Beleza então essa é mais ou menos uma estrutura aqui que eu usei meninos bora começar essa parada agora pra gente configurar o nosso agente do zero e isso aqui vai ser muito tor Cara isso aqui vai ser muito tor vamos lá eu tô usando cab Exatamente porque eu quero utilizar o ambiente de o ambiente com uma TPU tá bom GPU a gente vai falar de aprendizado por reforço e a
gente vai trabalhar com redes neurais aqui tá bom a gente vai utilizar uma estrutura de rede neural de Deep learning pra gente ah fazer com que o PP com que o ppo receba a estrutura e faça o treinamento Tá bom então o ppo vai utilizar o o aprendizado por rede neural profunda exatamente para fazer o treinamento também eu já vou te mostrar tudo isso então a gente tem algumas bibliotecas Tá bom o que que a gente vai trabalhar cara é simples a gente tem o tensor Flow que é a nossa biblioteca o nosso Framework de
Deep learning para trabalhar as redes neurais se você nunca viu regenerol profunda pensa que ah é como se fossem pecinhas que a gente vai poder utilizar Ah para fazer com que o treinamento utilize uma capacidade bem maior é é tipo uma tunagem de um carro saca eu em vez de correr com um carro normal eu posso escolher e colocar um turbo nele né então eu vou lá e vou colocar um turbo no carro qual qual é o ferramental para me ajudar a colocar o turbo é o tensor Flow tá bom é isso que a gente
vai fazer aqui agora request é uma biblioteca para fazer o acesso na web o grad também é uma biblioteca que a gente até utilizou aqui para mostrar um template pra gente ver o resultado do trabalho e esse Gin aqui ó é uma biblioteca de aprendizado por reforço onde a gente vai gerenciar onde a gente vai vai ajudar a gente a criar Pô sacanagem ah hoje eu usei muito né Mas vamos lá deixa eu ver o que que eu faço aqui eu vou tentar eu vou tentar comprar aqui umas maquininhas aqui tá bom então vamos lá
para ter mais acesso compra unidade de computação Ah eu não quero ficar sem unidade de computação Deixa eu comprar aqui hoje na hora de treinar essa parada aqui eu devo ter usado que é uma beleza né porque agora ele me arrochou e falou assim amigo então você quer usar o a TPU então para você usar TPU você tem que pagar mas tem nada não a gente a gente faz um um um uma parada aqui você não vai precisar Tá bom então se você vai treinar isso aqui pela primeira vez você não vai precisar fazer isso
que eu vou fazer aqui não mas vamos lá vamos ver se ele vai deixa eu deixa eu alterar o tipo de ambiente de execução aqui só para ver se ele vai se ele vai ser bonzinho comigo deixa eu ver aqui pode pode sim tá tudo bem salva aí deixa eu ver se vai se não der não não vai né conectar sem TPU vai ou então deixa eu fazer uma compra aqui vou fazer uma comprinha aqui comprar um pedacinho aqui dessa máquina aqui e O bom disso aqui isso aqui é um size isso aqui você acaba
ficando refém né se você não tem uma máquina boa mas assim Acho que compensa mais do que você pagar uma GPU tá bom alterar o tipo de ambiente de execução ou então o que que eu vou fazer eu vou conectar com outra conta aqui tá bom deixa eu deixa eu fazer uma parada aqui vou conectar aqui com outra conta vou usar uma conta uma conta que eu não tô usando E aí vamos ver se ele vai reconhecer solicitar acesso ah bonitão então pera aí deixa aí a vamos lá Pera aí que eu vou dar um
jeito nessa parada aqui deixa eu fazer o download desse notebook vamos lá show de bola vou baixar agora que que eu vou fazer eu vou logar aqui com outra conta e aí logado com outra conta eu vou abrir aqui o cab vou abrir o colab com essa conta vou fazer o upload desse notebook Opa deixa eu ver se foi pra conta parece que tava na mesma não tava na mesma aqui ô bonitão deixa eu trocar outras contas isso vem para cá boa garoto tô em outra conta agora vou fazer o upload desse notebook tá aqui
e agora a gente vai conseguir usar a TPU porque senão o processo de pagamento aqui pode demorar Às vezes a VM não é liberada na hora Tá bom então vamos tentar fazer esse teste aqui Fecha aqui tá valendo então vamos lá que que eu vou fazer vamos começar a brincadeira vou ah deixa eu alterar isso aqui alterar o ambiente de execução quero escolher uma T4 uma GPU é uma GPU própria para trabalhos com a de Inteligência Artificial tá bom desenvolvida pelo Google e agora foi então beleza meninos Essas são as bibliotecas que a gente vai
instalar show de bola Essas são as bibliotecas que a gente vai instalar aí que que a gente vai fazer aqui agora nesse passo aqui a gente vai configurar a nossa estrutura da api do serper a gente pode utilizar qualquer uma das apis Amanhã é o grande dia de conhecer as principais mas eu vou utilizar o serper eu fui lá peguei a chavinha do serper então ah eu vou ter que adicionar aqui né Então deixa eu pegar uma chave diferente aqui ó serper PDV Ah vou só entrar na conta Beleza vou pegar uma Key Z Key
copy e vou colocar aqui dentro uma serper API Key e vou adicionar aqui tá bom tô só colocando aqui dentro uma chavinha secreta aqui o ambiente fica mais bonitinho né E aí a gente consegue rodar as coisas de uma forma um pouco mais mas ah sem ficar mostrando asas kys Tá bom então ó Isso aqui é o contexto da api o contexto de de dar uma ferramenta para o nosso agente ir na web e e fazer a busca né é o a pré ação né Qual é a a preação do nosso agente é estar na
porta o serfer faz com que a gente vá na porta pra gente daqui a pouco fazer as escolhas né então a gente vai fazer a escolha lá do artigo da da da busca E aí para isso é claro a gente para fazer as escolhas agora a gente vai criar essa estrutura Então eu vou passar aqui de uma forma eu não vou adentrar eh de um jeito mais detalhado porque o meu objetivo é que você entenda o aprendizado por reforço Tá bom então Ó imagina agora que a gente vai criar um módulo que a gente vai
criar um cre ai beleza nós estamos criando uma biblioteca chamada cre ai nesse caso aqui a gente vai criar uma biblioteca chamada web web search environment né por isso que tá web search Envy é um ambiente a gente vai dar a possibilidade do nosso agente acessar o ambiente por meio desse caminho né por meio desse caminho e esse caminho é esse módulo que a gente tá desenvolvendo aqui esse módulo ele vai fazer a consulta artificial intelligence então o que que o nosso robozinho vai procurar Inteligência Artificial artificial intelligence beleza poderia ser mais genérico poderia ser
o que for aqui é só para simplificar a parada até mesmo pro treinamento ter muitos muitas informações tá bom porque se tiver sei lá você vai falar de de uma coisa que poucas eh tem poucas ah poucos dados né o treinamento fica eh prejudicado Lembra que eu te falei que o nosso agente Ele toma decisões e de acordo com as decisões ele vai recebendo ponto tá tudo configurado aqui ó os pontos a gente configura né ó meio meio ponto aqui para uma recompensa bem se ido uma penalidade aqui de um ponto por uma falha Ah
um pontinho se você seguiu o primeiro link e três aqui para você explorar um pouquinho mais e procurar um outro artigo ah dois se você parar e falar não é isso que eu quero tá ótimo é um se você concluir a a a parada e você ganha então todos esses pontos são tudo configuráveis e aqui que tá a beleza eu não sei se você compreendeu mas quando você recebe as informa ações por exemplo de um cre ai você está Refém de acreditar que o cre ai é a melhor resposta pro seu problema nem sempre isso
vai acontecer Tá bom então nem sempre isso vai acontecer quando esse for o caso você tem aí na tua mão a partir de agora um mecanismo para você compreender como que você pode utilizar o aprendizado por reforço para você configurar o seu a gente da melhor maneira possível Beleza então essa aqui é só a estrutura de pontuação eu vou rodar essa estrutura de pontuação e agora é que a gente vai colocar o nosso ppo o nosso agente ppo para desenvolver essa parada toda o ambiente a gente já tem que é o search que a gente
acabou de construir o agente ele é esse essa esse algoritmo aqui e o processo de Treinamento ele vai ser utilizando aqui a estrutura da rede neural profunda então por isso que a gente tá trabalhando aqui nessa parada nessa estrutura de Deep learning Tá bom então agora a gente vai criar aqui ó o ppo Agent então Ó o ppo Agent é o nosso Creo ai ah o nosso Creo ai ele tem aqui algumas features né Como sempre você sabe que os algoritmos eles têm features aqui a gente também escolheu algumas features que também podem ser trabalhadas
de forma que cara você tem mecanismos para melhorar o resultado que você Ah tá procurando ter em uma pesquisa por exemplo Eduardo cara você tá fazendo um um trabalho onde você quer Ah vou pensar numa coisa bem eh uma coisa bem interessante Ah imagina que a gente daqui um pouco vai conseguir eh transmitir ah de alguma forma o O que que a gente sente quando a gente sente um cheiro bom né Então pensa aí as nossas a a o aprendizado de máquina já tá num ponto onde ela já sabe o que a gente tá vendo
ela já sabe o que a gente tá pensando ela várias coisas mas ela ainda não sabe como interpretar o que a gente tá sentindo em um cheiro específico faz sentido ou não faz a gente ela ainda não sabe é um trabalho onde eles têm que deporar aí a parada do do do senso do olfato então ótimo cara a gente precisa ter uma gama imensa de features para para que a gente possa à medida que o processo de Treinamento vai acontecendo a gente vai calibrando ali o processo de Treinamento onde que eu faço tudo isso aqui
nos nos parâmetros dos algoritmos Tudo bem então ótimo aqui já é o uma estrutura a partir de agora é uma estrutura onde a gente tá falando de Deep learning né então existem ah capítulos completos para você entender como que você monta as camadas de um algoritmo de Deep learning O que que você usa quantidade de neurônios quantidade de função de ativação o que que é a saída Como usa o tensor Flow tudo isso tem toda uma estrutura Tá bom eu tô tentando passar por cima só para você compreender que agora eu estou configurando o processo
de treinamento do nosso agente para que ele faça o treinamento com o algoritmo ppo e a os dados de entrada que são aquelas decisões que ele tomou ao long do tempo então Ó esse é o nosso treinamento tá bom esse treinamento ele vai trazer pra gente o seguinte eu vou rodar aqui aí você vai visualizar Ah o processo de Treinamento com rede neural geralmente a gente coloca a os dados para serem treinados num num num processo que não é uma única vez né o aprendizado de máquina a gente teve muito quando a gente inseriu a
learning hate no no no processo ali do machine learning a gente começou a fazer isso né que é fazer com que ele treine com os dados mais de uma vez e para você arrumar essa forma de fazer isso né a a gente inclusive trouxe essa essa interpretação do aprendizado profundo do Deep learning onde a gente trouxe a a a lógica das épocas né então esses 100 Episódios aqui são 100 vezes o nosso algoritmo sendo treinado por essa estrutura de rede neural para ah receber a pontuação de acordo com os dados de entrada que ele que
ele vai tendo a a medida que ele vai fazendo a busca por Inteligência Artificial então se você olhar aqui no processo de Treinamento eu coloquei para ele mostrar aqui pra gente cara eu vou tentar aumentar aqui para ver se fica um pouco mais visual mas olha só ah em cada episódio ele tá recebendo um ponto né então ó ele recebeu um ponto ele tomou uma uma uma decisão onde ótimo né ele ele não ele não teve ponto negativo ele recebeu um ponto aqui foi melhor ainda porque ele decidiu eh de uma forma onde a pontuação
foi melhor aqui também vamos ver se ele teve uma pontuação negativa Não mas ele Zerou aqui ó ele ele Zerou aqui tá vendo aqui que a gente teve um erro na api então ó ele fez uma busca que não retornou o resultado ele é penalizado por isso aqui também a gente configurou isso ah a gente pode inclusive trabalhar nisso aqui às vezes foi um erro da própria pi não que eu acho que esse aqui seja o caso por quê Porque se fosse um problema na api né tá dando falha ou enfim a a gente não
taria conseguindo trazer as as buscas e e não teria Ponto beleza então ó ele treinou ele treinou teve um negativo aqui ó ele fez uma busca que não foi legal e aí ele vai chegar aqui embaixo ó ele vai chegar aqui embaixo numa numa pontuação Então olha para cá ó ele teve uma taxa de sucesso que foi calculada aqui como 36% o desvio padrão das Recompensas foi 0.79 então aqui a gente tem uma primeira análise 36% é uma coisa boa ou não é Será que se eu colocar 200 Passos ele vai aprender um pouco mais
bora fazer esse teste eu acho que vai ficar um pouco vai vai demorar um pouco mais né mas enfim Pensa aí na na na estratégia esse script vai ficar aí para você Você vai refazer esse processo para que dependendo aí você já mexe nessa feature Na quantidade de passos que tá aqui ó aqui em cima você pode colocar ó 200 episódios eu já fiz isso com 200 episódios e ele ele teve uma uma uma nota muito boa uma média de 86% então uma taxa de sucesso de 86% é uma coisa bacana o processo de Treinamento
foi legal quando você olha pro Crew ai hoje ele tem uma taxa de de de acerto muito boa por quê Porque ele já tá disponível pra gente o o algoritmo treinado com uma uma taxa de sucesso muito boa e parâmetros que já servem para trabalhar em larga escala isso é o Crew ai hoje e as outras bibliotecas como Argen chque E por aí vai tá bom então aqui na tua mão é só para você compreender como que você pode fazer algo parecido aí ótimo Beleza então aqui é só um resumo média de recompensa deve estar
sempre subindo ao longo do tempo para você acompanhar as tendências se for acima de 50% o agente tá tomando boas decisões no nosso caso parece que tá malale Male né mas enfim pensa que à medida que você aumenta o processo de Treinamento ele fica mais eh tora beleza a menor nota que ele poderia ter né porque você deve pensar né poxa mas ah por que que a nota tá 1.19 Por que que a outra aqui tá 2.4 Qual é essa Qual é essa lógica né a lógica depende da nossa pontuação Inicial ali né O que
que eu coloquei Ah se ele segui o link ele ganha um se ele fizer uma busca que for boa ele ganha mais 0.3 Então quando você olha esse universo ele pode ir de -10 até 2 Tá bom então assim a forma dele ter a a melhor nota ali é dois e a pior nota em cada passo do treinamento é -10 Tá bom então isso aqui para você compreender como que funciona mais ou menos essa parada eu trouxe mais algumas explicações aqui para você você e aí agora o que que a gente vai fazer esse foi
só o processo de treinamento para você entender como que a gente cria ou como que a gente poderia criar com o aprendizado por reforço a estrutura de um agente de ia personalizado para um problema específico porque quando a gente olha pro pro Universo de Agentes a gente tem agentes que eles são genéricos digamos assim então bora criar agora um agente que ele é o seguinte esse agente ele vai ser um agente eh de ia e ele vai ser um phd tá bom pensa num phd aí a gente quer procurar alguma coisa sobre eh a a
inteligência artificial no mundo acadêmico E para isso a gente inclusive vai falar para ele ah procurar eh informações que venham do Meio acadêmico como por exemplo a o o wks IV que é um lugar um grande repositório de artigo científico que é buscado e atualizado e que tem apis e enfim que facilita a vida da gente na hora da gente a gente fazer essa pesquisa essa estruturação aqui da api é simplesmente pra gente criar a busca Beleza então Ó a busca que a gente vai fazer vai seguir a mesma estrutura só que a gente vai
num lugar onde a gente já sabe que é um lugar eh que ajuda ali o cientistas a encontrar as informações ah a gente vai configurar também a pontuação beleza a pontuação de penalidade a gente vai recriar aqui a estrutura do agente eu tô recriando só para ficar tudo Numa célula só Tá bom então aqui é a estrutura de treinamento do aprendizado profundo aqui é o a função que o que o o algoritmo vai percorrer que o nosso o nosso agente vai percorrer para fazer ali o a busca que a gente definir então ó eu vou
rodar essa parada e aí a gente vai eh ter uma interface agora que é uma interface eu vou compartilhar aí no chat para você fazer essa busca também ó entra aí no chat faz essa busca aí faz essa busca aí ó é que é vai dar para você brincar com ele aí também você vai ter essa cara aí agora ó esse link que eu mandei aí você consegue acessar aí eh é um agente de busca automática aí então por exemplo eu vou colocar aqui ó llm que é uma coisa que a gente busca muito o
que que ele vai fazer ele agora vai rodar E aí nesse caso que que ele trouxe aqui para mim né dá uma olhada nesse resultado aqui ele ele trouxe para mim ó ele fez uma busca essa busca ele ele teve uma recompensa um e a recompensa foi um porque ele encontrou o link e falou assim não beleza só isso que eu quero mesmo então a busca concluída igual true significa que ele Ah ele encontrou e tá beleza eu tinha pedido para ele eh mostrar aqui para mim inclusive o template para que eu encontrasse o artigo
né ele não encontrou mas eu vou fazer essa rodada de novo aqui para ver se ele vai se ele encontra o artigo que eu quero que ele mostre o artigo referente a a a essa busca né porque a gente tá fazendo a a gente ir no meio acadêmico lá no arx IV para ele trazer a a busca Então eu quero que ele mostre qual é o link Tá bom eu quero que ele traga e comprove que ele foi lá e trouxe o link então ó agora ele foi né então o resultado da busca eh larg
language mods as a software Tá bom então ó ele trouxe esse essa estrutura Esse é o resultado da busca ele fez um summary né um resumo aqui dessa parada e aqui embaixo deve ter o link quer ver ó ele trouxe o sum explicou o que que é e aqui tá o link ó lá beleza vamos vamos ver se esse link e aí eu já explico o o resultado adicional ali então tá aqui ó esse é o link tá bom do do da universidade de cornel onde Ah ele trouxe o llm que a gente buscou aqui
né então vamos lá ó grandes modelos de linguagem como componente de software exatamente o artigo que a gente procurou né uma taxonomia para aplicações Integradas de llm E aí ele traz aqui todos os dados você pode ver aqui no formato de p DF depois você pode fazer a desgrameira que for Tá bom você pode usar isso aqui como input eu tava conversando com um aluno Hoje ele até tava falando isso que ele tá ele tá trabalhando eu não sei se é na Geórgia eu não sei onde é que era eu esqueci agora mas que ele
tá fazendo um trabalho exatamente disso onde ele precisa compilar uma série de informações onde eh ele traga informações se eu não me engano é é para é veterinárias coisa assim eu não lembro exatamente o que que era mas ele precisa exatamente de uma parada como essa Ó que legal se ele tiver vend nessa aula aqui ele já vai Ele já vai ficar vai a loucura aí ó o resultado aqui cara olha que legal quando você olha aqui e vê a recompensa aqui concluída como falsa sabe o que que significa o nosso agente ele não resolveu
parar ainda né ele não resolveu parar ainda ele ainda vai continuar a busca né Só que nesse nosso caso eu só queria mostrar para você que o nosso agente ele já tá indo e ele já tá trazendo as informações que a gente precisava para ah cumprir ali o trabalho de Opa eu quero desenvolver uma parada que vá na web e que seja ah completamente customizável eu não fique refente de biblioteca Eu tenho como fazer isso eu consigo fazer essa parada cara tá aí na tua mão para você utilizar isso como um um um parâmetro uma
base para desenvolver coisas muito mais grandiosas beleza então cara esse é o nosso case de hoje é um Case eh eh hightech é um cas hightech Mas você vai poder ver e rever e retestar essa parada aí mais vezes acho que o o link é claro ele não vai ele vai ficar disponível só algumas horas aí né se eu não me engano a o o gradi ele deixa aí só algumas horas né aqui nesse caso Acho que são 72 horas mas eu acho que na hora que eu derrubar aqui vai cair aí para você tá
bom vou deixar aberta enquanto a gente tá aqui se você tiver vendo esse vídeo gravado roda essa parada aí e aí você vai conseguir ess acessar por meio desse link aí tá bom Ó você vai ver essa imagem tá bom você vai ver essa imagem e você vai poder fazer a consulta ah aí na web com o nosso agente utilizando que utiliza o aprendizado por reforço para fazer a a estratégia de criar o o o nosso agente e fazer a busca na web Tá bom então ó query eu vou colocar aqui sei lá Vision eh
language Models deixa eu ver se vai vamos lá rodou Ah ele trouxe aqui ó vamos pegar esse cara aqui deixa eu ver o que que é esse cara visual language models então ah deixa eu traduzir aqui end direção a construção de modelos de base geral para tarefas de linguagem visão compreensão da Visão linguagem é o Shin zong Zang yangan zeng deve ser chinês beleza Tá bom galera Então cara Espero que você tenha se divertido com esse cas como eu me diverti tá bom eh Isso aqui é uma uma área apaixonante que eu tenho certeza que
tem condições de você criar coisas Fabulosas Fabulosas mesmo a ponto de você desenvolver aplicações aí que realmente façam diferença nas empresas e é obviamente por isso ah você vai se tornar uma pessoa Ah que Eita tá tá ruim a câmera né pessoa muito bem eh avaliada aí nas empresas tá bom bem deixa eu responder pergunta agora tá se eu fui muito xarope se eu fui muito pesado dá um feedback aí tá bom beleza dá um feedback aí deixa eu responder as perguntas Ah vamos lá vamos lá galera boa galerinha Avelino TAM ô galera que legal
muito bom Leandro Valeu lê tamo junto Maga E aí Maga de boa Robertão alguém Conseguiu baixar o segundo script cara se você não conseguiu dá uma olhada no seu e-mail tá bom até o terceiro script já foi lá o link dentro do link é que tá lá o o o o o link para você fazer o download Tá bom então tá tudo lá ah encontrei Hoje essas aulas Alguém sabe como é que eu consigo ter acesso à anteriores Elias Você tá inscrito no ai Experience se você não tá eu vou te dar um link aqui
agora ciência dos dados.com você vai fazer a inscrição no ai Experience que é o treinamento que vai rolar gratuito semana que vem aonde a gente tá na semana de aquecimento desse treinamento Tá bom a gente tá na semana de aquecimento essa semana de aquecimento é exatamente para você afiar o machado para construir uma coisa grandiosa um projeto grandioso que a gente vai fazer junto na semana que vem beleza então estamos aqui no aquecimento tem a primeira segunda terceira e essa é a quarta aula já falamos de Agentes já falamos de llms já falamos de rag
Systems ah e hoje a gente tá falando do aprendizado por reforço que é uma forma de você criar os agentes tá bom n Beleza Elias moleque doido vamos lá jogos da Nintendo era show né J Nossa era muito doido a Cláudia falou aqui que é do tempo do super Maro também né boa Cláudia Isso aí joguei muito super Maro Nossa Senhora Qual a melhor forma de fazer os ajustes dos parâmetros cara excelente pergunta excelente Pergunta a gente tem uma estrutura e que no aprendizado de máquina tradicional a gente tem bibliotecas que facilitam muito isso né
é o o o Random search Grid search né E por aí vai aprendizado pro reforço é um pouco mais é um pouco mais experimental cara é um pouco mais experimental tem tem jeito tem só que é cara também experimental então assim a melhor forma de você ajustar é olhando pro resultado olha pro resultado E aí tá do jeito que você hum Então volta entendeu é prancheta cara é difícil né a gente tá na fase de prancheta mas tudo isso que a gente vê no mundo aí hoje ó chat GPT Cloud tudo é prancheta mano tudo
prancheta foguete dando ré tudo tudo tudo tudo prancheta Edu qual seria a diferença entre um ppo e fine T existe uma relação entre eles cara olha só o ppo ele é pensa no algoritmo tá bom ele é o algoritmo de aprendizado por reforço onde ele tá avaliando as políticas né ele avalia as políticas ele passa por esse processo de Treinamento que é a estrutura do Deep learning que a gente fez e ele tem uma ele tem as próprias características para avaliar políticas né por isso que o nome dele é é eh eh political próximal optimization
né uma coisa assim então porque ele é o algoritmo que foi desenvolvido exatamente para esses casos onde a gente tá avaliando a política que política Eduardo acabou já o as eleições né então não pô a política lá ó Opa o cara ganha um se ele acertar o o o a pesquisa não Ele toma menos dois se ele eh trou é uma pesquisa irrelevante ele perde ponto se ele não trouxer informação nenhuma entendeu esse ele é ele é utilizado para isso Luan Então essa essa é mais a é essa é mais a característica do ppo tá
mais para um algoritmo do que um fine tunning né o fine tuny é eu tenho um modelo pronto e aí agora eu quero fazer esse modelo aprender mais o rag tá mais para Fan do que o ppo tá bom porque o rag você tá fazendo um ajuste fino no no próprio no próprio llm que tem aí na tua mão tá bom Fernando show de bola Adriano Cadê este material Mauro este material daqui um instantinho eu vou mandar via e-mail tá bom material vou mandar via e-mail Tá bom thas vou mandar no e-mail para você que
tá inscrito no no ai Experience Tá bom já já eu mando neste caso ele tá fazendo busca apenas no ARV mas se eu quiser que ele fa essa busca por exemplo dentro de outras fontes de artigo show você pode excelente pergunta e alguém conseguiu baixar Deixa eu tirar aqui né deixei Deixei marcado aqui deixa eu mostrar ISO aqui ó a pergunta do Luan nesse caso ele tá fazendo busca apenas no ar IV mas se eu quiser que ele faça essas buscas dentro de outro outras fontes de artigo então a gente pode configurar o serper para
que ele faça isso do mesmo jeito que a gente fez para ele buscar só no na api do ARV beleza do mesmo jeito você pode colocar setar as fontes que você quer ou simplesmente deixar ele na web tá bom deixar ele fazer a busca nesse caso eu fiz desse jeito exatamente para que Ele pudesse ser mais Acer mais mais certinho pessoal fica brigando comigo quando eu falar assertivo esses dias eu soltei uma eu falei é a estimação fica boa aí né só porque eu não falei estimativa né a galera meu irmão Ha tá falando né
a gente tem que entender a gente também é Hater né quem nunca né não está visível pior que a construção e análise do algoritmo Ah boa noite parabéns pelo conteúdo Valeu obrigado Ezequiel boa noite Eduardo Como posso ver as outras lives M aqui no no canal do YouTube Você vai no ao vivo Tá bom você vai no ao vivo que tá lá aberto tá aberto no YouTube para todo mundo que quiser beleza ap que você mostrou é pago não assim pode você pago dependendo da quantidade de requisições que você fizer mas o serper é tão
barato tão barato que cara eu tô usando o serper tem tem alguns meses e eu nunca paguei nada sério é o serp ele é configurado para ser para ele ser realmente muito buscado muito buscado pensa m a gente tem bilhões e bilhões de coisas acontecendo todo dia então se ele for cobrar um centavo que seja para cada busca cara ele ia ficar muito caro então não tá Bru não ah não não praticamente digo que não é pago porque você vai lá cria um api e usa então não não é pago não tá bom Luan entendeu
show Luan Que bom já dão você é possível fazer essa busca em um banco do Google Cloud plataforma com modelos assim esse aprendizado por reforço sim Vitor sim cara Inclusive eu vou trazer um conteúdo desse para vocês né A galera tá muito interessada em fazer busca em banco de dados né eu vou trazer eu vou trazer em qualquer qualquer momento eu vou trazer uma uma uma estrutura onde a gente vai fazer trabalho com um banco assim tá bom Por quê Porque é massa né você pensa você já faz a busca no banco de dados que
é a próxima né já é a próxima já existe é claro como eu falei para vocês eu já trouxe Case aqui onde a gente faz os as buscas Ah no banco de dados ali de forma textual mas cara daqui um dia isso aí vai ser vai ser o tradicional né tá bom Vitão então ó cara com certeza dá para fazer isso sim eh de que forma de que forma colocamos o agente em um site ou aplicação Eita també eu vou precisar de um pouco mais de insumo seu aí deixa eu tentar entender o que que
você tá querendo dizer com colocar o agente em um site ou numa aplicação você tá querendo colocar esse carinha como uma feature dentro de um site ou você tá querendo que ele passa o trabalho num site ou numa aplicação você quer colocar ele numa aplicação para ele fazer esse trabalho ou você quer que ele faça parte do site ou de algum aplicativo feature insite show de bola M aí o trabalho já não é do desenvolvimento do aprendizado em si é um trabalho de é um trabalho de de configuração mesmo saca Então pensa aí deixa eu
deixa deixa eu tentar é porque assim eu não sou o cara do eu não sou o cara do desenvolvimento né então para não falar muita besteira eu vou tentar te explicar como que eu entendo tá bom mé Então vamos lá se eu quero colocar ele de uma forma visual ali paraa pessoa fazer um clique e fazer o trabalho eu preciso configurar o front end pro usuário ir lá e fazer os cliques e na hora que ele der o clique a coisa aconteça né então o front end vai est desenvolvido e ele precisa ter contato com
o motor que é o backend né então o cara que trabalhar com o backend vai ter que chamar o Python que foi a programação utilizada para fazer o seu agente então ó o cara tem que compreender o backend com a programação Python e no frontend ele tem que compreender como que ele vai fazer essa interligação entre o que ele tem no backend seja o o o próprio Python ou seja qualquer outra coisa que ele esteja desenvolvendo beleza M então assim um deve hoje ele não teria dificuldade porque a gente tá falando tudo de Python saca
hoje em dia me essas essas eh tudo que a gente faz aqui como Python a galera do react Detona por quê Porque é simples de você fazer a conexão né É simples o Python conecta com muita coisa m tá bom ah o Diogo Alen cas fez a pergunta como colocar o agente para trabalhar então nesse caso a gente colocou ele para trabalhar aqui numa estrutura de de de desenvolvimento é claro numa estrutura de teste ah simplesmente executando a estrutura né a gente colocou a estrutura deu play e falou assim meu amigão busca lá a inteligência
artificial no no na web e traz pra gente ele foi lá e trouxe só que é claro nessa estrutura de teste que a gente colocou aqui a gente delimitou a gente é clar isso aqui é desenvolvimento Beleza eh a gente tá tá a gente tá numa estrutura onde a gente tem que pensar assim eh você é o cara responsável por desenvolver o agente Tudo bem se você quiser ser o cara que vai fazer tudo isso aí cara vai ser um pouco mais complexo vai precisar de gente para te ajudar tá bom porque a outra pergunta
que o brother fez aqui ó o que o Adriano fez para colocar isso no site Você vai precisar de um desenvolvedor que trabalhe com a programação que é necessária lá para para colocar a parada no ar entendeu então você colocar ele para trabalhar assim valendo você vai ter que fazer mais coisas fora o que a gente tá fazendo aqui aqui a gente entregou o cérebro fala como é que funciona e pode fazer as calibrações até chegar no ponto que você fala beleza ele tá trazendo o que eu quero agora vamos colocar em produção beleza M
aí é esteira de desenvolvimento de software mesmo criamos o agente para realizar uma determinada tarefa e colocamos esse agente para que ele Trabalhe em um site show de bola essa é a pegada mesmo aí para você fazer esse trabalho essa estrutura Você vai precisar de todo esse grupo culpa aí de de de de time aí na na empresa Beleza Imagino que você não eu imagino que se você faz essa pergunta você Talvez possa estar sozinho e cara sozinho É É complicado de você fazer essa parada Você vai precisar do backend de um frontend Você vai
precisar de uma estrutura de desenvolvimento de software para você não ficar eh porque tu tá sendo especialista em a aqui tá bom tu tá sendo especialista em a tu desenvolveu tu tem aí a a partir de agora como é que faz agora colocar em produção para colocar em produção Você vai precisar de n outras coisas vira um projeto como qualquer outro tá bom Julião Julião aqui do c do Java precisou encapsular Ô Diogão tá sozinho né me é não aí sozinho não vai rolar não me isso aí só se tu já for um cara fulltec
aí que tá acostumado com un zilhão de coisa tá bom M difícil demais cara isso aqui você vai ter que est com time é precisa encapsular o TV News né pô TV News fala para mim que que você programa aqui me C Java tza aí show de bola vai chegar aí tem um belezinha galera tá todo mundo que tá aqui Já Curtiu o vídeo curte esse vídeo aí cara curte esse vídeo para fazer o YouTube entregar aí para mais pessoas Tá bom faz essa presa aí e dissemina avisa o algoritmo que você gostou do conteúdo
tá bom isso é importante também avisa que você gostou do conteúdo para que o algoritmo ah entregue entregue aí para você mais informações como essa tamo junto cara para mim foi uma honra amanhã a gente tá aqui no mesmo horário 8 horas vamos falar de api não perde essa aula por nada porque meu amigo se você perder a aula de amanhã cara você vai perder muita coisa é o nosso é o finalzinho do aquecimento beleza colocamos fogo na fogueira ali agora todo todo mundo aqui tá pegando fogo semana que vem a gente vai entrar pro
ai Experience já ó afinado E aí sim você vai ter um projeto moleque para você guardar aí para você e colocar numa aplicação para você vender para você e colocar na sua empresa vai ser uma parada muito doida para você detonar aí tá bom tá inscrito não tá cara entra cienci doos dados.com se inscreve aí no evento porque eu vou mandar o script agora por e-mail se você não tá inscrito você não vai receber estamos junto um beijo um abraço uma honra fiquem com Deus até amanhã tchau tchau
Related Videos
Agents – Introdução à criação e funcionamento de agentes de IA
1:18:38
Agents – Introdução à criação e funcioname...
Eduardo | Ciência dos Dados
9,455 views
RAG Retrieval-Augmented Generation
1:08:25
RAG Retrieval-Augmented Generation
Eduardo | Ciência dos Dados
5,887 views
IA Está Eliminando a Necessidade de Programadores Web?
33:57
IA Está Eliminando a Necessidade de Progra...
Eduardo | Ciência dos Dados
30,404 views
APIs de Integração para IA
57:19
APIs de Integração para IA
Eduardo | Ciência dos Dados
3,774 views
Introdução a Redes Neurais e Deep Learning
1:06:32
Introdução a Redes Neurais e Deep Learning
Didática Tech
89,192 views
AI CLASS - Criando Agentes de IA que navegam na WEB
1:41:59
AI CLASS - Criando Agentes de IA que naveg...
Eduardo | Ciência dos Dados
6,756 views
What is AI Agent? | Simple Explanation of an AI Agent
8:53
What is AI Agent? | Simple Explanation of ...
codebasics
29,435 views
Agentes de IA Poderosos Usando CrewAI, LangChain e EXA – Guia Completo
45:09
Agentes de IA Poderosos Usando CrewAI, Lan...
Eduardo | Ciência dos Dados
2,365 views
IA que Aprende com GitHub!
24:31
IA que Aprende com GitHub!
Eduardo | Ciência dos Dados
1,500 views
LLM Project | End to End Gen AI Project Using Langchain, OpenAI in Finance Domain
1:14:34
LLM Project | End to End Gen AI Project Us...
codebasics
185,842 views
Machine Learning Explicado
13:29
Machine Learning Explicado
Ciência Todo Dia
310,959 views
Criando uma Fábrica de IA's - Analistas + Cientistas de Dados + IA
38:26
Criando uma Fábrica de IA's - Analistas + ...
Eduardo | Ciência dos Dados
2,899 views
LLM (Large Language Models) – Modelos de linguagem de larga escala e suas aplicações.
1:13:26
LLM (Large Language Models) – Modelos de l...
Eduardo | Ciência dos Dados
8,210 views
Como Criar uma IA que Aprende com Seus Próprios Dados Usando ChatGPT e RAG!
43:46
Como Criar uma IA que Aprende com Seus Pró...
Eduardo | Ciência dos Dados
4,076 views
How to Improve LLMs with RAG (Overview + Python Code)
21:41
How to Improve LLMs with RAG (Overview + P...
Shaw Talebi
66,661 views
Live -Transformers Indepth Architecture Understanding- Attention Is All You Need
1:19:24
Live -Transformers Indepth Architecture Un...
Krish Naik
224,198 views
Python Machine Learning Tutorial (Data Science)
49:43
Python Machine Learning Tutorial (Data Sci...
Programming with Mosh
2,957,991 views
🚀 Aprenda Web Scraping com IA e LLM's 🤖
30:41
🚀 Aprenda Web Scraping com IA e LLM's 🤖
Eduardo | Ciência dos Dados
4,619 views
4 JavaScript Projects under 4 Hours | JavaScript Projects For Beginners | JavaScript | Simplilearn
3:44:17
4 JavaScript Projects under 4 Hours | Java...
Simplilearn
390,541 views
How to set up RAG - Retrieval Augmented Generation (demo)
19:52
How to set up RAG - Retrieval Augmented Ge...
Don Woodlock
34,240 views
Copyright © 2024. Made with ♥ in London by YTScribe.com