Como treinar o ChatGPT com seus próprios dados: TUTORIAL COMPLETO!

24.77k views5682 WordsCopy TextShare

BIX Tecnologia

🚨🗓️ O calendário de eventos 2024 está no ar! Inscreva-se agora para aprender com especialistas em ...

Video Transcript:

[Música] fala pessoal tudo bem com vocês estamos iniciando aqui mais um conteúdo da semana de dados 2023 evento esse que está reunido grandes nomes na área de dados para conversar mostrar como os dados vem sendo utilizados nas empresas mostrando demonstrações de cases falando um pouco sobre os novas tecnologias e também promovendo debate e incentivas novas conexões para que vocês saiam daqui mais preparados para o mercado ou sabendo que é mais de novo aí no mundo de dados espero que estejam todos aproveitando e absorvendo muitas informações legais compartilhados pelos convidados e referências que estão participando do

evento hoje o conteúdo aqui vai ser um pouco mais técnico a gente vai estar tentando entender alguns conceitos e pegando no código para criar uma aplicação simples rápida mas essa aplicação tem um potencial muito legal aí de gerar um valor para os negócios outro trade hoje vai ser como treinar com seus dados vamos estar explorando um pouco dessa ferramenta entender algumas formas que ela pode ser utilizada e fica o convite também caso tenha interesse de acessar o site da semana de dados acompanhar os outros conteúdos que ainda vai acontecer o que vai acontecer e seguir

as redes sociais para não perder os efeitos futuros que podem estar acontecendo por aqui bom me apresentando pouco eu vou estar acompanhando vocês a algum desse tutorial eu sou o Nicolas sou consultor de ciências na Mix tecnologia e falando na bigs é uma consultoria de dados com foco negócios e na conquista de resultados a gente atua em todo o processo analítico que vai desde a coleta um armazenamento e a disponibilização dos dados e a partir disso a gente está consegue estar criando visualizações relatórios e sistemas para isso a gente utiliza as principais ferramentas e Tecnologias

do mercado no desenvolvimento dos nossos projetos e assim a gente ajuda os clientes a extrair o máximo de valor dos seus dados e se transformar digitalmente e é focado em extrair o máximo de valor de maneira inteligente é que trazemos o tutorial de hoje tá e o que que a gente vai estar fazendo aqui hoje nosso objetivo é desenvolver um chat Assistente por meio deste chat assistente o cliente ou usuário pode estar acessando essa interface fazendo perguntas questionamentos que ele tem de dúvidas sobre a empresa e Com base no conhecimento que a empresa já deixa

disponibilizado publicamente Esse chat vai estar conseguindo responder de forma simples essa pergunta do usuário sem ter que estar entrando ali no muito fazendo uma busca muito profunda no site da empresa ou tendo que entrar em contato ali com consultor ou com algum algum time para estar resolvendo questionamento então isso torna muito mais acessível o usuário até acesso aquela informação que ele tá querendo encontrar e não sabe se existe ali no site e essa interface pode estar ajudando ele a fazer isso esse conteúdo a gente vai estar extraindo do site da empresa no caso a gente

vai estar usando o site da bics aqui nesse nesse tutorial e através de webscraping a gente vai estar vasculhando ali o sites que que tem disponível no domínio da Bix e vamos estar extraindo esse conteúdo esse texto esse dado não estruturado e vamos estar depois posteriormente utilizando técnicas de processamento de linguagem natural de nlp para estar deixando esse dado da forma mais reca possível para a gente tá passando depois para uma API da operar que é responsável pelo desenvolvimento do chat GPT e essa essa esse modelo vai estar sendo treinado com esses dados e posteriormente

a gente informa Passa esse modelo para o chat assistente que vai estar respondendo as nossas dúvidas ali é que a gente vai estar mostrando e desenvolvendo junto aqui então os passos para a gente estar desenvolvendo esse tutorial vão ser primeiramente ele vai começar com web scraping e depois a gente vai pegar esse texto que foi extraído dessa desse site vamostomizando esse texto depois seriamente a gente vai pegar esse texto toconizado vai criar uma imagem Desses desse desse estoques e aí sim a gente vai estar fazendo aqui a requisição da api e para tá treinando o

modelo e depois tá disponibilizando esse modelo treinado para o nosso chat assistente Não se preocupem muito com os detalhes esse tutorial realmente é um tutorial bem mais prático acessível que qualquer um pode estar fazendo a gente vai passar um pouquinho por cada um desses desses pontos desse desses conceitos que tá sendo mostrado aqui e também fica fica também o convite para vocês estarem fazendo isso com o site de vocês algum site é não o site que eu vou estar fazendo aqui no tutorial né você pode estar tentando fazer isso com qualquer outro site só só

se atentem a a ler os termos de uso de cada site e para estar fazendo tudo da maneira mais correta pois alguns sites precisam ter autorização para você estar fazendo o scraping dele do conteúdo então se atentem a isso e fica o convite para vocês fazerem o projeto de vocês do jeito de vocês e por fim espera-se que a gente esteja conseguindo desenvolver essa interface aqui é como eu falei para vocês a gente está desenvolvendo um chat assistente então a gente chama aqui a assistente da bixtecnologia onde a gente tem uma janela que a gente

pode estar vendo a conversa que a gente está tendo com assistente aqui embaixo hoje tem uma opção para estar fazendo a pergunta então vou colocar aqui uma pergunta quero fazer um projeto de previsão de dados de previsão utilizando os dados históricos você consegue me ajudar e aqui o nosso depois de pensar um pouquinho o nosso é de estar fazendo a consulta à requisição lá na api o chat vai estar respondendo pra gente quero fazer Sim podemos ajudar nossa equipe de consultora está sempre disposta a ajudar a discriminar a cultura de dados e capacitar profissionais de

todas as instituições e setores entre em contato conosco para saber mais sobre nossas soluções de 3 artificial machine learning e estatística para análise avançadas então ele tá esse chat está utilizando do conhecimento que tem lá no site da Beats para estar conseguindo trazer a resposta retornar a resposta que faça maior sentido para a pergunta que eu fiz ali para o chat Então vamos lá a mão na massa e vamos estar fazendo isso aqui fazendo esse exemplo esse tutorial que você consiga fazer aí na casa de vocês também vamos lá então começar esse projetinho esse tutorial

e antes de a gente começar realmente a desenvolver alguma coisa entrar no código a gente vai estar precisando ajustar algumas coisinhas é a gente no desenvolvimento a gente usou a linguagem Python então se você quiser tá acompanhando tutorial tá fazendo aí na casa de vocês é de uma pesquisadinha aí na internet como que é justo o pai então como faz a instalação como que é um ambiente de desenvolvimento para você tá seguindo tutorial então fica essa dica aí se você quiser também tá fazendo aqui junto comigo outra coisa que a gente precisa é tá criando

uma chave a pele da Open O legal que quer para novos usuários eles disponibilizam cinco dólares de crédito é para novas contas então para você tá pegando sua chave a sua só aqui só e aqui você só precisa estar entrando no site fazendo a sua conta precisa de um número de telefone válido para Tá criando a conta e depois disso é só a gente pegar api tá usando ali no projeto Então essa aqui é a tela que a gente vai estar acessando para ter acesso a nossas chaves da api eu vou estar mostrando aqui na

minha tela como que a gente faz esse acesso para vocês também estarem conseguindo fazer na casa de vocês então é quando a gente acessa pela primeira vez a plataforma que a gente vai tá pedindo para você ou fazer login na sua conta ou criar uma conta nova e aqui você precisa ter o telefone válido ali para receber o SMS e tá colocando o código para poder acessar depois que você acessar a gente vai estar entrando nessa página aqui a gente no caso eu já estou na página da api Mas essa é a página inicial e

depois a gente vem aqui no menu clicamos aqui viu aí quis e aqui a gente vai ter todas as chaves apis Que Eu Já criei e eu tô utilizando né então para você criar uma chave nova aí você vem aqui digita um nome que você quer gravar Ai aqui é interessante você tá salvando esse código essa chave aqui porque ele até avisa aqui que se você Fechar essa janela e não salvar você não vai ter acesso a ela novamente no futuro então é legal você copiar essa avó num lugar de que você tem controle que

você vai estar conseguindo recuperar no futuro porque cada chave dessa você mantém um treinamento então se você aqui no tutorial estiver a gente treinar com essa chave APK e se você perder você não vai ter acesso a mais esse modelo treinado no futuro é você teria que estar criando uma nova modelo então é legal você pegar e salvar essa chave em algum lugar seguro outra coisa que a gente pode também estar fazendo aqui no site da opinião aqui [Música] Quando você começar a utilizar fazer requisições na epi você vai estar gerando cursos E como eu

falei a gente tem cinco dólares de créditos gratuitos então eu já fiz alguns treinos Já Fiz alguns testes aqui e aqui tem o consumo eu posso ver o consumo por dia quais os dias que eu usei é o quanto que eu usei em cada dia e aqui você consegue estar monitorando quando você tá gastando Não se preocupem que porque esse treinamento que a gente vai tá fazendo é muito barato então você pode treinar muita coisa fazer vários testes que você não vai estar vai estar bem longe de estar gastando esses cinco dólares gratuitos que é

a plataforma disponibiliza para a gente [Música] aqui eu tenho alguns prints de para referência caso queiram pegar esse slide no futuro para dar uma olhada temos aqui a página do API a página ali de para a gente estar monitorando quanto que tá gastando de Dapi né e vamos começar agora a introduzir alguns conceitos ali que eu que essenciais assim para a gente estar fazendo esse projeto é uma técnica de estação de conteúdo de sites da internet então a gente tem ali um site um desejado que a gente quer extrair informação a gente vai ter também

os scrapers que são os robôs ou os Bots que são escritos que foram programados para estar acessando esse esse site desejado e extraindo ali as informações que a gente tem interesse em estar coletando E armazenando então a gente no fim a gente vai ter essas informações extraídas que elas podem ser armazenadas e posteriormente elas podem estar sendo utilizadas para fazer diversos tipos de análises como é monitoramento de preço análise de concorrência entre tantas outras aplicações mas hoje a gente vai estar usando isso só para armazenar o dado textual o conteúdo do site específico que a

gente tem interesse ali seguindo agora a gente tem a toninização como na temperatura a gente falou sobre o web scraping e ali a gente vai estar extraindo o conteúdo do sites de forma de texto em dados não estruturados a gente começa a ter a necessidade agora de ver um pouco sobre técnicas de tratamento desses textos em forma de desses dados de forma de texto né então primeiro que a gente vai estar olhando é a atualização que basicamente consiste a gente pegar esse texto grande e tá dividido ele em formas em partes menores individuais é que

chamadas de token né então ali aqui no slide a gente vê o carro está andando rápido e a gente embaixo a gente vê a forma dele representado em tokens isso é bastante fundamental ali quando a gente tá lidando com processamento de linguagem natural pois isso permite que o computador e o programa ele aprenda o significado da palavra individual e como ela se relaciona com o texto completamente então isso Isso é uma das técnicas bem importantes ali quando a gente fala de nlp e vamos estar usando aqui em nosso tutorial os seguintes seria outra forma de

tratamento que seria os imbejans então é uma técnica que é utilizada quando a gente quer entender a relação semântica e sintática entre outras palavras o que seria isso é dizer se uma palavra é similar ou não a uma outra então o que acontece é que um texto os tokens eles são transformados em ele é vetorizado e existe um espaço vetorial vetorial onde palavras similares elas estão próximas nesse espaço e palavras que não são similares elas são bem distantes e isso faz muito sentido quando a gente traz para o nosso problema que é o problema de

que a gente quer fazer perguntas e que tenham respostas que façam sentido com a nossa pergunta então por isso que a gente vai estar utilizando a técnica de Bering para estar facilitando o nosso assistente A tá trazendo respostas mais mais precisas e que façam sentido com as nossas perguntas aí a pergunta do usuário legal chegamos agora na parte do código a gente agora vai passar para outra tela e vamos estar dando uma olhada ali no código Como que ele foi desenvolvido e como que a gente chegou naquele naquela interface que a gente pode estar conversando

com com chat com bastante ali e que ele consiga tá trazendo informações relevantes para as nossas perguntas relacionadas ao contexto da bixtecnologia então passando aqui para o nosso código aqui a gente tem a forma que foi utilizada foi em forma de notebook que é uma forma mais ilustrativa e que a gente consegue estar entendendo passo a passo de que que tá acontecendo Então só Relembrando o nosso objetivo é aproveitado o conteúdo já disponível no site da empresa para criar um site ou criar um assistente que possa responder questionamento dos usuários e clientes é como a

gente vai fazer isso a estação de dados pessoais no site através de web scraping o preço do site vamos utilizar de inbach para extrair o significado das palavras em um texto através da selenidade similaridade semântica o imbeja então será utilizado como contexto para criar um conhecimento customizado ou Costão dalland ao chat GPT e assim o assistente irá responder perguntas com base no conhecimento específico que foi disponibilizado ali para o assistente e por fim a gente vai disponibilizar a interface onde o usuário pode estar fazendo o questionamento ali de forma simples Então aqui tem os primeiros

passos para a gente estar configurando ali a nossa chave api a gente vai estar utilizando mais para frente ali para tá fazendo a requisição do tanto modelo de Bad enquanto o modelo de que faz a resposta da que traz a resposta das perguntas que a gente faz legal inicialmente aqui a gente faz é a gente importa os pacotes necessários rodando-se esse código temos aqui os pacotes mais Gerais que é mais é utilizado na parte de ciências de dados ali é temos os pacotes para scraping um pacote aqui para interface e alguns Alguns pacotes ali que

são utilizados junto com api da Open então inicialmente aqui a gente começa com a bicicleta em que Relembrando a gente vai estar buscando nesses sites aqui que eu disponibilizei a gente vai estar vasculhando e coletando os dados pessoais desses sites a gente poderia estar trazendo as informações de todos os as abas e URL desse domínio Porém isso ia ficar bem grande e a trazer muita informação e e na hora que a gente fosse treinar ali o nosso indeed e fazer requisição da api ia ter muitos tokens e isso ia ficar bem Custoso e bem demorado

Então o que eu fiz foi trazer somente os realiza ali do da página principal do site da bixtecnologia teria outra forma de fazer isso que seria vasculhando todo o domínio mas eu optei por fazer dessa forma aqui a gente tem efetivamente o código que faz o scraping desses sites então a gente passa essas mulheres que estão em forma de lista para essa função é criado uma pasta com o nome do domínio da Big tecnologia que no caso a gente pode estar olhando aqui aqui a gente tem essa pasta criada e aqui dentro a gente vai

ter para cada para cada um dos url que a gente passou ali em cima vai ser criado um arquivo TXT e dentro desse arquivo TXT a gente vai ter todo o conteúdo textual desse site Então vamos dar uma olhada aqui a gente vai ter alguns algumas partes alguns ruídos espaço espaçamento E aí a partir mais para baixo aqui a gente vai ter um pouco do texto desse que tá dentro desse site né a gente vai tratar esse espaçamentos um pouquinho mais para frente então não tem tanto problema isso então aqui as pastas estão sendo criadas

com o nome do domínio se já existe ele faz uma verificação e aqui é a parte efetivamente do que a gente está usando essas bibliotecas para tá abrindo o site analisando o conteúdo e trazendo para para aqui para o nosso código e salvando em um txt então aqui a gente vê o código que ele rodou ele tá fazendo o URL essa parte de extração e aqui a gente vai para a parte de processamento do texto como eu falei ali tem bastante ruído dentro desses textos e essa funçãozinha a gente vai estar removendo essas quebras de

linhas os passamentos para ficar um texto um pouco mais com menos ruído e somente com as informações textuais relevantes para a gente né aqui a gente passa esse esse código e faz o tratamento E no fim a gente vai estar salvando esse esse Todas aquelas páginas que foram extraídas e salvos né a gente vai estar abrindo e criando um Data Frame que é um objeto aqui do da biblioteca do pandas e vai estar armazenando todos os textos em forma de tabela né em formato starbulário então para cada para cada é URL ali domínio da Bix

a gente vai estar salvando o seu respectivo texto em uma coluna desse em uma linha e coluna desse dessa tabela chamada frame né aqui a gente faz somente uma verificação do número de páginas traídas e o número de páginas que a gente formou inicialmente para ver que tá batendo exatamente então a gente passou para o nosso código para ele tá fazendo a extração de 19 páginas e ele realmente é conseguiu extrair 19 urls né E aí a gente vai para a parte de tokens que como a gente fala antes a gente tem um texto corrido

um texto inteiro e para quando a gente vai utilizar vai tratar de processamento de linguagem natural é interessante que esse texto esteja decomposto em pequenas partes de palavras mais especialmente os tokens Então a gente vai estar utilizando uma biblioteca que é recomendada Ali pela documentação da opennai que se chama Tik Tok e esse e essa biblioteca vai estar sendo responsável para tá fazendo a atualização desse texto e aí é que a gente tem uma distribuição interessante que a gente está fazendo um gráfico de histograma para visualizando a distribuição do número de toques por linhas linhas

Desse nosso frame que no caso cada linha representa o conteúdo de um site uma url que a gente passou que a gente trouxe do Web scraping essa informação vai ser relevante um pouquinho mais para frente porque a gente vai ter que diminuir o número de tokens é limitar o número de toques que a gente vai estar passando para o treinamento dos indeges então a gente vê aqui de novo a gente salvou o nosso data em uma nova coluna em que a gente tá incluiu o número de toques para cada página aqui eu falo um pouco

que sobre a perda de inveja que ela possui número limitar o limite de número máximo de toque de entrada que a gente pode estar passando para o impede mas nosso caso a gente não vai estar atingindo número limite porém como a gente está utilizando uma API gratuita é acontece de quando a gente fazer as requisições ele dá um erro de requisição que no caso a gente está fazendo muitas requisições no curto espaço curto espaço de tempo e essas requisições acabam atingindo rapidamente o limite máximo que a gente consegue fazer diariamente Então a gente vai estar

limitando aqui em esse nosso Data Frame a gente vai estar limitando para cada linha que a gente tá passando em um número máximo de 500 tokens então nessa parte do código é que a gente definir uma função que vai estar percorrendo esse nosso Data Frame e vai estar verificando se aquela linha possuem o número de toque em maior que 500 se ele tiver ele vai quebrar esse essa linha mais de uma e vai gerar uma linha nova e vai estar separando aqui o texto Então no caso se a gente tem uma uma página que tinha

um número de tokens de 900 a gente vai estar separando no Data Frame em duas linhas uma com 500 toucas tokens e outra linha com 400 toques restantes não é interessante colocar um número de tokens aqui muito baixo porque quando a gente se a gente diminui muito esse número de toques quando a gente passar para inveja lembra que a gente está tentando trazer a relação semântica entre outras palavras então entre as palavras e cada palavra individualmente e as palavras não acontece Então se a gente diminui o número de tokens a gente vai estar passando a

gente vai estar limitando o contexto que essa palavra tá inserida então pode ser que mais para frente o nosso é o nosso chat Assistente ele não tenha tanta noção do contexto em que aquelas palavras então inseridas e pode ser que a respostas deles não a resposta dele não seja tão precisa e não consiga trazer as informações que a gente está realmente querendo encontrar então pode ser que em uma página que a gente a gente tem ali o serviços que a Bix oferece se a gente separar por exemplo o serviço de data Science lá tá bem

explicadinho se a gente separa em dois em duas linhas Pode ser que ele não correlacione um serviço com outro então é por isso que não é tão interessante a gente colocar um número de tal questão embaixo legal então aqui a gente tem a visualização novamente que a gente vê que é ali Nossa Data Frame a gente ficou limitado no máximo agora em 500 tokens e antes a gente tinha casos em que tinha 2.250 tokens né E só para ver aqui também o número total aos pouquinhos que a gente vai ter no nosso treinamento isso aqui

é interessante para a gente ter um [Música] saber de antemão quanto que a gente vai estar gastando para treinamento do nosso imagine porque a api ali a gente tem um curso por cada mil tokens Então a gente vai ver isso mais para frente aqui só mostrando novamente que está limitado em 500 tokens e agora antes a gente tinha 19 linhas a nossa Data Frame e separando com o limite máximo de 500 tokens agora a gente tem 33 linhas no nosso Data Frame para treinar e aqui na parte de inveja novamente para que a gente vai

estar utilizando para entender a parte semântica a gente vai estar usando o modelo Texx modelos mais recomendados por conta do preço baixo que ele tem e o Bom desempenho que ele consegue tá trazendo para gente aqui tem um blogzinho aqui da opinião que você pode estar lendo um pouco mais sobre esse modelo de imaging e aqui a gente tem o valor do preço por cada requisição da api por cada mil tokens Então o valor de requisição é 0,001 centavo de Dólar para cada mil tokens então a gente pode ter uma Estimativa de quanto que vai

custar o nosso treinamento utilizando os 15 mil tokens né que a gente tinha aqui 15 mil e 34 tokens então o preço total do nosso treinamento desse embeding para requisição todas as requisições que a gente vai fazer vai ficar em 00 15 centavos de dólar que é um preço super baixo visto que a gente tem gratuitos ali cinco dólares para a gente tá tá gastando de forma gratuita né legal Aqui é aqui a gente vai ter uma funçãozinha para armazenar ali o Nossa chave a chave api que a gente pegou lá do site da plataforma

do Então seria legal você não deixar essa chave pública no caso é interessante que você crio quando você tiver fazendo um projeto você cria um arquivo esse arquivo você torna ele secreto e você armazene a sua chave api lá dentro e cria uma função para estar lendo esse arquivo e salvando essa epi Então esse código tá trazendo a minha chave de API e aqui efetivamente a gente está fazendo a parte de Treinamento com idade esse código tem algum algumas [Música] formas de contornar alguns erros que ele acontece por eu estar fazendo o número alto de

requisições Então se a gente tiver aqui o código ele ele faz o ibed indica de linha por linha do nosso Data Frame no caso aqui ele vai ter 33 requisições para treinamento de imagem do texto e algumas vezes ele acontece um erro de pela taxa de requisição e eu só coloco um ali um tempo para ele ficar esperando e depois fazer a requisição novamente assim a gente consegue efetivamente estar fazendo o impede em nosso texto Então aqui a gente consegue visualizar é aquele espaço vetorial que a gente falou antes para cada token a gente vai

ter um valor que tá ali dentro daquele espaço e se a gente fizer a distância entre diferentes tokens a gente consegue entender a similaridade entre eles né aqui só só fazendo mais aplicando o impedem para um csv no caso daquele que já é o texto anterior que eu tava trazendo antes e Essa parte a gente vai estar indo para realmente fazer o nosso chat assistente então aqui a gente definir a outra função que é responder o questionamento que a gente vai estar utilizando um outro modelo não é mais o teste em Bad 002 a gente

vai estar usando o text da Vinci é 003 que é um modelo para realmente fazer a trazer a resposta para uma pergunta e a gente vai estar usando aquela função que a gente criou anteriormente para criar um contexto para essa essa resposta que que essa outra esse outro modelo vai estar utilizando então aqui a gente cria um contexto a gente define essa função de compliction que no caso a gente Define um prompt esse prompt vai ser que a gente que eu defini aqui para esse caso é responda as perguntas com base no contexto abaixo que

no caso é o contexto que a gente criou ali na função anterior e se a pergunta não puder ser respondida diga eu não responder isso aqui a gente definiu o contexto e a pergunta é a question essa pergunta é uma pergunta padrão que a gente definiu aqui só para sempre ter isso como resposta aqui tem algumas outros parâmetros mas é basicamente seria isso a gente pode rodar aqui um exemplo de que a gente é para ver se realmente está funcionando esse esse assistente se ele realmente está respondendo esse questionamentos então aqui a gente chama aquela

função é de question perguntamos O que que a bixtecnologia e a função vai retornar pra gente saber que isso é uma consultoria de dados com foco em negócios de resultados utilizando os principais ferramentas de tecnologias mercados novamente projetos que ajuda os nossos clientes a extrair o máximo de valor dos seus dados e transformar digitalmente a gente pode fazer algumas outras perguntas também vocês podem me ajudar e ele responde eu não sei responder isso isso acontece porque o domínio de o contexto ali que a gente passou para os inbets não não tem nada que seja parecido

com esse tipo de pergunta então ele não anucina trazendo resposta para essa pergunta né então agora a gente vai ver um pouquinho da parte da interface que vai ser utilizado para a gente interagir com assistente em forma de conversa né assim como a gente faz no chat GPT aqui a gente está definido uma uma função que vai servir de auxiliar para tá mandando a pergunta que a gente fizer ali lá no ali no assistente lá para aquela pergunta de responder o questionamento que vai fazer requisição lá na api do operar e aqui efetivamente a gente

gera os componentes ali da nossa interface tem algumas imagens que a gente está colocando estilização a gente gera traz alguns componentes já pré-prontos ali da biblioteca do pacote de grade define algumas coisas e aí a gente tá pronto aqui para realmente abrir no nosso navegador que a gente pode fazer segurando o controle do teclado e clicando com o botão esquerdo do mouse Então vamos abrir aqui aqui temos a nossa interface de assistente e vamos fazer algumas perguntas aqui vamos tentar perguntar qual que é o telefone da Bic vamos ver se ele é capaz de responder

para gente então o telefone da Bix seria esse daqui depois a gente pode estar confirmando lá vamos ver se ele acertou [Música] vamos ver aqui embaixo Qual que é o telefone se ele mostra para a gente então aqui a gente tem um telefone aqui do Brasil 996595490 então o nosso assistente aqui acertou vamos perguntar algumas outras coisas quais vagas de trabalho estão abertas vamos ver se ele responde para gente a gente tem atualmente a vaga de estágio comercial 100% remoto aberta não sei se está atualizado ou totalmente Pode ser que seja ou não se quiser

dar uma olhada lá entre nosso site e veja a página de carreira vamos perguntar alguma outra coisa aqui para para ele perguntar vamos ver se a pergunta um pouquinho mais absurda se ele consegue responder para gente quero prever o dia de amanhã vocês podem me ajudar Eu não sei responder isso então a gente vê que ele realmente ele consegue trazer respostas que estão dentro do domínio que a gente trouxe lá dos da parte de extração através do webscraping todo o treinamento que a gente fez e aqui ele ele não não consegue trazer respostas que não

estejam dentro desse contexto que a gente trouxe ali para o treinamento né então vamos voltar ali para o nosso slide e aqui a gente vai falar um pouquinho de aplicações né fiquem à vontade depois para tá explorando mais essa ferramenta brincando fazendo várias perguntas ver o que que ele consegue qual potencial dele dessa dessa aplicação ou não e aqui a gente vai falar um pouquinho mais de quais aplicações que onde que a gente pode estar usando esse essa ferramenta né então qualquer qualquer empresa negócio que tenha muito documento que tenha bastante informação do negócio regras

negócios ali armazenadas então estão não precisa ter tanta coisa guardada assim a gente como a gente vê aqui a gente fez uma aplicação simples apenas usando os dados do site ali é informações que equipes já foram ali ao longo do tempo é curando essa informações criando e botando trabalho em cima Então já foi suficiente para a gente fazer uma aplicaçãozinha aqui legal então Alguns alguns casos poderiam ser setor de atendimento ao cliente a gente poderia fazer aplicar isso no motor de busca para estar ali fazendo busca de documentos internos de empresas a gente também poderia

estar utilizando para aplicações que querem extrair informação de dados não estruturados como que é como é o caso ali esse caso que a gente que eu apresentei para vocês também pode estar utilizando para central de conhecimento técnico de empresa caso tenha vários projetos já realizados no passado a gente pode estar alimentando esse modelo com esse com as informações desses projetos e depois tá utilizando esse assistente para consulta fazer a gestão interna de conhecimento a gente também pode imaginar uma empresa ali que recebe muitos currículos a gente pode estar treinando gerando prompts mais específicos para tentando

extrair os Esquilos desses desses currículos para ver se encaixa ali com a cultura com FIT da empresa imaginando também uma empresa que tem vários pdfs de documentos técnicos a gente pode estar também treinando um assistente ali para estar trazendo essas informações e deixando os usuários desses documentos técnicos com o poder ali de estar acessando as informações de forma mais rápida e chegamos ao fim da nossa Desse nosso tutorial agradeço muito Quem esteve aí presente que se ficou à disposição para receber feedback Se quiserem conversar mais sobre o caso de utilização também me coloca à disposição

fica aqui o meu contato minhas formas de estar entrando em contato comigo também tem QR Code aqui para o meu LinkedIn Bora conversar e entender mais é outro tipo de utilização que vocês tenham pensado e vou deixar esse conteúdo disponível para quem quiser tá tendo acesso depois e tá explorando um pouco mais das possibilidades Agradeço a todos fiquem com os próximos conteúdos que vão estar rolando aí na semana de dados de 2023 e muito obrigado até mais [Música]