O que é LLM? Como funciona o ChatGPT - Explicação para Iniciantes

732 views1229 WordsCopy TextShare

Cafe Com Inovação

🗒 SOBRE ESSE VÍDEO Neste vídeo, eu explico o conceito de Large Language Models (LLMs) para leigos. ...

Video Transcript:

eu fui desafiado isso mesmo eu fui desafiado a explicar o que é llm este conceito que está aparecendo toda hora na internet devido à Inteligência Artificial de uma maneira bem simples Então bora lá minha função aqui é explicar o que é llm de maneira bem simples isto talvez tenha acontecido porque eu tenho um vídeo que eu expliquei o que é e a generativa eu vou deixar o link aqui em cima para que depois não agora você vai lá e assista a minha ideia foi explicar este conceito que está tão na moda todo mundo está falando

mas o que que é e a generativa e o conceito é par leigos a ideia aqui deste vídeo é explicar o que é llm par leigos também talvez você já tenha escutado este termo LM que significa large language Model ou modelo de linguagem grande se você fizer uma tradução ao pé da letra e estes são os modelos utilizados dentro do chat GPT do Gemini do Cloud 3 entre tantas outras ferramentas de Inteligência Artificial que talvez você já esteja usando no dia a dia mas como elas funcionam no final das contas pense o seguinte essas ferramentas

são algoritmos de computador que aprenderam ao longo do tempo com muitas informações é como se a grosso modo fossem treinados com vários e vários textos artigos fotos vídeos tudo foi passado para estas inteligências artificiais para que elas pudessem aprender então se você você pegar o chat GPT por exemplo ele é um modelo de linguagem natural que interpreta a sua pergunta o seu prompt e continua o texto ele dá uma resposta mas poxa Quer dizer então que ele sabe o que eu estou perguntando não a grossissimo modo o chat GPT funciona como o completador de textos

do seu celular você já utilizou ele aí né Você já usou ele aí né independente do seu celular se você sempre clicar na sugestão de palavras aparente mente ele vai criar alguma coisa que faça sentido no começo Então quando você clica em várias palavras ele vai começar Bom dia tudo bem então ele vai montando algumas palavras algumas sentenças que fazem sentido mas depois de um tempo ele começa a se perder é claro que o completador de textos do seu celular ele é um pouco mais simples Aliás bem mais simples do que todos os chats gpts

Gemini e etc mas já dá para ter uma ideia como é que ele funciona ele funciona com a probabilidade da próxima palavra o chat GPT o Gemini entre outros funcionam da mesma maneira então depois de lerem muitos textos e artigos existe uma matriz de probabilidade para a próxima palavra quando você faz uma pergunta e ele completa com uma resposta ele completa baseado em tudo que ele foi treinado principalmente com a próxima palavra só que como esses modelos eles são bem grandes e bem mais complexos ele consegue dar uma janela de resposta bem maior do que

o seu celular então a grosso modo é como se esses modelos eles existissem uma tabela de probabilidades para a próxima palavra o que ele faz é completar textos tanto que o chat GPT por exemplo se você pedir para ele gerar uma imagem ele não vai fazer isso claro tem um modelo específico para a geração de imagens mas a princípio o modelo tradicional por exemplo o modelo gratuito ele não gera imagens porque ele é um modelo para completar textos então espero que até aqui você tenha entendido que esses modelos como o chat GPT eles não são

super inteligentes são apenas algoritmos treinados para dizer a próxima palavra é claro com uma janela bem maior tanto é verdade que ele não consegue pensar ele não consegue raciocinar um exemplo bem simples eu faço uma pergunta para o chat GPT quantas calorias eu consumir hoje e a resposta obviamente ele não sabe para calcular quantas calorias você consumiu hoje você precisaria fornecer informações detalhadas sobre sua alimentação ao longo do dia veja que ele não sabe ele não sabe da minha prática do que eu fiz do que eu comi agora se eu passar mais informações para ele

ele consegue me dizer as probabilidades talvez da quantidade de calorias E aí sim ele consegue me ajudar mais agora se eu passar um pouquinho mais de informação por exemplo dado que hoje eu comi 200 g de frango grelhado 250 g de arroz integral 150 g de legumes beringela cenoura e abobrinha e 80 g de salada caramba essa minha Nutri vai ficar até orgulhosa mas é só um exemplo tá veja que agora ele consegue me ajudar um pouquinho mais ele fala quanto tem de calorias para cada um desses elementos que eu coloquei e ao final ele

fala que eu comi aproximadamente 725 calorias isso porque ele é médico Isso porque ele é nutricionista não porque da maneira em que ele foi treinado ele consegue algumas aproximações sobre o que eu passei de comida e aí sim ele consegue me dar o quanto eu consumi de calorias Então quando você pede uma informação sobre Quais são as características dos textos de William Shakespeare ele consegue me fornecer algumas informações como versatilidade linguística complexidade psicológica temas universais variedade de gêneros características intertemporal intemporal ele passa algumas informações baseadas em em todos os textos que ele já leu a

respeito disso não que ele seja criativo para me gerar essa resposta ou seja se você pedir para ele dar uma resposta como se fosse o William Shakespeare ele vai pegar essas características e vai dizer as probabilidades das próximas palavras baseadas mais ou menos nesse conhecimento então vejam esses modelos eles não são inteligentes eles não são criativos eles só são completador de próximas palavras é claro que essas janelas que nós chamamos de processamento de tokens está aumentando cada vez mais ou seja a probabilidade Dee entender textos mais complexos maiores textos está aumentando cada vez mais mas

também não podemos esquecer que tudo isso requer processamento e não é à toa que a Nvidia é a empresa do momento vendendo suas placas seus chips que processam cada pergunta que nós fazemos no chat GPT por exemplo então algumas perguntas que as pessoas me fazem sabemos como eles foram treinados não o chat GPT não é um modelo có aberto existem modelos código aberto em que as pessoas podem treinar as suas maneiras inclusive implementar dentro da sua empresa localmente o que melhora e muito a segurança da informação eu espero que Com estes exemplos você tenha entendido

que basicamente esses modelos eles funcionam através de matrizes de probabilidades das próximas palavras é claro que a explicação técnica pode ir muito além tem aí a complexidade de como esses algoritmos são feitos questão de bytes bits mas eu não vou falar nesse vídeo a ideia desse vídeo é ser rápido apenas para explicar como funciona um modelo llm Espero que você tenha entendido aí do outro lado já deixem aí nos comentários Quais são as dúvidas e quais são os outros temas que eu deveria explicar aqui no canal como se fosse de uma maneira bem simples ou

seja de uma maneira para leigos enquanto isso veja esse vídeo que eu fiz com o chat GPT para que você se torne cada vez mais produtivo corre lá