Novo o1 (Strawberry) da OpenAI Chegou: E é INCRÍVEL! (Testes)

47.53k views2610 WordsCopy TextShare

Paula Bernardes

O GPT o1 (Strawberry) acabou de chegar no ChatGPT e já está fazendo a cabeça de todo mundo! Eu teste...

Video Transcript:

fazem só algumas horas que o GPT o One Tá disponível no chat GPT e a galera já tá enlouquecendo com esse novo modelo não é à toa né ele realmente raciocina melhor do que o GPT 4 Omni que é a versão anterior do chat GPT Eu Fiz alguns testes e vou mostrar aqui para você e a gente vai fazer alguns testes juntos também junto com as demonstrações que a Open disponibilizou aí pra gente nesses testes vocês vão ver as diferenças entre os modelos realmente o o One com o sistema strawberry é bem mais lerdo que

o GPT 4 Omni Mas vocês vão entender o porquê né o nível de raciocínio dele é outro e ele serve para coisas mais específicas Então bora explorar esse novo modelo Só te peço já para se inscrever no canal se você gosta de tecnologia ainda não é inscrito aqui no canal e ativa o Sininho para ficar sempre atualizado sobre as últimas notícias de Tecnologia de Inteligência Artificial Bora lá então nesse vídeo de apresentação da open eles estão explicando o que torna o One é um modelo assim tão especial e como ele se destaca em relação aos

modelos anteriores como GPT 4 a principal característica do o One é que ele é um modelo de raciocínio então diferente dos modelos anteriores que simplesmente davam ali respostas rápidas sem pensar muito sem muita reflexão o o One pensa mais antes de responder então isso leva resultados aí deveria levar resultados melhor ores né especialmente em questões mais complexas também mencionaram aqui no vídeo da apresentação que eles estão lançando dois novos modelos que é o o One preview Então se a gente entra aqui no chat GPT além do GPT 4 Omni a gente tem aqui o o

One preview que usa um raciocínio mais avançado e o o One mini que tem aí um raciocínio mais rápido te dar as respostas mais rápido e aí no vídeo de apresentação eles explicam né o que que é o raciocínio né usando como exemplo pergunta simples como Qual é a capital da Itália para uma pergunta assim a resposta é muito simples né e direta que é Roma mas para questões mais complicadas como criar um plano de negócios ou escrever um romance por exemplo o ideal é pensar mais e elaborar melhor né então quanto mais tempo você

se dedica ao raciocínio melhor vai ser o resultado né eles disseram isso na apresentação e falaram que é isso ISO que o One faz né ele transforma esse tempo de reflexão em respostas mais complexas e eficazes e realmente nos testes ele demora aí bem uns 10 segundos depende da da pergunta né do pedido que você faz do prompt que você manda para ele ele demora por volta aí até de 20 segundos às vezes então eles também falaram né Um pouquinho sobre o desenvolvimento do ow One né durante que durante o treinamento eles perceberam que ao

invés de pedir PR os humanos né darem exemplos de cadeias de pensamento para pro modelo seguir eles treinaram o o One para gerar e melhorar eh suas próprias cadeias de pensamento então isso Acabou aí se mostrando ainda mais eficaz segundo eles né E esse Foi um momento aí de arrar para eles né que eles perceberam que eles estavam criando uma coisa muito inovadora e poderosa segundo eles então Eh eles compartilharam também um exemplo específico né relacionado a problemas de matemática em que os modelos anteriores não questionavam os seus próprios erros mas o o One foi

treinado para refletir questionar e isso resultou aí um desempenho significativamente melhor nos testes de matemática segundo a equipe da openi e esse raciocínio profundo é que faz esse novo modelo aí ser diferente dos nov dos modelos anteriores e essa capacidade aí de pensar né antes de responder é que torna esse modelo mais inovador o um One Shang que trabalha lá na Open ai né ele deu um exemplo bem simples mas que serve para mostrar a diferenç entre os modelos antigos e o novo o One A ideia era só contar quantos RS tem na palavra strawberry

né então ele perguntou aqui pro modelo a gente pode ver aqui que ele tá usando o GPT 4 Omni que é o modelo anterior perguntou aqui quantos quantas letras RS tem na palavra strawberry né morango e o GPT 4 Omni o modelo anterior respondeu que na palavra strawberry tem do R né a gente vê aqui que não ele tem três RS fora esses dois aqui do final ele tem também esse antes do T da letra T E aí é que vem a pergunta né Por que que o modelo tão avançado como GPT 4 comete um

erro assim tão grotesco né tão simples a explicação que ele deu aqui foi que esses modelos foram construídos para processar texto de uma forma um pouquinho diferente né que seria usando subpav ras ou pedaços da palavra das palavras né ao invés de analisar cada caractere de uma forma individual Então quando você faz perguntas que envolvem assim contar letras ou entender caracteres específicos o resultado pode não ser tão bom como a gente viu aqui né porque não foram exatamente projetados para isso segundo o nosso amigo aqui né E aí ele faz um novo teste né agora

com o modelo novo né w One preview a gente vê aqui né mesma pergunta quantos quantas letras RS tem na palavra strawberry e a resposta foi né ele demorou aqui um pouquinho tava pensando e aqui ele respondeu que tem três letras RS na palavra strawberry então o ponto interessante aqui é que o ow One tem essa habilidade de raciocinar né O que ajuda a a não cometer esses erros tão bobos como o GPT 4 Omni cometeu né então ele consegue revisar o próprio pensamento e ser mais cuidadoso antes de soltar uma resposta e isso acaba

fazendo uma diferença muito grande como a gente viu aqui né mesmo em coisas que são aparentemente aí simples como contar letras então vamos fazer o teste aqui a gente também então aqui eu tô no GPT 4 Omni né no modelo anterior e quando eu faço essa pergunta aqui para ele né quantas letras R tem em strawberry e envio para ele ele rapidamente me responde que a palavra strawberry tem duas letras R ou seja o nosso querido GPT 4 erra agora quando eu venho aqui abre um outro chat né e coloco aqui e o novo modelo

ou One preview e faço exatamente a mesma pergunta vamos ver o que que ele me responde mas aqui ele acerta né ele raciocinou mais pensou mais e diz que é a palavra tem possui três letras R então está correto nesse vídeo aqui ele trouxe um exemplo né que é um ótimo teste para ver como o novo modelo de Inteligência Artificial lida com situações de raciocínio de senso comum e Especialmente quando envolve física e objetos do mundo real então ele começou explicando que os modelos de linguagem anteriores né tipo GPT 4 e outros não eram tão

bons com esse tipo de raciocínio S né O problema que ele usou para testar foi o seguinte aqui ele escreveu em inglês né que o morango é colocado dentro de uma xícara né E essa xícara é virada de cabeça para baixo em cima de uma mesa Aí depois alguém pega essa xícara e Coloca ela no micro-ondas a pergunta é onde o morango ficou então para qualquer pessoa a resposta é muito óbvia né o morango ficou em cima da mesa porque a xícara virada de cabeça para baixo e o morango caiu na mesa certo e aí

quando ele levou a xícara pro micro-ondas o morango não tava mais lá ficou na mesa mas pros modelos antigos segundo a demonstração aqui às vezes essa resposta não é tão Clara porque eles têm dificuldade de lidar com a lógica física dos objetos e agora ele queria ver como no novo modelo ou One se sairia com esse tipo de problema né e o interessante é que o ow One leva aí um tempo para pensar e e analisar a situação antes de dar resposta e ele processa as leis da física e o cenário para entender o que

tá acontecendo e isso já mostra que o modelo tem um raciocínio então mais cuidadoso né tentando aí se certificar de que entende o contexto antes de responder E aí ele deu essa explicação aqui que não só a resposta tá correta mas também ele deu os passos do raciocínio dele para chegar nesse resultado né né então o que ele queria mostrar aqui é que em problemas que envolvem objetos físicos né e as leis das físicas os modelos antigos podiam se atrapalhar um pouquinho né mas o novo modelo tem aí uma abordagem mais profunda né então não

só d a resposta correta mas também tenta explicar o por que aquilo aconteceu mostrando um raciocínio mais refinado né e isso é bem legal porque Mostra aí que o w One é capaz de lidar melhor com situações do dia a dia que e pode envolver um senso comum né coisas que os exemplos anteriores ainda estavam aprendendo a fazer mas vamos testar isso na prática eu tô aqui no modelo antigo né no GPT 4 Omni E eu perguntei para ele exatamente o que a pergunta que foi mostrada na apresentação né E aí ele me respondeu o

morango ficou dentro da xícara mesmo depois da xícara ter ter sido virada de cabeça para baixo e colocada no micro-ondas quando quando alguém vira a xícara o morango fica preso no interior da xícara que agora tá de cabeça para baixo sobre a mesa quando a xícara é colocada no micro-ondas ela também mantém o morango preso pois não tem espaço ou força para sair a menos que seja movimentado propositalmente assim hum errada já quando a gente vem aqui né no modelo novo One preview e faz a mesma pergunta vamos ver o que que ele vai responder

Como já esperado ele vai demorar mais para raciocinar Mas até que foi rapidinho vamos ver se tá certa a resposta né o morango ficou na mesa muito bem né quando a xícara que estava virada de cabeça para baixo sobre a mesa com o morango embaixo é levantada para ser colocada no micro-ondas o morango permanece sobre a mesa e ainda dá uma outra um outro ponto de vista aí né que a menos que alguém tenha cuidadosamente pegado o morango junto com a xícara ele não estaria dentro do micro-ondas né então aqui a gente consegue ver a

diferença entre os dois modelos certo agora olha só eles fizeram aqui uma apresentação de um quebra-cabeça né que é daqueles eh que fazem a cabeça dar um nó mesmo né Ele contou que um o enigma veio de um jogo de computador que ele jogava quando ele era criança né e pelo visto é o tipo de problema que precisa aí de um bom tempo para ser resolvido a frase é meio confusa mas basicamente o desafio sobre fala sobre a idade de um príncipe e de uma princesa com algumas condições bem específicas né O Enigma diz que

a princesa terá a mesma idade que o príncipe terá Quando ela for duas vezes mais velha do que ele era quando a idade dela era metade da soma das idades atuais dos dois bem complicado né É aquele tipo de pergunta que você lê aí umas duas três vezes antes de começar a entender o que tá rolando né né então o interessante aqui é que ele resolveu testar esse cara aqui como é o novo modelo de Inteligência Artificial ow One lida com esse tipo de problema que existe aí exige aí bastante raciocínio lógico e o modelo

assim como a pessoa precisou aí de um tempo para pensar e traduzir o quebra-cabeça em equações matemáticas né que fazem sentido para encontrar essa solução e enquanto o modelo aí pensava né dava para acompanhar o processo de raciocínio né ele vai falando que ele tá fazendo né e tentando decifrar aí as equações e as condições que as idades do príncipe e da princesa precisavam cumprir e depois aí de um tempo o modelo Finalmente chegou à resposta né E foi bem interessante aqui ver como ele explicou o caminho para chegar nessa resposta para decodificar o enigma

e apresentar a solução correta né olha quantos cálculos ele fez aqui para chegar aqui numa conclusão e na resposta final então aqui a gente vai fazer o mesmo teste a gente vai fazer Exatamente exatamente a mesma pergunta em português pro GPT 4 Omni o outro modelo e ele tá aqui respondendo né fazendo também seus cálculos que detalhe que no prompt tinha forneça todas as soluções para essa questão então ele tá se esforçando aqui para fazer os cálculos e mostrar todas essas soluções e aí ele me responde aqui que o príncipe tem 14 anos e a

princesa tem 21 anos né então a princesa é mais velha do que o príncipe e essas são as idades que satisfazem as condições fornecidas pelo problema agora vindo aqui no GPT o One eu vou fazer exatamente a mesma pergunta eu já sei que ele vai demorar mais né já demora em questões menos complexas Essa é um pouquinho mais complexa E como eu falei como mostrou no vídeo de apresentação ele vai dando aqui todo e os passos que ele tá seguindo para eh dá essa resposta né então ele vai falando tudo que ele tá fazendo aqui

se você clicar aqui na setinha tem o passo a passo do que ele usou tá vendo de como ele fez para raciocinar e pensar nessa na solução desses desse problema né Então tá aqui uma coisa enorme né Ah ele fez aqui até uma tabela né e a resposta final foi que as idades do príncipe da princesa são múltiplos de seis e de oito que exatamente a mesma resposta que ele deu aqui no vídeo de apresentação né em inglês que as Ades são são múltiplos de seis e de o então ele não só acertou né a

a resolução do problema como ele também e mostrou aqui o passo a passo que ele usou mostrou todas as soluções detalhadas Então esse é mais um exemplo como esses novos modelos de a conseguem lidar com problemas que envolvem não só cálculos mas também interpretação de texto raciocínio l Lógico né uma coisa que nem sempre é fácil de fazer nem pra gente então essas demonstrações que a gente viu né E esses testes que a gente fez tem mais demonstrações no canal da Open ai vocês podem entrar lá e dar uma olhada mas isso tudo aqui mostra

que o One One vai além do que os modelos anteriores podiam fazer especialmente em situações que envolvem aí um nível de raciocínio mais profundo né e a análise de padrões complexos então é como se ele tivesse uma ferramenta de quebra código embutida que faz ele lidar com problemas que parecem ser impossíveis assim olhando de primeira né E você que que você achou do W One você já testou deixa aqui nos comentários que eu quero saber e clica aqui nesse card para ficar ainda mais atualizado sobre tudo que tá acontecendo no mundo da Inteligência Artificial Hoje

Eu Sou a Paula Bernardes e até o próximo vídeo