e quem já testou essa nova Inteligência Artificial e conta tudinho pra gente é o Roberto penes Pinelli que é físico pela USP com especialidade em machine learning por Stanford e pesquisador na área de Inteligência Artificial hoje temos quase uma edição extraordinária da coluna Fala aí não é então vamos com ele boa noite pena E aí Marisa tudo bem Tudo bem pessoal loucura loucura no mundo da Inteligência Artificial porque hoje hoje a Open a lançou dois modelos novos que parecem ser realmente muito muito incríveis aí porque eles resolvem problemas de raciocínio eles são modelos que são
feitos para poder e eh realizar tarefas mais complexas que exijam aí um pensamento mais refinado que normalmente os modelos não não conseguem entregar né você passa uma tarefa um pouco mais complexa um desafio de lógica mais difícil eles se perdem completamente então esses dois modelos Quais são esses dois modelos um se chama 01 preview e o outro chama 01 mini tá então é GPT 01 preview GPT 01 Mini é o esse preview ele é esse nome preview é que a gente não tá ainda com modelo pronto eles estão treinando ou já devem ter prontos mas
ainda não liberaram um modelo maior mais robusto e eles deram só uma um preview só um um gostinho desse novo modelo mas o mini não o mini é um modelo menor mas que já faz muitas coisas interessantes Então vamos entender o que que que que são esses modelos então primeira coisa eles já estão disponíveis para quem é assinante da openi quem paga lá um plano plano Plus já chegou tá já tá disponível inclusive para mim eu já consegui acessar eu já consegui fazer testes eu já testei em primeira mão esses modelos eh Então a primeira
coisa que a gente e precisa entender esses modelos é que eles já performam muito melhor em em em questões de matemática e de lógica Então a gente tem e como exemplo eh algumas alguns testes que são feitos pros modelos baseados na olimpíada de matemática tá que é Um Desafio que tem aí todo ano né estudantes e passam por esse desafio quem quer obviamente participar e é muito difícil são problemas realmente muito complicados que exigem muito pensamento abstrato raciocínio lógico e é normalmente o GPT 4 O que é o modelo anterior né o melhor modelo aí
um dos melhores do mercado inclusive ele só faz 13% aí dessas perguntinhas né de de qualificação pras Olimpíadas enquanto que esses novos modelos o mini por exemplo 01 mini faz chegou a fazer 83% é um salto absurdo E aí quando você compara com vários tipos de perguntas desse calibre ou Desafios que um estudante de PHD por exemplo precisa a ter esses modelos fazem muito melhor então Eh já é comparável né Mais ou menos a capacidade de um desses modelos de de resolver problemas como de um estudante o phd em em em alguns tipos de de
matéria em alguns tipos de de áreas Então isso é surpreendente E como que eles conseguiram isso né bom eles não contaram pra gente qual que é o segredo Alguns falam Será que é o o tal do killstar que é a nova técnica lá de de fazer um mudar um pouco a arquitetura de Treinamento desses modelos Será que é o tal do projeto strawberry né que a gente já citou aí algumas semanas atrás não sei porque eles não divulgaram eh Talvez seja só uma técnica mais refinada de prompt interno eh uma mistura dig digamos assim de
de vários agentes internamente tanto é que esse modelo esses modelos eles gastam mais tempo para responder então essa é uma uma mudança normalmente eh o padrão o os modelos padrões de de texto de esses llms que que eles fazem você pergunta não importa quão difícil eu já pergunta ele vai lá e responde no mesmo tempo né se demora um pouco mais ou um pouco menos é só por conta da da da demora da internet ou da fila que tá lá para chegar mas o modelo em si ele não gasta mais tempo se a pergunta é
mais difícil ele responde no mesmo tempo esse não esse gasta mais tempo tem pergunta que ele pensa eh o preview por exemplo que é o modelo eh maior às vezes ele gasta às vezes um minuto para responder e aparece lá pensando né É como se ele tivesse realmente interando aquele problema lá fazendo várias várias elocubrações para dar resposta ele não responde de uma vez eh o mini é um pouco mais rápido né e e é curioso que mesmo o Minnie sendo mais rápido do que o preview tem várias tarefas que o Minnie já faz melhor
por qu agora vou contar para vocês a o o a ideia da Open é lançar um outro modelo cham chado só 01 que não é o preview nem o mini seria realmente o maior modelo deles só que esse ainda não tá disponível Eles já devem ter lá treinado já deve est bonitinho mas lançaram só esse preview antes tá então e o preview e o mini então a gente ainda não tem acesso ao melhor desses modelos mas os benchmarks os testes mostram que eles esse esse 01 vai ser ainda melhor do que os outros dois que
eles lançaram agora então a gente precisa ver mas eu testei Então eu testei eu queria contar para vocês em primeira mão então a minha primeira pergunta foi quantos RS tem na palavra correria por quê Porque esses modelos Eles não conseguem contar letras tá todos eles erram se você perguntar isso pro seu chat PT padrão Ou qualquer um desses outros o Gemini Eles erram Eles não conseguem entender exatamente a estrutura léxica da palavra e e erram e esse não acertou pá gravou aí depois eu comecei a lançar outros desafios de lógica um pouquinho mais complicados cada
um mais complicado que o outro outro e foi acertando aí lancei um do triângulo que é muito difícil de resolver que é se você pegar um um palito e fizer e divid três fizer três eh dividir em três pedaços aleatórios qual a chance de formar um triângulo é um exercício difícil de lógica e ele deduziu certinho e e falou para mim aí eu me surpreendi aí depois eu coloquei um um desafio de caixa se um gato tá escondido numa caixa e você abre uma caixa por dia e o gato troca de caixa cada dia qu
qual o mínimo de tentativa você precisa para achar o gato e esse aí ele errou Então veja só não é tudo de bom mas são são desafios muito mais difíceis do que esses normalmente que a gente tá E que a gente trata pros nossos modelos então eu achei bastante interessante é tô mais animado quero testar mais mas eu quis dar essa primeira mão para vocês que realmente tá todo mundo aí é interessado no que acabou de acontecer vamos ver mais paraa frente que aí com mais testes com mais calma a gente avaliando se esses modelos
vão bem é eles falam também que para para questões de código né de programação mais avançada também esse Mini é excelente Eu Ainda não testei para isso mas tô acreditando aí nos testes era isso que eu tinha para falar para vocês então até terça-feira porque aí eu vou trazer mais com mais detalhes com mais profundidade eu quis só dar uma palhinha para vocês agora um abraço tá aí valeu pena Roberto pena espinelli com a gente excepcionalmente hoje trazendo informações quentíssimas aqui pra gente muito bacana esse 01 mini vamos saber mais detalhes na próxima terça-feira em
mais uma coluna Fala aí pena Muitíssimo obrigada boa noite para você interessante hein pessoal