OpenAI LANÇA NOVO CHATGPT o1 (Strawberry) 🍓

15.21k views2534 WordsCopy TextShare

Sancler Miranda | IA Revolution

🤯 Domine os Agentes e IA para monetizar suas habilidades, e elevar sua produtividade. 3.000 pessoas...

Video Transcript:

esse aqui é um dos exemplos da brutal diferença entre o modelo 4 O que é o que nós temos até então dentro do chat ept e o que acabou de ser lançado que eles chamaram de o One até então conhecido como o codenome strawberry morango nesse exemplo aqui foi dado uma mensagem codificada e o que ela significa pense passo a passo e depois falou assim agora se vira tá aqui uma mensagem codificada e eu quero que você use o exemplo que eu dei acima para decodificar o que eu acabei de te enviar abaixo Lembrando que estamos no quro ou aqui abaixo Ele pensou ele justificou e falou assim olha infelizmente não consigo eu preciso de mais contexto Esse é o 4 ou Que nós tínhamos até então agora olha a grande diferença com o exato mesmo prompt para o w One Olha o que que ele vai fazer um dos grandes diferenciais é essa cadeia de pensamento interna que ele vai fazer para chegar ao resultado então se eu clicar aqui mostrar cadeia de pensamento dá uma olhada em tudo que aá o ou One pensou até dar uma resposta eu vou rolar isso aqui para baixo isso aqui ainda é essa cadeia de pensamento ou seja está colocando Qual é o raciocínio está entendendo o que pode estar errado está se autoc corrigindo para lá no final ainda estou dentro da cadeia de pensamento olha para lá no final ele vir aqui embaixo trazer a resposta que nós vamos ver na nossa tela no chat GPT e tem um motivo pelo qual eles vão esconder esse raciocínio para trazer a resposta correta tem três RS em strawberry essa era a mensagem codificada e existe um motivo desse easter eg do strawberry porque um dos Testes simples para você ver o desempenho de uma llm era perguntar quantos RS existia em strawberry e muitos deles falavam que só tinha dois e aqui está a resposta existem três morangos E para isso teve toda essa linha de pensamento no w One nesse vídeo eu vou te falar tudo que você precisa saber sobre esse novo modelo que acabou de ser lançado o One o que ele tem de diferente Quais são suas limitações Como que você pode usar quem tá incluso nessa e muito mais Então vem comigo let's go eu recebi esse comentário agora 3 horas atrás ela já fez vários cursos e de instituições também bem relevantes e posso te garantir que seu curso superou todos eles na didática e no valor gerado na sua entrega na minha perspectiva sobre o que que a Andreia tá falando sobre o novo curso do zero te ensinando como criar agentes de a eu criei uma metodologia própria que vai te pegar do básico do zero para você aprender a criar os seus agentes de a enquanto você vai subindo os degraus de complexidade criando soluções mais interessantes que são práticas pro seu dia a dia além desse novo curso que virou mais aulas você já tem mais de 140 aulas te esperando aqui dentro do Y Revolution Academy somos mais de 3. 000 revolucionários lá temos um monitor dedicado para tirar suas dúvidas e muito mais o link tá aqui abaixo na descrição e também no primeiro comentário fixado eu te vejo lá meu querido a Open a acabou de lançar agora dia 12 de setembro qua sai nesse vídeo um modelo que se chama openi o One previl que é a versão prévia já tem muita coisa interessante Começando por esse nome que você vai entender Já já esse modelo é uma nova série de modelos que até então era conhecido internamente como strawberry que estava fazendo um grande barulho no mercado todo mundo louco para que fosse lançado logo muita gente achando que ia se chamar GPT 5 está aqui o nome é esse ou One e ele é uma nova série de modelos de raciocínio para resolver problemas difíceis então ele é mais focado para esse tipo de uso por que esse modelo ele é projetado para gastar mais tempo antes de responder el literalmente fica pensando e fica mostrando quanto tempo que ele vai levar para responder uma questão e por trás das cenas Lembra que eu te mostrei esse exemplo aqui é porque por debaixo dos panos ele está fazendo esse raciocínio hoje tá sendo lançado primeiro dessa série no chat ept e também na Api para desenvolvedores a ideia por trás desse modelo é fazer com que ele pense assim como uma pessoa faria pensar mais sobre aquilo quando alguém me pergunta algo o que que é inteligência artificial Como usa Inteligência Artificial eu posso dar uma resposta de bate pronto agora se eu parar para pensar um pouquinho eu posso trazer uma resposta mais elaborada porque na minha cabeça eu posso ir quebrando mais tópicos eu posso fazer perguntas para mim mesmo para eu responder melhor para aquela pessoa então A ideia é simular esse tipo de raciocínio o que em inglês é chamado de Chain of thought seria uma cadeia de pensamento um dos exemplos para você ter uma ideia do quão poderoso está em relação ao GPT 4 o foi feito um exame de qualifica ação para o olimpíada internacional de matemática e o GPT 4u ele resolveu corretamente apenas 13% dos problemas enquanto o modelo de raciocínio pontuou 83% ou seja o modelo que eles estão falando aqui o o One por enquanto ele tem algumas limitações como o modelo Inicial ele ainda não tem muitos recursos que tornam o chf GPT útil como por exemplo navegar na internet então ainda não vai ter como buscar informação na internet usando este modelo ainda não vai conseguir carregar arquivos e imagens para esse tipo de de caso GPT 4 Oh que é o modelo que nós temos agora será mais capaz no curto prazo aí olha só eles já dão uma ideia do que que tá acontecendo aqui ó estamos zerando o contador de volta para um e nomeando essa série ou PNI ou One então agora eles estão dividindo em duas linhas o gpts e a Open ai ou por enquanto o que que nós temos o Wow One em prévia sancl e tem diferença entre o Wow One na questão de raciocínio para o w One preview sim tem eu vou te mostrar mas mesmo assim ele é mais poderoso do que qu ou ele já deixam muito claro para quem é esse modelo específico Olha é para quem vai utilizar as capacidades de raciocínio mais aprimorada por exemplo problemas complexos de ciência código matemática e Campos semelhantes como por exemplo física vou até falar já já alguns exemplos aqui por exemplo o w One ele pode ser usado por pesquisadores de saúde para Anotar os dados de sequenciamento de células por físicos para gerar fórmulas matemáticas complexas necessários para o campo da física quântica Tá e por desenvolvedores em todos os campos para construir e executar fluxos de trabalho em várias etapas e aqui eles mostraram vou deixar o link aqui abaixo na descrição não vou passar esses vídeos aqui mas são vídeos curtos em que mostra vários tipos de uso de caso em áreas mais complexas como por exemplo esse aqui é um físico quântico um pesquisador da física quântica já essa aqui é uma geneticista uma pesquisadora de um hospital de Boston esse aqui é um programador que inclusive criou o Devin o software que cria códigos de maneira autônoma e por aí vai então ele é focado para esses tipos de raciocínios mais complexos tanto que agora quando foi lançado ele tem algumas limitações de uso vou falar junto com o w One preview eles estão lançando o w One mini esse w One mini ele vai estar disponível no chat GPT também e também lá na api então é bem provável que vai ser um valor bem similar ao for one mini vamos ver Mas é provável que seja que para quem usa ap por exemplo para criar o os agentes que você aprende a construir os Agentes do zero como eu falei lá no i Evolution o 4w mini ele é um modelo excelente com raciocínio muito superior ao 3. 5 Que nós tínhamos antes o turbo e que também é mais barato ainda do que o 3.

5 olha só ele é 80% mais barato do que o all one preview então ele segue mais ou menos o mesmo padrão ali entre o for o e o for All mini disponibilidade já a partir de hoje o meu ainda não apareceu mas eles estão prometendo que a partir de hoje vou atualizar minha página aqui o w One em modo prévia já vai aparecer pra gente tá Por enquanto ó ainda não apareceu assim como W One mini também aí vem a questão dos limites tá para você ver que o uso do Wow One ainda ele deve estar bem nas fases testes que é o seguinte nós vamos ter um limite de taxa semanal não é diária Tá bom então presta muita atenção o limite da taxa semanal serão de 30 mensagens Então você vai poder enviar somente 30 mensagens para esse novo modelo o o One preview 30 vezes já para o w One mini serão 50 mensagens e aí eles estão trabalhando para aumentar essas taxas E permitir que o chat ept escolha automaticamente o modelo certo para um determinado prompt ou seja aquilo que você escreve pro chat GPT é assim que vai aparecer pra gente ó GPT 4 oh o One preview e o ow One Mini e um botão de mais modelos os usuários do enterprise e do Edu vão ter acesso a partir de semana que vem quem vai poder usar esses modelos na api quem tiver no tire F que é o nível 5 que é a partir de 1. 000 você já gastou $000 lá dentro da openi você já vai ter acesso a api Só que também vai ter um limite baixo das requisições que são 20 requisições por minuto que também estão aumentando estão trabalhando para aumentar isso E aí eles estão planejando oferecer o acesso ao o One mini a todos os usuários do chat jpt gratuito O que eu recomendo para você assim que atualizar o modelo é que você pense um pouquinho antes de utilizar ou realmente utilize para questões que você precisa desse raciocínio mais avançado é claro que a gente vai querer testar ali talvez gastar tá já uns umas 10 mensagens logo de cara mas saiba que existe esse limite tá bom Aqui eles mostraram algumas das avaliações dentro de benchmarks para mostrar o quão o o One preview E também o o One eles estão muito mais poderosos do que o GPT 4 o cara é absurdo olha aqui em competições de matemática GPT 4oo 13. 4 já o o One 83.

3 e o preview que é o que a gente vai ter acesso agora é 56. 7 que tá muito acima do 4 em competição de código veja o mesmo padrão 4 o com 11 ou One prevel 62 ou One 89 agora é esse aqui é absurdo isso aqui São perguntas em nível de PHD e comparado com as pontuações humanas cara detalhe da matéria de ciências questões de ciências de maneira geral Então esse aqui é nível Diamond Olha só o GPT 4 o ele pontua 56. 1 um humano Expert 69.

7 o ow One superou humano Expert tá Ou seja que é um especialista naquela área 78 já o o One preview 78.