tema hoje cara o império contra-ataca o império contraataca velho exatamente temos a Open lançando aqui ó o 3 Mini vamos lá vamos falar um pouquinho sobre eles aí sobre ele aí segundo a Open o melhor modelo até agora da Open o O3 Minion que veio aí né Para realmente lanar aí né um novo modelo diferenciado obviamente a gente sabe que isso é por causa do lançamento de psic de psic também que passou por algumas dificuldades hoje na questão de Exposição de dados acusações aí de Exposição de dados já já a gente vai trazer um pouquinho sobre isso aí mas eu quero falar muito aqui sobre esse lançamento aqui que eu acho que é uma coisa importante parece que a gente vai ter notícia eu tava saindo para fazer exercício cara meu filho tá me esperando na verdade lá apareceu essa notícia não eu tenho que entrar online não tem jeito caramba velho Que coisa é essa hein mais um lançamento da Open aí o open O3 que não tava esperando né não estava esperando lançar hoje mas na verdade eles dizem no texto dele eles disse não a gente já tava até querendo fazer isso em dezembro e tal mas foi lançado hoje estamos aí então com o O3 mini então ah antes da gente começar vem pro nosso grupo do WhatsApp aqui ó basta você você vir no Q code que está aqui ou então eu vou colocar depois aqui no link da descrição para você o link né aqui na descrição o link para você poder vir pro nosso grupo de WhatsApp PR gente bater papo sobre esses temas que tá revolucionando aí a a a a a loucura tá muito grande bom muito bem chat APT aberto aqui Nós entramos já tem de cara aqui quando você abre aqui ó bonitão o bicho aqui ó já está habilitado para você o O3 mini quem tem o GPT Plus beleza Você tem o g GPT Plus tá aqui bonitão para você poder usar e bom aí os modelos que estão disponíveis pra gente ainda é o GPT 4 o o 4 o com tarefas agendadas tá que tá aí no Beta beleza que foi o que o pessoal mostrou aí né anteriormente o A1 com reflexão avançada agora o mini só que tem o mini High também aqui ó que ele é muito bom para para lógica e codificação eh se o pessoal quiser me mandar aí uma uma uma uma desafio de lógica manda para mim pra gente poder ver o que que ele diz aqui mais modelos se a gente quiser são os mais modelos que a gente quiser usar Pode ser né aqui o GPT 4 ou mini que também a gente usa bastante lá usava até então né esse aqui tá morto tá eh até então a gente usava bastante ele eh junto com os agentes inteligentes do crui era mais usado ele do que do que o do que o GPT 4 ou o o1 tá ele saia muito bem mas agora com de psic Eu acho que já era né e agora eu tenho aqui o O3 mini muito bom tá aqui eu não fiz nenhuma pergunta para ele vou fazer a clássica Pergunta se ele conhece o Vascão vamos lá você conhece o Vasco da Gama eu só pergunta essas besteiras né vocês quiserem perguntar aqui pra gente ver ele vai perguntar porque na verdade aqu que interessa que interessa na verdade no final das contas é o que você vai fazer né E só tô mostrando aqui depois vê que ele funciona belezinha veja que ele faz Ah aqui tem uma coisinha que tá uma imitação Zinha hein galerinha sério mesmo ó muito parecido com de psic tá que é esse lance de expor o Thinking né expor o que que ele tá pensando porque ISO chamou bastante atenção o pessoal gostou bastante desse lance do think aí ó e aí agora tá aqui bom comparações comparações não estou aqui tomando parte nenhum você sabe muito bem que eu sou um cara da área científica eu vou em cima do que tá sendo visto em termos de ciência se o chat APT é melhor for usar o chat PT se o omini é melhor vou usar o omini se o dips for melhor eu vou usar o dips não me interessa de onde vem para onde vai é como o pessoal falou aqui né da briga dos dois eu tô torcendo para a briga tá certo Tô torcendo para a briga por qu porque com isso o custo cai certo e quem ganha somos nós então vamos para de bobagem aí tá bom Gente vou falar outro Vascão aqui e tal falou olha ele falou inteligentemente do Vasco da Gama navegador português e depois falou do Vascão o meu grande Vascão eh e é isso aí beleza aqui não interessa muito essa brincadeirinha porque eu não vou fazer aqui umas coisas mais depois a gente quiser fazer alguns testes de alguns testes de lógica para ver que que ele fala né Eh provavelmente aquele lance do número ele vai sair muito bem que é o que é maior né o o o 8. 11 ou o 8. 0 quer ver ó Qual o número maior acho que vai sair mas porque o o o quatro hoje já sai melhor né Qual é o número maior maior dois pontos 8.
11 ou 8. 0 certo 8. 8 né que e algumas alguns llms entende 11 como sendo maior que 8 mas na verdade aqui é 8.
80 beleza só que eu tô eu tô omitindo aqui para ele propositalmente o zero Então isso é um um raciocínio lógico Então vamos ver como é que ele se sai nesse caso aqui mas eu acho que ele vai sair muito bem precisava de uma coisa mais elaborada eu quero ver com vocês aqui ó já já eh o que eles estão dizendo né Ah aqui ele já falou ó a parte inteira de oito pode ser interpretado como 0,80 tá vendo Então um raciocínio muito bom aqui o 011 equivale a 11 di por 100 e o 0,8 equivale a 80 divo por 100 isso mesmo e aí o 11 Dio por 100 é menor do que 80 100 Claro e a gente conclui então que 8. 11 é maior é menor do que 8. 8 certíssimo beleza certíssimo tem muita llm que é isso aqui tá é uma coisa simples mas que é tá bom eh e é legal que ele colocou no Python né obviamente aqui ele vai ele vai dizer que é que é que é perfeito Vamos então aqui ó o TR min o que que o pessoal falou aqui do do do chat CPT o pessoal da Open falou do TR mini expandindo a a fronteira do raciocínio econômico ó tema pesado hein Porque que era o qu não a ideia do de psic Era exatamente essa né talvez Olha aí talvez a sacada deles o que que é em vez de lançar o O3 lança o o o TR mini que é baratinho certo de certa forma eh Se bem que para usar o h 3 Mini eu não sei se alguém pode acessar uma conta grátis aí eu Pera tem uma conta grátis aqui eu não vou conseguir acessar o TR min por aqui o apost quer ver ó eh vou entrar aqui Ah mas aí Ah tá bom vamos pedir aqui mas eu não validei Ok vamos ver aqui que ele vai dizer para mim continuar tô acessando aqui uma outra conta tá para ver se eu vou conseguir acessar o A3 mini por aqui se ele tá disponível para mim não está disponível para para o certo ó pessoal aqui ó informação importante ele não é gratuito ele não é gratuito tá ele é pago então O3 Mini é pagó tá é pago se você quiser usá-lo você tem que pagar os como você tá pagando tá bom certo dúvida não né então vamos lá estamos lançando a na a Open 3 min no modelo mais novo econômico da nossa série de raciocínio talvez na na api Pode ser que seja mais barato tá bom Já já a gente vê isso aí disponível no chat PT conta api hoje com previsão para dezembro 24 esse modelo poderoso e rápido avança seus limites que modelos pequenos pode alcançar então talvez ó Isso é uma coisa legal testar o o 3000 na min meus alunos de crei agentes inteligentes vamos lá Por que que os Por que os modelos pequenos são importantes para nós para nós galera de agentes inteligentes que tá no Nossa mentoria gratuita do livro se você quiser adquirir o livro aí da mentoria você entra no nosso grupo do WhatsApp que lá você pode adquirir beleza por que que esses modelos pequenos são interessantes pra gente por que o GT4 o mini tava melhor do que o GPT 4 porque quando a gente trabalha com agentes inteligentes a gente pega uma grande tarefa e particiona essa essa tarefa né em pequenos pedaços beleza pequenos pedaços imagina vou dar um exemplo para você você quer escrever você quer escrever um artigo científico Beleza então você quer escrever um artigo científico você não você não manda os agentes escrever o artigo de uma vez só não tá primeiro o que que você faz você define quais são você cria um agente que vai definir partes do artigo Então vai ter aqui vai ter uma introdução Beleza vai ter objetivos vai ter ali eh Quais são os propósitos Tá certo e as contribuições Beleza e como que o artigo está dividido você tá colocando as seções depois você vai trabalhos relacionados ao seu trabalho Beleza depois você vem metodologia aí você tem todas as partes da metodologia do artigo científico depois você tem lá os resultados né aí depois você tem as discussões e conclusão Beleza então o primeiro ag gente vai entregar isso aí tá o segundo a gente vai pegar essa tarefa e vai dizer ó ele vai dizer o que em cada parte do artigo tem que ter em relação ao conteúdo beleza só que ele não tá escrevendo o artigo em si não tá escrevendo o artigo em si então ele vai definiras essas tarefas em partes aí o que que vai acontecer depois no próxima etapa você vai pegar as partes do artigo as partes do artigo E aí você passa pro agente o agente vai escrever as partes agentes vão escrever as partes do artigo combinando com o contexto à medida que vai sendo escrito Então você divide a tarefa em partes Sempre quando você vai trabalhar com agentes inteligentes você vai trabalhar com empates e o que isso é legal para esses esses esses modelos tipo mini de psic pequeno né e os menores aí E também o o O3 mini O que é legal pra gente porque eles são muito bons qu tarefas pequenas Eles são muito bom com tarefas por isso que o por isso que o GPT 4 o mini estava saindo bem isso é coisa do João João me falou isso me falou para todo mundo eh que por que que o o GPT 4 ou min tava saindo melhor do que o GPT 4 nas tarefas concluir aí exatamente pel essa questão da da parcialidade entendeu então em relação ao custo você pode ficar bacana quando você usa um um modelo menor Então isso é muito bacana porque você tem um baixo custo certo mantendo uma latência reduzida a latência reduzida do o1 mini tá então essa que é a ideia deles aí eu ele fala eles vão falando uma série de coisas eu li aqui eu coloquei para traduzir para vocês para poder vocês entenderem aqui né do inglês Beleza então a gente tem uma série de coisas quando eu li falei assim caramba isso é legal tá falando aqui ó que você tem eh ainda tá aberto né o o o1 mini o o um preview e o e o O3 mini oferece oferece será suporte de streaming Ou seja eu posso pesquisar isso coisas na internet né você pode ver que eu posso fazer busca aí dele ó na internet mas ainda não posso anexar arquivos ó Isso aqui é uma coisa ruim cara isso aqui é uma coisa ruim Beleza então mas vamos em frente ó você tem opção opções de raciocínio baixo médi alto eu eu particularmente só vi dois que é esse mini aqui E esse aqui tem mais algum então vendo aqui não se eu colocar no Rai aqui eu tenho como mudar isso aqui não vi isso aqui não tá mas ele diz que tem essas três opções mas deve ser lá na api certo Deve ser isso lá na api aqui no GPT nada não tem nada disso então aqui ó para os usuários GPT Plus team pro né Podem acessar o all3 Mini a partir de hoje que é dia 31 né hoje 31 de janeiro 2025 com acesso a enterprise chegando a uma semana Beleza eh [Música] e os interpres vão chegar em uma semana o O3 mini irá substituir substituiu o o o1 mini que saiu da parada né não tem mais o o mini eles estão dizendo isso ó não tem mais ess beleza substituiu tá agora tem aqui ó como parte dessa atualização estamos triplicando o limite da taxa de usuários Plus o time de 50 mensagens por dia com o Mini para 150 mensagens por dia com O3 mini isso é legal hein Porque 150 50 mensagem é mensagem para chuchu certo com O3 mini Se bem que dependendo do caso eu faço até mais perguntas quando eu tô fazendo algumas coisas beleza Eh então é isso ó a gente tem aqui então mais para baixo eu vou passar um pouquinho mais pr pra frente para vocês verem aqui o raciocínio que ele faz é o raciocínio Poderoso otimizado em raciocínio de stem né que é o lance de sistema aí vocês eh entender o seguinte vamos lá que que é o tal do stem para quem não conhece a gente usa esse termo muito né a gente usa esse termo muito aí eh na na na na na na Campus Pari certo tem a ver com matemática certo resolução de de questões tá Eh pera aí tem a ver com matemática Beleza a gente tem esse acrônimo né de science Science esse esse aqui é de Science technology Engineering certo e matematrix né então a gente tem esse stem que a gente usa Antes era só stem né e agora a gente tem esse stem que ele é um modelo que tá sendo voltado tem um raciocínio exem né voltado aí com um esforço médio de raciocínio correspondente ao desempenho do o1 em matemática assim eles estão dizendo que o O3 mini não bateu teru o o1 então ele é correspondente ao o1 ou seja se nós temos o de psic que é correspondente ao o1 o O3 mini ele é correspondente ao di psique basica basicamente isso aí beleza beleza é isso que ele tá dizendo não é isso ou não tô lendo errado beleza Eh ao mesmo tempo que fornece respostas mais rápidas então ou seja vamos lá o que que estão dizendo pra gente aqui que basicamente o O3 Mini é o o1 rápido certo é o o1 rápido mas aqui embaixo tem um gráfico interessante que ele diz o seguinte ó e vamos ler aqui avaliações feitas por testadores especialistas mostraram que o O3 mini produz respostas mais rápidas e claras com habilidades de raciocínio mais fortes do que o open ou mini isso é claro beleza os testadores preferiram usar poas o O3 mini ao o1 mini 56% das vezes que observaram uma e observaram uma redução de 39% nos erros principalmente em perguntas difíceis do mundo real como o esforço médio de raciocínio o O3 mini certo eh o O3 Mini é corresponde ao desempenho do o1 então o O3 mini corresponde desempenho o um que corresponde desempenho de psique certo estamos todos nivelados aí eh algumas das avaliações de raciocínio inteligentes mas já foram feitas né Incluindo aí essas a esses benchmarks aí tal que é o Aim e esse gpk dpic k né eh essas esses benchmarks também foram usados com deeps tá obviamente eles não vão mostrar aqui o deeps comparando né mas ele mostrou aqui ó que o O3 né o O3 mini aqui ó está com comparável e um pouco melhor ou seja eu tenho alguns pontos a mais aqui em termos de raciocínio em relação ao o1 Beleza então temos para então segundo eles aqui nós temos o melhor até então o melhor modelo da openi disponível para os usuários usarem aí beleza é isso que eles estão dizendo com essa com esse gráfico aqui né em geral tá eh aí só que aqui parece que é um tipo de deixa eu ver aqui eh matemática né as aqui especificamente dessa aqui deve ser o meth meth 500 né Eh com baixo esforço de raciocínio o O3 mini né atinge desempenho comparável a o a a a a o1 mini tá tudo bem enquanto o esforço médio do O3 mini eh atinge desempenho comparável ao do o1 Beleza então assim eh é bem que a gente leu mesmo né aqui embaixo ó em perguntas de nível de doutorado que é esse de pq né Diamond que eu até falei do de psic Eu não sei por que tá cortando aqui a imagem Deu um probleminha mas ele tá falando que esses esse esse modelo se sai também muito bem né mas não dá para ver aqui beleza Enfim estamos aí com o novo modelo né e código de concorrência esse code forces aí também saiu aí com é 2130 né melhor do que o o1 tá então esse ponto aqui especificamente se eu não me engano o de psic ele era melhor na geração de código do que o o1 como o o trê Mini é melhor do que o A1 provavelmente ele Tá empatando com de psico passando por pouca coisa aqui nesse caso tá do que eu mostrei na nossa Live anterior eh é interessante porque a a a open não se compara com di psic né Depois que depois que T toda essa parada aí tá bom eh deixa eu só ver se os meus meninos entraram aqui quem que foi que entrou né Se entrou se não entrou entrou Não beleza então eh a codificação Life bch aqui deu uma uma uma uma acuracia de 83 né 83% aqui em relação aqui no usando o High né de uma cura de 83% tá em comparação ao o1 High tá de 72 ou seja melhorou bastante e em conhecimento geral que é essa esse mml U que é uma é uma base de dados que tem conhecimentos gerais mas também tem muita coisa em múltiplas línguas né o o vamos ver como é que saiu aqui o ou mini eh em relação a O3 High um aumento de mais de um ponto percentual aqui ó certo em nas respostas Gerais beleza no geral em matemática aumentou 7.
9 pontos beleza muito bom muito bom isso aqui cara tá eh e aqui no em perguntas né de de perguntas e respostas ele também saiu muito bem saiu de 7. 6 para 13 o tá preferência da avaliação humana aqui tem um um boxplot aqui bacaninha bonitinho pra gente analisar eu vou passar paraa frente e aqui para baixo velocidade de desempenho ó esse aqui é legal né porque a gente tem que ver também se responde rápido tá então aqui no TS Z AB o O3 ele entregou respostas 24% mais rápidos do que o o1 mini tá mas aqui é mini com mini eu queria ver com mini com grandão né ele tem hora que ele compara com o1 tem hora que ele compara com Minnie é meio assim eu acho que a ideia é que a inteligência é comparável ao o1 Tá mas o esforço não está claro aqui dizendo para mim o que que é é isso Beleza vamos vamos ver os comentários da galera aqui o que que o pessoal tá falando tá bom ah o Evandro aqui falando contra-ataque da Open ey beleza eu tenho um carinho especial pelo ginai eu acho o 126 maravilhoso muito bom muito bom muito bom tudo bem Aqui o o camal Vamos torcer pra briga sim com certeza a gente que aproveita Essas tecnologias como a pipoquinha e coloca músiquinha vai que nem o Michael Jackson Thriller né Beleza Ah muito bem passar um pouco pra frente aqui Ah aqui o O3 é pior do que o o1 Não ele tá dizendo que é ao contrário não é melhor né Por que que ele Seria pior não entendi aqui a sua colocação tá bom não faz muito sentido né o porque que seria pior Ah ele falou aqui ó testei e er errou questões fáceis de concurso Demorou 1 minuto e meio para pensando interessante aí manda aí pra gente aí como é que foi essa parada aí mas como é que você testou no A1 se o A1 tá fora do ar né é o A1 grandão o o1 tipo assim você testou no o1 não foi no mini né foi nesse aqui né nesse nesse nesse nesse o1 aqui grandão né é comparar aí tem que ver a questão viu Gladson eh a questão tempo de resposta e custo para poder responder isso aí beleza sandeco já testou já testou o Ken né e 2.