a pergunta que todo mundo quer saber afinal qual que é a melhor das inteligências artificiais que tem no mercado hoje são as pagas são as gratuitas modelo grande modelo pequeno a melhor achar de GPT é o cloud é o Jini o Lhama o Mistral gema é tanto nome que nem eu lembro mais afinal quem que manda melhor como é que a gente faz para saber qual que é a melhor vamos falar sobre isso hoje e já aquece o dedo para deixar aquele comentário para dizer o que que você acha Qual que você mais gosta e tudo mais é isso aí vamos lá pessoal Sempre agradecendo todo mundo que deixou seu like todo mundo que se inscreveu um agradecimento especial a todos os membros do canal que estão apoiando esse projeto de Inteligência Artificial Hoje a gente vai tentar responder essa pergunta afinal qual das inteligências artificiais é a melhor e esses dias o pessoal comentou falou assim gente parece que o jamini 1. 5 aí tá mandando bem tem algumas notícias por aí dizendo que ele passou todo mundo e a notícia veio daqui gente vamos tentar entender o que que tá acontecendo esse lms. org aqui ele tá fazendo o que eles chamam de chatbot arena Ou seja é uma briga de chatbots é uma arena feita para chatbot pode brigar e aí você entra aqui no lms.
org entra aqui no chatbot Arena você vai cair nesse site aqui que você vai dizer o seguinte ó esse é um serviço de pesquisa né é uma prévia de uma pesquisa e a seguran dele não é das melhores pode ter conteúdo ofensivo aqui principalmente porque ele tá falando de vários tipos de llms né e não deve ser usado para nada ilegal danoso né todas essas coisas que você já sabe né não é para usar para essas coisas aí não envia informações privadas nem nada do tipo e o serviço coleta tudo que você tá passando aqui tudo que você informa aqui ele tá coletando fechou vamos lá dar um ok aqui e vamos passar para pra frente que que tá acontecendo aqui ó arena multimodal bmk de llm e vlms que é tanto de linguagem como de visão fiz uma tradução automática aqui ó na natureza as regras faça qualquer pergunta há dois modelos anônimos por exemplo chat GPT dem menai e Cloud Ou seja você não sabe quem é ó modelo a modelo B você pode continuar conversando até identificar um vencedor o voto não será contado se a identidade do modelo for revelada durante a conversa então em outras palavras se o modelo se você perguntar para ele Qual modelo que é e ele falar não conta novo suporte de imagem carrega uma imagem no seu primeiro turno para desbloquear a área multimodal as imagens devem ter menos de 15 megas a classificação da arena no chatbot São mais de 1 milhão de votos humanos para computar uma tabela de classificação llm Elo para mais de 100 modelos descubra quem é o llm Champion aqui ou seja clicando aqui a gente vê o ranking mas antes de ir para lá vamos daqui ó conversa agora então assim ó Vocês estão entendendo né modelo a modelo b a gente vem aqui ó coloca seu coloca o prompt e os dois modelos vão responder aí eu posso jogar uma imagem aleatória aqui caso eu não tenha uma im para enviar Eu posso pedir uma nova rodada posso pedir para regenerar e posso pedir para compartilhar aqui tá aquele mesmo termo que a gente já tinha falado e agora olha só imagina que eu coloquei aqui ó a pergunta que eu mais gosto de fazer quem porque essa aqui é polêmica vou perguntar aqui quem inventou um avião em português tá entendendo ó Se liga vamos lá vamos mandar aí ele vai mandar modelo a modelo B quem inventou o avião e aí começa a invenção do avião daí vai ter esse modelo vai responder uma coisa e a responder ele vai responder outra ó esse aqui foi super rápido já terminou os irmãos w orvel Wilber w são acreditados com a invenção do primeiro voo bem-sucedido de um avião ponto final respondeu só isso o outro aqui deixa eu tirar a tradução agora pera aí pera aí deixa eu tirar essa tradução aqui ó só para ter certeza que ele não tá escrevendo respondendo em Inglês a invenção do avião a invenção do avião é um um evento marcante na história da aviação e fala os irmãos americanos tal é importante notar que outros inventores também contribuíram os irmãos w a primeira viagem aérea os irmãos w no nor Carolina né irmãos Wi irmãos Wi irmãos wi você sabe que aqui ninguém falou de Santos do mon já de cara já sei que as duas respostas são ruim então o seguinte primeiro modelo a é melhor segunda resposta modelo B é melhor Tai a foi foi Um empate As Duas respostas são boas As duas são ruins eu vou dizer que as duas são ruins tá entendido Gente É Assim Que A Gente Faz Se eu quiser mandar mais informação ó se eu quiser fazer ó e o Santos Dumon E se eu quiser continuar aqui aó pergunta continua continua aqui ó daí ele vai mandar pros dois ó e o Santos doon aí vamos ver o que que os dois completam vamos ver vamos ver E aí eles começam Alberto Santos doon foi um inventor brasileiro francês que é frequentemente considerado um dos Pioneiros da aviação embora os irmãos Ride sejam creditados com a invenção do primeiro avião motorizado e controlável que a gente sabe que não é que essa resposta tá errada porque o motorizado foi Santos Dumon o dosm r é o sing mas sim o Santos doon voou antes com dirigíveis o 14 Bis foi 1906 e por aí vai e a resposta vai há uma controversia de quem foi primeiro os irmãos R São amplamente acreditados por a invenção do avião motorizado e controlável mas Santos do muit os inventores também fizeram contribuições significativas para desenvolvimento da tecnologia aeronáutica E por aí vai gente Vocês entenderam né E aí assim em algum momento eu tenho que dizer quem é bom quem é ruim quem se empatou se não sei o que lá eu vou dizer aqui que as duas são ruins vamos dar uma lida aqui Santos Dumon tem um papel importantíssimo na história da aviação principalmente por seus voos públicos e pioneirismo em 14 Bis ele é considerado o pai da aviação no Brasil e por muitos países principalmente na Europa a questão de quem evitou avião é complexo e gera debate então gente eles falam que é motorizado mas el todo mundo já sabe que esse de 1903 aqui não era motorizado se eu falei alguma abeira já deixa aqui no comentário porque Até onde eu sei tudo que eu vi já havia ação a galera fala que o primeiro motorizado é Santos Dumon e aqui Aqui tá certo ó Santos Dumon 906 realizou o primeiro voo 14 Bis com avião mais pesado que o ar sem auxílio de catapultas ou dispositivos de lançamento esse voo realizado em Paris teve grande impacto na popularização da aviação e inspirou muitos outros inventores Isso aqui é uma coisa que eu não sou especialista em aviação essa resposta para mim foi melhor Apesar dela ter começado super sucinta Então vou dizer assim b b é melhor achei Gemini 1. 5 pro e aqui foi o lama 3. 1 b instruct então depois que eu faço a votação ele me disse qual que era qual isso é importante porque isso aqui é o tal do teste cego gente é aquele teste que você vai respondendo e não sabe quem é o melhor até que você dê a resposta e ele Diga Quem era Quem daí você vê com essa cara igual eu fiquei pô Jini ganhou aqui né Jini ganhou aqui né claro que eu fiz um teste meio avacalhado tenho que dizer para vocês e esse teste meio avacalhado é importante fazer porque a gente tem que ter consciência que tem gente avacalhando aqui também então vamos dizer assim é um teste válido mas ele é um teste aberto que todas as pessoas do mundo estão aí testando cada um com seu critério subjetivo e aqui a gente consegue olhar o leaderboard né Quem tá ganhando essa história toda aqui ó e na leaderboard aqui ó como o pessoal já tinha comentado o Jini 1.
5 Pro X 081 tá ganhando Mas afinal que modelo que é esse Gini 1. 5 pro se você ver aqui ó no audio. com você consegue usar ele aqui ó 1.
5 pro experimental 08 ele tá ele está em experimento por enquanto ele tá em testes e ele suporta 2 milhões de tokens gente é uma das maiores janelas de contexto que tem na história do planeta terra isso significa que ó ele tá falando assim ó o jamini ele ganhou 1300 pontos no Arena score 12. 000 votos o ci dele é o intervalo de confiança a margem de erro é de seis pontos para mais e cinco pontos para menos Então se já tá com uma margem de erro mais alta do que o do GPT foro né Tá mais ou menos tá meio que tem uma dispersão maior aqui e o cutoff dele a gente não sabe até onde os dados dele estão sendo treinados isso que é importante esse bmk aqui se vocês forem acompanhando ele mês a mês se vocês forem acompanhando de seis em seis meses vocês vão ver que esses valores mudam vocês vão ver que essas posições mudam por exemplo ó o cloud 3 hoje tá depois do for0 e depois do for0 Mini e muita gente prefere o cloud 3. 5 a fama que esses modelos adquiriram com o tempo é que o clou é bom pra geração de texto porque ele faz uma geração de texto mais humanizada o GPT 4 é bom pras automações Ou seja quando você quer fazer um serviço lá um atendimento automático coisas assim porque ele é mais preciso na resposta ele alucina menos coisas assim o J era até agora o pior modelo porém com a maior janela de contexto e o meta aqui tá começando ó o meta começou a surgir ainda não Ganhou muitos votos o Lhama 3.
1 mas aparentemente Ele tá aqui em cima ainda muito bem rankeado e mais para baixo vão ter outros modelos isso é interessante de você olhar para você ver modelos que a gente nem ouvi falar aene por exemplo né e large tem outros modelos Deep seic Tem bastante gente que fala que gosta de Deep seic fazer programação se eu não me engano ó o Bard o antigo Bard então tem vários outros modelos isso aí é os mistro aqui ó lembra eu falei do mist mistro medium o comando R também que é importante para quem quer fazer rehan por por exemplo o comando de R interessante ó o mixt que é a mistura de experts da mxr e tem vários outros modelos olha quanto mais para baixo a gente vai mais diversidade de modelos tem e São 123 modelos aqui segundo a contagem deles então é interessante uma outra avaliação que tem é avaliação dos modelos de visão e a mesma coisa ó o Gini 1. 5 pro exp 0801 tá ganhando aqui também junto com o GPT 4 foro com o cloud 3 sonnet basicamente a mesma ordem Se vocês forem ver aqui ó é demin GPT for e Cloud 3. 5 então aqui deu a mesma coisa de Amin GPT for Claud 3.