BATALHA de INTELIGÊNCIA ARTIFICIAL! - Gemini | ChatGPT-4o
480.85k views4211 WordsCopy TextShare
CORTES - Leon e Nilce [Oficial]
Leon e Nilce falam sobre as atualizações das IAs Chat GPT-4o e Gemini 1.5 PRO.
Esse é um canal de c...
Video Transcript:
a gente teve nessa semana a Batalha das inteligências artificiais o que aconteceu foi o Google io que é a conferência anual da alphabet alphabet é a empresa mãe do Google tá é tipo Facebook chamam de meta enfim que é uma conferência para desenvolvedores e também pra imprensa todo mundo sabia que a alphabet ia anunciar várias novidades sobre inteligência artificial incluindo novas funções e uma nova versão do Gemini que é a inteligência artificial deles e também a integração de inteligência artificial no sistema de pesquisa do Google que a gente não viu ainda acontecer porém um dia antes sorrateiramente a openi a empresa do chat GPT que é o competidor anunciou uma apresentação claramente voltada para tirar o foco do Google io e nessa apresentação ela anunciou o chat chpt 4 O que é um modelo linguístico multimodal a gente vai explicar o que que é isso que consegue com conversar com o usuário e manter um diálogo em tempo real a gente tá vivendo um momento absurdo eu tenho que mostrar para vocês porque eu não sei se vai funcionar porque tem muita gente usando agora e tá dando problema no servidor de vez em quando que é o chat pt4 o que tipo você uma das funções dele é que você consegue conversar com a inteligência artificial como se fosse uma pessoa eu escolhi um tipo de voz aqui eu vou tentar fazer esse teste agora com vocês que é a voz que imita a Scarlet joh Hansen no filme her se você conversar com eling inglês é a voz da Scarlet Hans tipo assim o filme her é um filme no qual um cara se apaixona por uma inteligência artificial de conversação E aí o que tá rolando gente é que o povo tá gamando mesmo vai não não aparentemente eles fizeram isso de propósito aparente não Certamente eles fizeram isso de propósito só que na na versão Dessa voz em português é diferente da Scarlet johansen e uma coisa engraçada que tem nessa voz aqui é que ela usa o r retroflexo ela fala com sotaque de press caba Tá então vamos lá eu vou tentar conversar para vocês verem como é que é Oi Chat GPT Eu tô aqui em live Agora Numa live stream com várias pessoas assistindo você você pode por favor dar um oi pra galera Oi pessoal Espero que todos estejam se divertindo na Live Se tiverem alguma pergunta ou quiserem conversar sobre qualquer coisa estou aqui para ajudar vamos aproveitar o tempo juntos exato a primeira coisa que eu queria que você e dissesse é falar um pouco sobre o chat PT 4 o essa nova versão que você é do chat ept e o que ela pode fazer Claro e o chat GPT 4 é uma versão aprimorada do modelo de linguagem da Open Eye ele entende e gera texto com ainda mais precisão e coerência que as versões anteriores essa versão é melhor em entender contextos complexos e responder de forma mais natural e útil Além disso o chat GPT 4 pode lidar lidar com tarefas variadas desde responder perguntas e contar histórias até ajudar com estudos ou dar dicas práticas ele é projetado para ser uma ferramenta útil e versátil para uma ampla Gama de interações Que bom obrigado pela resposta eu vou parar agora eu só tô impressionado com a velocidade você consegue responder muito rápido mesmo não tem que esperar nada para ter uma resposta é incrível isso fico feliz que você gostou A ideia é exatamente essa oferecer respostas rápidas e úteis se tiver mais perguntas ou quiser continuar a conversa estou aqui você sabe quem que ela lembra de sotaque a Rafa ciman não Ela errou ali eu falei chat ept 4 o Ela respondeu sobre o chat ept em geral S seu o o é esse de conversação que é multimodal você pode fazer várias coisas você pode mandar uma foto para ele eu fiz isso mais cedo eu fiquei impressionado Skynet de Birigui melhor comentário não a identificação de objeto eu tirei uma foto do fone de ouvido é esse fone de ouvido que eu tenho da Sonic é o design dele é até meio genérico tá gente tem vários fones de ouvido com esse design tem nada de especial aí eu perguntei o que que é isso ela respondeu você tá segurando um par de fones de ouvido da Sony especificamente do modelo w h 1000x M4 Tá certo Esses fones são conhecidos por sua qualidade de som superior e pelo excelente cancelamento de ruído ativo porque que eu fiquei mais impressionado aqui não sei se tem uma diferença física entre o WH 1000x M3 e o M4 Será que ela sabe quem a gente é não não esse daqui não tem contexto não não tem esse contexto não aí eu vou explicar sabe quem é o fone não ela não sabe porque é outra coisa que a gente vai ter que discutir sobre a Google depois a Google Apresentou um track impressionante que acho que nem a galera do chat PT tava antecipando e é um treco revolucionário que é a quantidade de token de contexto que é a quantidade de informação que o modelo linguístico consegue levar em conta para te dar uma resposta tá eu vou antecipar isso daqui agora o chat GPT até onde a gente sabe chega a 128. 000 tokens tokens seria a unid de comunicação de registro de linguagem do modelo como que eu explico um token aqui imagina uma palavra você pode pensar que cada token é uma palavra mas não é necessariamente uma palavra porque você para diminuir a quantidade o tamanho do vocabulário ao qual a inteligência artificial tem que ter acesso você pode quebrar palavras e eu vou ter que explicar isso porque isso é impressionante do negócio do Google durante o anúncio do Google o que eles anunciaram de mais impressionante Na minha opinião foi que o Gemini a inteligência artificial deles vai ter uma janela de contexto de 1 milhão de tokens a que já tá disponível pro público em teste fechado disponível para desenvolvedores essa janela de contexto chega a 2 milhões de tokens o que que é um token é basicamente uma informação numérica que normalmente corresponde a um vocábulo ou um vocabulário a qual a inteligência artificial tem acesso uma janela de contexto é a quantidade de informação que a inteligência artificial pode levar em conta para te dar resposta porque tipo assim pensa no cérebro humano a gente aqui tem um monte de coisa na nossa cabeça quando a gente tá tendo um pensamento uhum a inteligência artificial não consegue fazer isso tão bem ainda ela consegue ter uma uma quantidade de informação limitada depois que você enche essa quantidade de informação eh Muitas delas até dão problema você tem que recomeçar o chat sem sem contexto nenhum de novo entendeu porque tipo assim encheu encheu o Cash encher o cérebro dela do tanto de informação que ela pode considerar Ah então a gente mede essa quantidade de informação em token um token pode ser uma palavra tá mas você pode quebrar essa palavra também para diminuir o tamanho do vocabulário a qual a inteligência artificial precisa ter acesso por exemplo você pensa que você tem uma numa língua você tem a palavra normal normalmente comum comummente O que você pode fazer é dar um código numérico para cada uma dessas palavras pra Inteligência Artificial processar esse código o normal pode ser o 01 normalmente Pode ser a palavra 02 o comum ser a palavra 03 e o comummente ser a palavra 04 só que você pode quebrar isso em termos dos tokens para poder meio que economizar nesse nessa sequência você pode quebrar o normalmente em dois tokens aí normal é a palavra 01 e no normalmente você tem duas palavras o normal que é o 01 que você já tem esse código e você tem o mente que você pode chamar da palavra 02 aí quando você vai fazer o comumente de novo 0 mais 02 é não o comum é a palavra zer 0 3 comum mente você quebrou e dois comum 03 de novo e o mente você já falou em cima que é o 02 Então você saiu do contexto em que você tinha quatro palavras que você tinha que conhecer normal normalmente comum comum mente para ter três palavras que você tem que conhecer normal comum e mente é básicamente você e você estrutura o tokem assim porque assim que a inteligência artificial processa a informação tá você tem que pegar essas esses elementos linguísticos e você converter para um código numérico para ela processar simplificando para cá tá gente então o Google consegue ter o contexto de 1 milhão de token que já tá de tokens que já tá disponível que é coisa para caramba e em teste fechado ele tem 2 milhões e a ideia do Google é chegar a contexto infinito não sei o que que eles querem dizer com isso Tá Mas é impressionante tá com 2 milhões de tokens você pode ter em contexto 2 horas de vídeo Você pode ter em média tá cerca de 1 milhão e meio de palavras e coisa do tipo é uma coisa impressionante e quando eu falo Du horas de vídeo tá não é só as coisas que estão sendo ditas no vídeo são todas as informações dos vídeos as cenas os objetos que aparecem no vídeo a inteligência artificial pode ter aquilo no cérebro dela para você consultar e isso é muito importante para inteligências artificiais que faz esse negócio da conversa natural porque ela tem que saber aquela coisa que você falou há 30 anos atrás se um dia você quiser ter o Jarvis do Homem de Ferro el tem que lembrar disso ele tem que lembrar de tudo que você já falou com ele e eu acabei me adiantando tá porque tanto o Google quanto o chat de ter nessas nessa apresentação deles eles estão apresentando inteligências artificiais multimodais que não é só palavra você pode fazer palavra escrita falada ela entende o que você fala Até onde eu sei aqui ele não precisa mais fazer aquele processo de converter o que você fala para texto para processar o texto depois gerar um texto e converter aquele texto de novo para fala para falar com você ele meio que entende eles estão entendendo agora o que você fala tá não sei qual a especificidade de cada uma delas de como ela faz eles fazem esse processo mas é basicamente isso uma coisa que eu achei eu vou falar duas coisas aqui do io do Google porque foi uma apresentação de 2 horas mais massante do que tudo foi aquele negócio assistir e Tinta secar sabe qual é que eu V falo só que teve duas coisas que eu achei impressionante a primeira é uma coisa que eu tava antecipando já que acontecer que é o uso dessas inteligências artificiais de conversação em educação por isso é impressionante é aquele negócio de inteligência artificial é de Tecnologia é triste mas é verdade que muita gente vai perder emprego tá muitas pessoas que não deveriam não deveriam no sentido obviamente é um curso pessoal para elas né mas também um curso social grande porque o que vai ter no lugar dessas pessoas não vai eh gerar o mesmo benefício que essas pessoas empregadas geravam pra sociedade pra sociedade essa que é verdade tem Inteligência Artificial que não tem tecnologia que não leva a gente para um patamar melhor Ela traz a gente um bocado mas tem tecnologias que de fato melhoram a nossa vida vida que vai ter um curso social em termos de certas pessoas que vão sofrer com isso mas o curso social geral pra galera é positivo e uma das coisas que eu achava que que achei que era positivo embora seja uma polêmica que eu possa gerar aqui é o fato de você usar inteligência artificial para ser professor particular da criança porque hoje em dia você tem pessoas que trabalham como professor particular que são muito boas e fazem uma vida inteira disso e as pessoas vão continuar existindo elas muito boas tá porque a inteligência artificial não vai conseguir ser melhor que o indivíduo até onde eu até onde eu consigo antecipar melhor que o indivíduo muito bem informado dedicado preparado bom profissional mas uma a galera vai rodar principalmente a galera que tá fazer o bico disso sabe que não é dedicar que essa não é a profissão da pessoa e tal que talvez não fosse um um professor particular tão bom mas o contraponto disso é que você vai ter um benefício social muito grande se você tiver inteligências artificiais que consigam atuar como professor particular dos alunos porém no caso de inteligências artificiais agindo como professor particular L eu consigo imaginar um benefício social muito grande porque a maior parte dos alunos não tem grana para pagar um professor particular a quase totalidade se você for considerar é uma pequena porcentagem lá em cima que consegue pagar a hora de um professor particular e essa pessoas normalmente tem uma vantagem absurda normalmente você contrata um professor particular pro seu filho Seu filho tá tendo problema e o seu filho recebe uma ajuda por conta disso que crianças que não tem as mesmas condições não tem nem condição é que a grande maioria né que a grande maioria tipo assim em termos de competição pelo merc pelo várias coisas que vão surgir depois né de oportunidades na vida o filho de quem tem muito dinheiro se destaca porque ele vai ter mais suporte exato e o que eu tinha antecipado Era exatamente isso inteligências artificiais ensinando alunos mas isso é muito impressionante por se isso acontecendo porque você vai poder gerar uma inteligência artificial que é moldada ao ritmo do aluno a necessidade dele a inteligência customizada customizada ela sabe o que ele entende bem o que ele não entende a coisa que ele entende de forma acelerada coisa que ele entende de forma mais lenta e sabe como trabalhar qual a melhor metodologia para poder endereçar aquele aluno e esse demo aqui é sensacional 1. 5 pro é a inteligência artificial do Google que atualmente né disponível no mercado Tá com contexto de 1 milhão de tokens tá é o que você faz basicamente você pode dar o material tá você pode pegar livroos de datico coisa do tipo e colocar e ele meio que fica eu não sei qu o mecanismo se é aberto para uma janela de consulta ou se ele vai inteiro para dentro dessa desse contexto de 1 milhão de tokens que o J tem source with 1.
5 pro it Instant creates notebook guide with a helpful summary and can generate ISO impressionante eu só quero deixar a coisa clara aqui ele deu a informação e falou eles assim inteligência artificial sobre isso a gente tá vendo a inteligência artificial conversando gerando diálogo consigo mesma enquanto ele e o filho dele estão assistindo tá sobre a matéria on have a j yeah Can you give my son Jimmy a basketb exle Jimmy that's a Fantastic Idea Basketball is actually a great way to visualiz Force and motion Let's Break it Down Okay so first imagine a Basketball just sitting there on the moving because all the foran the cara isso é impressionante a gente tem que analisar tudo é multimodal porque parte dos inputs que ele colocou são também gráficos e coisas do tipo a inteligência artificial consegue olhar a imagem dos gráficos entender o que entender o que que é junto com os textos e levar essas coisas em consideração ela lê isso né É e ela gerou a voz e a voz soua natural a voz com ênfase na hora que ele falou pra Inteligência Artificial Você pode falar isso pro meu filho do Tom né oi não sei como se tivesse falando com a criança porque tem informação é o filho de alguém que tá falando isso prov ela deve ter pensado provavelmente uma criança pequena tal tô que tá aprendendo isso daqui que é matéria de escola Aí ela mudou a ênfase a inteligência artificial fez isso e isso daqui para mim de tudo de tudo que eu vi teve coisas impressionantes tá a coisa que eu acho que é uma das melhores aplicações de inteligência artificial é isso porque a revolução que vai fazer isso em termo de educação não que vai substituir o professor em sala de aula mas esse daqui substitui o professor particular em casa porque você pode aprender a matéria se o aluno não conseguiu entender ele tem outros recursos né é ele é é primeiro que você tem que ter um professor para apresentar a matéria de forma padronizada pro aluno porque não dá para você customizar tudo tem que ter uma noção quando você fala de ensino público Universal tem uma uma uma base que tem que ser comum né é mínima que é comum obviamente que depois você vai sair PR em outras áreas quando você for se profissionalizar quando você tiver outros interesses e tal mas a base tem que ser comum só que dentro do aprendizado dessa base as necessidades e dificuldades de cada aluno vão ser diferentes e como você tem um professor numa sala para 30 e coisa do tipo é muito difícil o professor endereçar tudo então você pode ter inteligência artificial entrando de forma customizada para cada aluno e eu acho isso muito interessante porque tem gente os métodos de aprendizado são diferentes tem gente que é mais visual tem gente que é mais né auditivo Tem gente que precisa pra escrever então você pode sei lá elaborar exercícios pra pessoa copiar enfim e quando você vai aumentando a janela de contexto você pode chegar em um momento que a inteligência artificial tem como contexto toda a vida Educacional do aluno Então ela sabe com o detalhe granular Qual é quais são as dificuldades as matérias na que são mais fáceis para ele onde ele já teve problema no passado que pode indicar se você fizer um cruzamento de dados com informações gerais assim se uma pesquisa e coisa do tipo em termos da da média dos alunos né O que pode indicar uma dificuldade que ele vai vai ter do Futuro em outra coisa e ela pode ser customizada nesse sentido E sem contar que tá tudo ali meio que dá para você fazer uma coisa a a interdisciplinaridade né funcionar de fato porque é uma coisa só que tá integrando todas essas informações Você pode buscar o cara é bom de química você pode buscar um exemplo lá na química para ele entender o outro na disciplina SIM SIM todo método de aprendizado tá disponível e o mais doido é que o aluno interage como se interagia cada vez mais né não totalmente Mas cada vez mais como se você interagir I com o professor é isso é assustador de fato mas não no futuro você vai ter geração de avatares ele vai poder inclusive ver uma pessoa você poder ter um professor particular só te acompanhando a vida inteira isso para mim é um negócio que eu falo assim isso daqui é um benefício social absurdo pra Inteligência Artificial o uso de inteligência artificial no ensino porque a gente fala muito assim de gerar imagem coisa do tipo mas o uso no ensino vai ser impressionando é claro que a gente não tá ignorando os problemas tá gente a gente tá fazendo um recorte aqui para mostrar algo que a gente tinha meio que antecipado também o Leon pelo menos havia até falado sobre isso na Live é e uma coisa que eu tenho que mencionar aqui também que é essa é outro demo que eu acho que eu fiquei impressionado que junto com o Gini 1. 5 pro que é esse que a gente viu aqui atuando na parte de educação e coisa do tipo que é o principal da Google a Google também tá divulgando o J 1. 5 flash que é um modelo baseado em baixa latência e eficiência tá e a gente tem que mencionar que ele ser um terceiro também que é o nano que é o para rodar em localmente em aplicativos tipo assim em aplicativos não em aparelhos que você tem para rodar no seu celular esse daqui que a gente viu o gmni 1.
5 pro ele é feito para rodar nas nubens tá não é o computador da pessoa que tá usando que tá gerando isso que tá sendo gerado nos servidores do Google ele tá mandando de volta para você informação do seu computador aí tem um nano que é para rodar no computador local que obviamente tem uma série de limitações né por conta disso porque o seu celular normalmente não é tão potente quanto um servidor inteiro de de gpus não é mesmo e você tem o flash também que é basicamente PR resposta rápida esse aqui é o propósito dele e esse demo aqui achei sensacional vamos lá é deixar bem claro segundo Google tudo isso daqui é em tempo real são duas partes que foram capturadas uma com celular e uma com óculos em tempo real speak what that part speaker call What does that Part of The Code do thise encryption and decryption functions it seem to use aesb encryption To enc and dec data Key VV What ne do you think Tá certo Caramba aí o óculos agora essa já é outra dema esse óculos aqui não é um produto ainda tá é um protótipo Imagina você tá com óculos você tá name than enim ISO daí é ointe é impressionante tá é impressionante obviamente que tem uma crítica toda vez que a gente vê o demo igual a esse porque você começa a apontar é o seu celular para coisa primeiro isso daqui você tem que pensar que é é um ambiente extremamente controlado é a demo feita para parecer bonita obviamente que impressionante mas é tudo feito aqui para parecer bonito contanto que já tá pronto né a vizinhança lá de Kings Cross eu tipo assim gosta de chegar na na na Paulista né na Paulista falar onde é que eu tô ele tá numa ela tá numa rua lá do terza Maria Barb sabe lá em beru não tá ela não tá a gente sempre fica apontando essas coisas de reconhecimento de imagem para coisas que a gente conhece igual eu fiz com o meu fone de ouvido né ou até para poder checar né um jeito fácil de checar mas tipo assim ainda assim impressionante Quando a gente tiver isso funcionando o tempo inteiro o grande problema da Inteligência isso assim isso é impressionante tá gente não tem que falar se a gente conseguir chegar nesse nível de Jarvis smo eu vou criar esse esse termo agora é é uma escala quão perto a sua inteligência artificial é do Jarvis do do Homem de Ferro beleza é o nível de Jarvis isso daí é um nível bem alto de Jarvis chegar nisso aí seria impressionante o flash já tá disponível é tudo isso daqui custa dinheiro se eu não me engano o flash para cada 1 milhão de tokens É nos centavos eu acho e o pro se você quiser 1.