a chinesa de psique dona do chatbot que está surpreendendo o mundo da tecnologia está com uma novidade multimodal capaz de analisar e gerar imagens segundo a empresa o chamado janos pro conseguiu superar o Dali 3 da Open ai em alguns testes as aplicações abrangem diversas áreas como criação de conteúdo visual gerando imagens originais para publicidade design e jogos por exemplo bom edição de fotos com aplicação de filtros remoção de objetos além de análise para extrair informações relevantes das cenas são outros recursos do janus pro essa novidade reforça a posição da deeps como um Player importante
no cenário da Inteligência Artificial impulsionando é claro a Inovação e Desafiando os líderes já cdos a gente acompanhou na edição de ontem do Olhar Digital News que a semana começou turbulenta para as ações da bigtech aliás das bigtec por exemplo E hoje vamos repercutir essa novidade das imagens da Inteligência Artificial chinesa e toda essa agitação no setor de tecnologia no mundo no nosso quadro Fala aí E para isso é claro vamos contar com a participação dele Roberto penes Pinelli que é físico pela USP e também colunista aqui do Olhar Digital Vamos dar um pulinho lá
ver se o pen está aqui conosco Olá pena muito boa noite bem-vindo querido tudo bem Marisa saudade de você faz tempo que a gente não se conversa e tô muito contente de est aqui de novo esses assuntos aí que tão tomaram né cada semana é uma bomba nova Mariz e a bomba da vez é o deeps pois é E aparentemente surgiu de repente mas não é bem assim a gente sabe que não foi um surgimento repentino mas pen antes de mais nada Feliz Ano Novo para você bom encontrá-lo aqui novamente ao vivo viu sim feliz
ano novo para você também para todo mundo vamos embora vamos embora pena olha para começar falando sobre esse lanç de agora da deeps que é esse janos pro explica pra gente o que é o janos pro os detalhes dessa Inteligência Artificial multimodal da empresa chinesa pois bem eh a diferença do genos pro pro outro modelo deles né e e que que eles já colocaram R1 ou V3 é porque esse é multimodal ou seja ele consegue processar mais do que uma Mía e no caso texto e imagem então o primeiro ele é um modelo bem pequeno
tá a gente tá falando O maior deles são vários modelos mas o maior deles tem 7 bilhões de parâmetros é considerado modelo pequeno é o modelo de teste e desenvolvimento não tá nem pronto ainda mas a z psic já tá mostrando para que veio né já tá Não deu nem tempo aí direito da sua último lançamento R1 que foi no dia 20 de Janeiro eles já estão colocando outros modelos mostrando que estão querendo escalar Por que Marisa porque é é é o processo meio que natural a gente viu isso acontecendo com as outras empresas a
openi a Google que primeiro liberava o modelo de texto e depois foram fazendo modelos mais avançados depois modelos que trabalhavam com imagem também porque no final é muito importante para para que você consiga usar esses modelos de maneira mais eficiente que você consiga usar mais mídias né você possa passar uma imagem para ele analisar ou ele gerar uma imagem Então esse janus pro ele é um modelo embora pequeno ele já se mostrou muito capaz eh em gerar imagens então eh ele conseguiu em alguns benchmarks em alguns eh problemas aí de referência ele saiu melhor mesmo
do que o Dolly 3 né você até comentou isso na matéria eh o que já mostra eh uma uma coisa muito muito legal que ele tá realmente muito eficiente Porque mesmo modelo pequeno consegue gerar uma qualidade boa porém eh válido dizer que ele eh o Dolly 3 não é o modelo top de mercado ele já tá até ultrapassado né até uma reclamação eh a gente já tem modelos de imagem muito muito superiores ao Dolly 3 no mercado Né desde o mid Journey até Flux enfim vários outros que eh até mesmo grock tem o Aurora agora
que fazem fazem imagens muito melhores então é é uma conquista sim o janus pro tá chegando aí mas eh nesse sentido ele ainda não tá aí rompendo eh o as barreiras né Ele ainda tá mostrando um modelo eficiente e acho que essa é a palavra interessante porque o que a dips tá mostrando para todo mundo é que ela sabe fazer modelos eficientes O que significa eficiente que você pode gastar muito menos que você precisa de menos energia que você precisa de menos processamento para chegar num resultado muito bom isso Marisa faz toda a diferença é
assim que o mercado tá reagindo inclusive porque eh teve a queda das ações aí da NVidia que em Único dia caiu aí eh 500 eh bilhões qu 400 bilhões enfim Isso mostra que talvez dê para fazer as coisas que todo mundo tá fazendo de um jeito mais em conta e no final o mercado se importa com dinheiro com certeza agora inclusive esse assunto ah com relação aos chips grandes investimentos em Inteligência Artificial né ah grandes data Centers para lidar melhor com a inteligência artificial E aí surge uma ferramenta que aparentemente é mais em conta você
consegue dizer pra gente como que ele fez isso o o pen ou seja o que está por trás dessa história e como que surgiu essa tecnologia digamos mais barata perfeito Marisa então eh a China ela teve que se Reinventar principalmente porque ela tá sofrendo boicote eh por conta dos Estados Unidos e do ocidente em geral para receber chips mais avançados né já já vem essa política aí de alguns meses então Eh eles tiveram que fazer com menos digamos assim mas e como é que funcionou vamos vamos contar um pouco a trajetória aí da dips e
dos modelos que eles já lançaram então o eles começaram com o modelo de psic v né o v1 V2 e V3 O V3 que é de dezembro do ano passado foi o primeiro que começou a chamar atenção então primeiro é um modelo grande modelo Grande ele tem 675 bilhões de parâmetros né Muito mais do que os 7 bilhões do do outro por isso que eu falei que aquele era bem pequeno 671 bilhões já é o modelo que a gente Era um modelo bem grande mas não enorme existem modelos muito maiores né do que esse ainda
mas enfim já é um modelo digamos de peso e aí como é que eles fizeram né esse treinamento eh eles basicamente começaram a fazer o pré-treinamento usando muitos dados dados de textos variados seja em chinês seja em inglês e depois eles passaram para uma outra etapa que é eh Uma etapa que ela é um fine tuning um ajuste com eh dados eh de maneira supervisionada com dados rotulados o que que seria isso quando o modelo sai desse pré-treinamento Ele ainda tá muito cru muito bruto ele não fala de um jeito palatável agradável então há algumas
técnicas para deixar o modelo mais palatável e uma delas é fazer esse esse treinamento supervisionado esse ajuste né que a gente chama de supervisionado Então você vai colocando perguntas e e e comparando com respostas que você já gostaria que ele desse E se ele se se afasta dessa resposta se ele responde de um jeito ruim de um jeito não muito preciso você dá ponto negativo para ele Marisa você fala assim você errou você é ruim não se ele acertou você recompensa positivamente então é um é um é um um treinamento por reforço mas nesse sentido
com com dados supervisionados E aí eles fizeram esses ajustes todos e Conseguiram fazer esse modelo que já era muito bom muito interessante só que tem um pulo do gato aí muito muito legal Marisa o modelo falei para vocês que ele é bem grande 671 bilhões de parâmetros porém dentro desse modelo tem vários experts eh como se em vez de eles treinarem uma um único cérebro uma única inteligência eles treinaram um monte de de fragmentos cada um especializado em alguma coisa são é é uma múltipla personalidade imagina uma pessoa com múltiplas personalidades é mais ou menos
isso o modelo tem um gênio da matemática um cara que entende de biologia um cara que entende de história um cara que entende notícia são várias personalidades E aí quando ele recebe uma pergunta ele o o o cérebro acima desse a personalidade geral decide quem vai responder ah chegou aqui uma pergunta de lógica quem que vai responder ó vamos aqui passar pro Joãozinho o Joãozinho sabe tudo de lógica não vão passar pro pra Mariazinha porque a Mariazinha não sabe lógica ela sabe história e assim a gente chama isso de mixture of experts mistura de experts
São vários experts isso deixa o processo mais eficiente porque cada um desses experts só usa 35 37 bilhões de parâmetros não o 671 É como se você tivesse só para você processar você precisa de muito menos parâmetros para você fazer isso então você você não gasta tanta energia não gasta tanta computação Então beleza Esse é o modelo e que eles fizeram essa mistura de experts e depois veio o modelo R1 que foi lançado agora H pouco no dia 20 de de Janeiro que é um modelo de raciocínio então ele usou toda a est cura básica
que já tinha nesse modelo anterior no V3 então eles aproveitaram tudo só que aí fizeram um novo treinamento para ele ser um modelo de raciocínio também com essa mistura de expertos E é isso que fez toda a diferença eh o que chamou atenção é porque eles conseguiram fazer tudo isso com muito pouco recurso como eu falei para vocês Eles não têm os melhores chips e eles não têm tanto dinheiro e ainda assim só com 6 Milhões de Dólares é o que eles anunciaram eles conseguiram fazer um treinamento de um modelo eh que não é um
dos maiores do mercado mas é um modelo robusto que está batendo os benchmarks os testes aí dos modelos aí de do topo de linha Então esse foi o grande feito E é isso que no final tá chamando a atenção não é nem o resultado não é nem que ele fez algo que ninguém fez só que ele fez algo que as pessoas já fizeram usando muito menos recursos muito menos memória muito menos computação isso tem um valor muito grande com certeza aliás muito boa a sua explicação acho que a gente conseguiu situar aqui como que foi
esse método né que fez com que surgisse uma ferramenta eficiente também mas com baixo custo agora você mencionou inclusive que parece que foi mais uma reação falando em Estados Unidos inclusive pena a gente sabe que os Estados Unidos estão investindo bastante pesado em Inteligência Artificial até por conta das novas eh orientações de Donald trump em especial com o chamado projeto Stargate eu queria aproveitar que você mencionasse também falasse um pouco sobre essa iniciativa ambiciosa que Visa revolucionar a infraestrutura de Tecnologia do país ou seja os Estados Unidos e como DPS pode afetar esse mercado em
especial esse tal do projeto Stargate Beleza então Eh assim que o trump assumiu ele anunciou esse projeto Stargate que eu chamo né eu falo que é como se fosse o projeto Manhattan de tão ambicioso Maris o projeto Manhattan aquele que fez a bomba atômica lá na década de de 40 que naquela corrida na segunda guerra para para ver quem conseguia fazer a bomba atômica primeiro foi muito muito muito dinheiro muitos cientistas colocados num único lugar para poder fazer essa bomba atômica então Claro agora não é uma bomba atômica Mas é uma é como se fosse
a mesma corrida a gente está nessa corrida os Estados Unidos e a China meio que tão nesse nesse processo para por quê Porque a inteligência artificial Talvez seja a nova bomba atômica Talvez seja quem dominar isso vai ter um poder absurdo então ele anunciou esse projeto Stargate só que esse projeto ele não é Fin AD Tecnicamente com dinheiro do governo do contribuinte e eh vai ter um apoio obviamente do governo Possivelmente instalações em em maneiras de importar coisas de facilitações diversas Com certeza mas o dinheiro vai vir é um dinheiro de empresas privadas ser uma
Joint venture Entre várias dessas empresas essas bigtec como a Open Oracle etc tudo bem Então esse é o Projeto Stargate e quais são as cifras que foram anunciadas 500 Bilhões de Dólares é muito muito muito dinheiro é mais dinheiro se a gente fosse converter o projeto Manhatan atualizar pelos números de hoje é mais dinheiro do que o projeto Manhatan assim é uma cifra gigantesca né gigantesca é uma tem tem é o PIB de alguns países né assim dependendo do tamanho do país da o PIB do país ou seja é algo realmente ambicioso E aí já
muitos se questionou até o willon musk que tá fora dessa brincadeira ele falou assim não não tem dinheiro para isso né É claro ele tá ele ficou de fora Ficou ali mordido né e resolveu comentar nem tem esse dinheiro aí outras outras empresas começaram a se manifestar dizendo que tem esse dinheiro claro que esses 500 bilhões vão vir durante esses 4 anos né Realmente ter essa cifra em caixa aí disponível então eles começariam com 100 bilhões e parece que tem Então esse é o grande projeto de eh ambicioso dos Estados Unidos para fazer frente aí
aparece o o DIP zic né E será que isso Muda alguma coisa então a primeira reação acho que do do americano em geral foi negar alguns até falaram ai Isso é uma é é é uma campanha de marketing para desestabilizar os nossos mercados e e assim né gerar toda essa confusão eh olha eu vi alguns especialistas checando esses números eu mesmo fiz algumas contas para ver se se era razoável e e parece que é tá Marisa claro que a gente não sabe o que acontece lá dentro da China a gente não sabe qual a influência
que o governo tem em cima dessa dessa empresa que tá fazendo de PS a gente não conhece isso pode ser que seja bem controlado pode ser que não mas quando você olha os dados que eles apresentam e olha tem artigo científico esses dados são abertos os modelos são abertos são open source a gente consegue ver que faz sentido eles conseguiriam de uma maneira muito eficiente usando as técnicas que eles propõem fazer esse treinamento com essas cifras que eles falaram assim não não tem nada que você olha você fala assim nossa não dá para fazer Claro
precisa de gente muito boa e com certeza eles têm a China é que mais publica paper artigos em Inteligência Artificial mais do que dos Estados Unidos mais do que ocidente Isso já é já já vende um tempo ou seja eles estão na frente na pesquisa de A então não é difícil você pensar que isso se sustenta até porque eles estão com o modelo oficial lançado eles estão dando acesso para as pessoas as pessoas estão dando de graça Marisa se não fosse um modelo tão eficiente seria difícil eles conseguirem manter isso no ar porque as pessoas
iam começar a usar e a cair porque não ia ter então assim primeira coisa me parece que é consistente não dá para saber quanto de influência quanto que isso é estratégico para combater aí o o projeto Stargate a gente ainda não sabe mas faz sentido e de o que eu achei mais curioso disso tudo é que em um dia a nvd já perdeu né Caiu as ações em em 460 Bilhões de Dólares que se você for ver Dá quase a cifra do projeto Stargate então é muito engraçada é qu assim não não tem esse dinheiro
mas é possível uma empresa perder todo esse dinheiro em um dia é claro que quando a gente fala perder o dinheiro tem que tomar cuidado porque não é que perdeu os dinheiro sumiu é é são as flutuações das ações e claro que o mercado tá reagindo e amanhã pode ser que volte parece inclusive já tá voltando mas a gente não sabe tá muito incerto ainda tá aquele período né aquele período de bolha que você não sabe se vai para cima se vai para baixo o fato é é que foi uma grande eh um tapa na
cara do ocidente um tapa na cara dos Estados Unidos que achou que tava com essa bola toda e na verdade parece que não tava o próprio projeto Stargate começou a a a ser olhado com com mais desd e para mim o que isso mostra Marisa é que existe muitos jeitos mais eficientes de fazer Inteligência Artificial a gente ainda nem chegou perto né dá para conseguir muito mais inteligência muito mais performance com menos custo com menos dinheiro é isso que a China no final tá ensinando pra gente tá certo Pois é e com certeza ainda essa
semana teremos mais novidades ainda porque as velocidade das informações sobre a China realmente vai avalar o mercado ainda essa Man na Pena Muitíssimo obrigada por mais uma participação aqui com a gente com essas explicações que eu tenho certeza foram ótimas para todos que estão acompanhando e semana que vem a gente se encontra beleza Marisa Obrigado aí até semana que vem beijo pena Boa noite é isso aí pessoal tá aí Roberto pena espinelli mais uma participação aqui com a gente no Olhar Digital News como vocês já sabem vocês fiam por dentro de tudo somente aqui no
Olhar Digital semana que vem terça-feira tem mais coluna Fala aí