Talvez você não conheça essa inteligência artificial francesa que promete ser a melhor do mundo para ler PDFs, analisar, resumir e te ajudar a estudar esses documentos. O nome da IA francesa é Mistral AI, que tu pode acessar aqui no site LeChat. LeChat é o site como se fosse o Chat GPT dessa IA.
E eu vou, nesse vídeo, analisar e testar na prática. Vou botar alguns editais aqui de concurso, alguns livros, e vou testá-la comparando com o poder do Chat GPT. Então, curte o vídeo, deixa o joinha, te inscreve no canal!
Aqui tem vídeo de tecnologia, marketing e negócios todos os dias. Vamos lá! OCR Mistral: apresentando a melhor API de compreensão de documentos do mundo.
Vamos ver se é realmente a melhor do mundo! OCR é uma tecnologia de reconhecimento de caracteres; é como o computador consegue reconhecer caracteres. Vamos lá!
Ao longo da história, os avanços na abstração e recuperação de informações impulsionaram o progresso humano, de hieróglifos a papiros, da Imprensa à digitalização. Uhum, tomem água! Cada salto tornou o conhecimento humano mais acessível e acionável, alimentando ainda mais a inovação.
Hoje, no caso ontem, estamos no precipício do próximo grande salto: desbloquear a inteligência coletiva de todas as informações digitalizadas. Aproximadamente 90% dos dados organizacionais do mundo são armazenados como documentos, e para aproveitar esse potencial, estamos introduzindo o Mistral OCR. Então, 90% dos dados de empresas no mundo são salvos em PDF.
Interessante! Vamos saber dessa informação bem redondinha, o número, né? Fico até desconfiado quando o número é muito redondo.
O Mistral OCR é uma API de reconhecimento óptico. Tem na API, tem também no Chat. Para quem não sabe o que é API, é como se fosse uma chave de acesso a um modelo de IA, a um LLM que os programadores usam para construir uma startup, um negócio em cima da solução deles.
Então, eu posso fazer uma empresa minha que transforma PDF em posts de Instagram, por exemplo. Aí eu pego a API do Mistral OCR pro meu, e quando meu cliente acessa meu site, lá dentro do meu site tá rodando, em termos, o Mistral lendo o PDF. Aí tu pode usar uma API para ler o PDF e outra API do Chat GPT, por exemplo, para fazer o conteúdo, né?
Por exemplo, GPT 4. 5, que tem uma escrita persuasiva muito boa. É para isso que serve API, para quem não sabe.
Beleza, né? É uma API de reconhecimento óptico de caracteres que define um novo padrão na compreensão de documentos. Ao contrário de outros modelos, como o Chat GPT, o Mistral OCR compreende cada elemento dos documentos: mídia, texto, tabelas, equações.
Aqui tá a grande diferença. Quando tu sobe um documento PDF no Chat GPT e em outros lugares, normalmente, assim, equações matemáticas, alguns desenhos gráficos, ele consegue pegar muito bem o texto, tá? Às vezes dá uma falhadinha aqui ou ali.
Quem nunca foi converter um arquivo para PDF e apareceu aquele monte de caracteres nada a ver, né? Mas aqui ele promete ser multimodal. Essa é a grande diferença, com precisão e cognição sem precedentes.
Ele pega imagens e PDFs como entrada, extrai o texto em um texto, imagens intercaladas, ordenados. Tem alguns exemplos aqui, ó, vou te mostrar. Ó, aqui tá como que é o documento.
Ó, tá vendo? Subiu assim um PDF, depois de passar no OCR, ele digitalizou tudo, inclusive a imagem. A imagem também foi digitalizada.
Tem mais exemplos aqui de equação. Ó, como é que tava a página até embaixo, resolução, cheio de equação e tal. Quando tu passa aqui, ele digitalizou tudo, até as equações.
Ó, tem uma aqui de um idioma muito louco, mesma coisa. Ó, no Indo, resultado do documento, ele não perde nenhum caractere, pelo jeito. Ó, um documento que tirou uma foto de lado.
Ó, o cara nem pode tirar a foto retinho se prestou. E aí, ó, a digitalização, ele pegou até o Mistral AI ali e colocou no lugar certo. Então, é isso que eles falaram.
Ele mantém aqui a diagramação, ele traz as imagens, traz tudo do documento. Não tem, tem zero perda, tá? Zero perda, ou o mínimo possível de perda.
E já comparando com outros modelos, ó, na questão geral, matemática, etc. Ó, o Mistral OCR fez, porque eles botaram por último aqui no rank, né? Teria que estar em primeiro, né?
Enfim, 95%! Basicamente, ele fez na pontuação geral, contra 89% do GPT 2024. Cara, 5% a mais, sem falar que ele é multimodal.
Então, no texto, ele é melhor, ele é mais multimodal. Também aqui em matemática, ele fez 95%, ele pontuou bastante, tá? Se for aqui o Gêmeos, é o Gini, tá?
Do Google, aí do Google documento fez 80%. Então, muita gente usa o do Google, né, para fazer questão de PDF, e o Google faz 80%. Já é bem abaixo dos 95% em média que o Mistral faz.
Ó, pra questão multilingue, né, em português e outros idiomas, ela faz 90%. Questão de escaneamento, 99% quase. E aqui em pegar tabela, olha aqui, o Google em tabela é bem ruinzinho: 78%.
E aqui o Mistral, 96%! Bem interessante. Vamos continuar nosso texto aí em cima?
Ó, a gente parou mais ou menos por aqui. Como resultado, o Mistral OCR é o modelo ideal para uso em combinação com o sistema HAG, né? Isso aqui é mais para quem vai programar.
Aceita documentos multimodais, como slides ou PDFs complexos. Fizemos do Mistral o modelo padrão para compreensão de documentos entre milhões de usuários no LeChat. O LeChat é esse local aqui, pessoal.
Tá? Tu pode subir, e tu pode criar uma conta e usar de graça, né? A IA tá e estamos lançando a API que tu.
. . Pode trabalhar com 1.
000 páginas e eu vi o preço mais ou menos por 1. 000 a 2. 000 páginas.
Tu pode trabalhar com essas muitas páginas, tá? Por bastante coisa, tá? Vamos, deixa eu voltar aqui e ver se tem mais alguma coisa interessante nessa página.
Tem uns exemplos aqui, vamos descer os bmks aqui. Bent Marx multimodal, fez 99% em questão de equações, aqui e tal, né? Se bem que os concorrentes estão um pouquinho próximos assim, mas tu vê que eles pegaram bastante recurso novo, além de melhorar a compreensão do texto em si.
Ó, aqui as linguagens: ó, PT, que é português, o Mistral tá fazendo quanto? 99. 4.
Cara, o Mistral CR quase gabaritou todos eles, tá? Vendo, muito legal! É o mais rápido também na categoria; ele processa 2.
000 páginas por minuto, cara, muita coisa! Doc prompt! Então pode usar o documento como se fosse o prompt, beleza?
Aqui de usos e pode usar. Hoje, ele tá disponível de graça no Lechat. Bora testar, queridos, vamos nessa, vamos testar aqui!
Bom, eu tenho alguns documentos para testar aqui. Eu tenho, por exemplo, um edital de concurso para juiz federal. É isso, me parece que é isso, ó, para o cargo de juiz federal.
Quem aí quer ser juiz? Ó, a primeira coisa que tem que fazer é estudar o edital, né? Mas são 53 páginas, bem encadeado, aqui complicadinho, texto difícil.
Vamos pedir para estruturar aqui um escopo de estudos. Baixei esse PDF e agora eu vou subir ele no Mistral aqui, subir ele aqui e vou subir ele também no ChatGPT. Vou usar o GPT aqui, o 4, tá?
Porque o 4. 5 não tá gratuito ainda, então vamos ser justos, comparar um gratuito com gratuito, né? Apertando no maizinho, carregar arquivo, carreguei aqui o edital.
Tá bom, o PDF subiu nos dois, me ajude a estudar para esse concurso. Hã, crie um resumo e um escopo de estudos verticalizado, verticalizado para me ajudar, tá? Mandei aqui pro Mistral, mandei agora pro ChatGPT.
Vamos ver, eu acho o design do Mistral bem bonitinho, bem interessante. O GPT já respondeu, o Mistral, perdão, ainda tá analisando o arquivo, né? Foi menos de um minutinho, vamos ver.
O Mistral para se preparar para o concurso de juiz federal sugere que é essencial organizar os estudos de forma estruturada e focada. Abaixo, apresenta o resumo dos principais tópicos do edital: princípios fundamentais, Direito Administrativo, Direito Penal, Processual Penal, Civil, Processual Civil, Previdenciário, Financeiro, Tributário, Ambiental, Internacional, Público, Privado. Tem que saber todas as áreas do Direito, né, para virar juiz: Direito Econômico e proteção do Consumidor, noções gerais.
Escopo de estudo: temas, fase 1, fase 2, fase 3, fase 4, dicas de estudo, planejamento, material de estudo, prática. Tá beleza! Resumiu o arquivo aqui, é uma coisa que a maioria consegue fazer.
Ó, o órgão aqui já tem algumas coisinhas que eu achei mais interessante que não veio no outro, né? Então, parece uma coisa. Tá, para tu entender, essa tecnologia de OCR é a melhor, consegue ler texto.
O cr é para ler o texto para extrair informação de gráfico, imagem, texto em si, né? Parece que pra ler o Mistral é melhor. Será que, para depois de ler esse texto, ele é mais inteligente também para trabalhar com esse texto?
Aí é outra coisa, né? Aqui, o GPT-4, por exemplo, ele trouxe uma estruturação mais interessante: ó, validade 2 anos, salário 37. 000.
Tá bom para ti trabalhar aí de juiz com 37. 000, né? E é bom que é uma vaga que tu não pode ser demitido, né?
No máximo que pode ser encostado e receber parado. 50 vagas mais cadastro reserva para objetiva. E aqui, plano de estudos, primeira fase, né?
Prioridade máxima! Ficou melhor a verticalização desse do ChatGPT. Tá, vamos testar com mais um prompt aqui: eh, transforme, transcreva esse PDF.
Vamos ver se ele transcreve para nós. Mesma coisa pro GPT, mandei aqui um PDF bem simples, tá, de concurso. Depois eu vou mandar aqui um livro infantil, vamos ver como o Mistral se comporta com o livro infantil.
Ó, para descrever o conteúdo do PDF fornecido, você pode copiar, tá? Tá transcrevendo, né? Ó, o arquivo do edital é extenso, você deseja que eu transcreva todo o conteúdo ou prefere que eu extraia apenas partes específicas?
Né, tudo. Vamos ver se ele faz tudo para nós, se ele vai se negar. É, aqui o Mistral nem falou nada e já começou a transcrever, vou pausar, não quero que transcreva tudo mesmo.
Vamos ver se o GPT vai se negar. Às vezes, quando é muito texto, a IA se nega pela janela de contexto, né? E possivelmente, tanto o Mistral quanto o ChatGPT não vão conseguir transcrever todo um arquivo de 100 páginas de uma vez só.
Normalmente, eles limitam, eles param, aí tu fala continuar, ele continua de onde ele parou. Vou mandar ele parar aqui também, mandei parar. Agora vou começar um novo chat aqui com os dois, tá?
E eu vou subir aquele livro infantil da Menina das Estrelas, que é um livro aqui do Banco Itaú. Vamos subir aqui o livro infantil nos dois. Beleza, beleza!
Ó, aqui, correu um erro, vamos atualizar essa página. Bora de novo! A Menina das Estrelas no Mistral.
Foi, eh, resuma esse livro, né? E crie uma nova versão dele para download em formato DOC. Se ele faz trabalho para nós de pegar esse livro e fazer a versão DOC dele mantendo as figuras, vamos ver se ele consegue fazer isso.
Mistral, mandei aqui pro Mistral, vou mandar agora pro ChatGPT. Cadê o nosso livro? Aqui, bora ver, já mandei duas vezes, né?
Acho que tá. Dando erro, tá dando um erro. Ponto.
PR ia francesa. Ó, resumo esse livro e cria uma versão dele para download em formato DOC, mantendo as figuras. Ó, o livro conta a história da Vanessa, a menina.
Assim, a mãe da Vanessa leu o livro para ela antes de dormir um dia, contando toda a história, né? Para criar uma nova versão do livro em formato DOC, é necessário ter acesso às imagens originais ou permissão para usá-las. No entanto, posso fornecer um modelo de texto que você pode usar para criar o documento.
Então, tem que ter acesso às imagens ou permissão para usá-las. Ele conseguiu fazer a transcrição aqui do texto, mas as imagens ele não trouxe para nós, para eu poder baixar, né? Por algum motivo, né?
Então, em questão aqui de transcrição, bem legal, bem legal mesmo. Vamos pegar aqui um outro livro. Eu quero pegar um livro, gente.
Eu tenho aqui, acho que o je jeb jeb, cadê? Aqui, ó, esse livro aqui, ó. Ó, tem bastante imagem, tem imagem junto.
Isso aqui não, não é para estar assim, tá? Eu acho que é. .
. Ver, deixa eu abrir ele direto aqui. Deixa eu ver aqui.
Jab jeb. Jab é um livro de marketing, tá, pessoal? É, mas tá assim mesmo.
No meu livro aqui, não tinha visto, tava assim. Parece que ele já passou por um OCR, tá? O arquivo, quando tá assim, ó, é porque ele passou por uma tecnologia de OCR.
O OCR trouxe as imagens. Ó, isso aqui é um arquivo que passou por OCR. Ele já foi, o computador já triturou esse arquivo e transformou ele em.
. . Eu quero pegar alguma coisa escaneada, tá?
Vamos pegar aqui, ó, um livro digitalizado, né, de investimento. Vamos ver se eu acho alguma coisa assim. PDF, investimento inteligente do Gustavo.
Vamos ver. É, mas aqui é mais um livro, ó, que o OCR já passou, tá vendo? Tem aqui algumas tabelinhas, né?
Mas ele não tá digitalizado assim em raiz. Quero pegar com foto mesmo. Ver se eu acho outro aqui, ó.
O jeito Peter Lint de investir a mesma coisa. Isso aqui já passou. Quando tá meio assim, sem diagramação, é porque já passou uma máquina aqui.
Livro escaneado, né? Ver se fica melhor assim. Vamos ver.
Finanças pessoais para iniciantes. Vamos ver esse livro aqui. Isso aqui parece ser.
. . Isso aqui não parece que foi o OCR que passou, mas é um arquivo digital do livro, tá vendo?
Mas tem aqui as imagens, ó. Né? Vamos baixar esse livro aqui rapidamente e fazer um teste com ele.
Substituir, vamos nessa. Vamos subir aqui. Tá baixando o livro ainda, ó.
Foi. Vamos testar. Resuma os principais insights desse livro.
Mandei pro Mistral, vou mandar agora pro ChatGPT. Carreguei o arquivo 17M, um arquivo bem grande, ó. Agora o GPT aceitou.
Então, gente, é uma baita opção, né? Indo aqui pros finalmentes, é uma baita para quem quer ler PDF, quer estudar, quer resumir e, por exemplo, não quer gastar o seu limite de ChatGPT, né? Ou não quer gastar seu limite de outra IA.
Aí, tu pode muito bem fazer um resumo, fazer um primeiro momento com o Mistral, extraindo o máximo de informação de um arquivo, fazendo um resumo dele, né? Pegar um arquivo grande aí de 300 páginas e, depois, tu pode pegar o resultado dessa conversa e jogar pra outra IA e continuar a conversa lá, uma IA que tu julga melhor para ti, pro teu dia a dia. No meu caso, eu vou usar o Mistral pra, né, ler meus documentos aqui, principalmente documentos que estão, que foram escaneados com foto mesmo, e depois eu vou continuar o processo dentro do ChatGPT 4.
5. Ó, bem interessante, né? Vamos ver aqui.
O GPT, ligação financeira é a base, controle de gasto e orçamento. É importante poupar e criar uma rede financeira. Como lidar com as dívidas, né?
A legal que ele bota aqui, onde que tá a fonte do conhecimento. Conclusão: o livro reforça a ideia de que organizar finanças não é uma questão de gastar mais, mas saber administrar melhor o que se tem. Vamos ver esse outro aqui.
É assim, a capacidade de raciocínio. Eu gosto mais do GPT, tá? Mas enfim, queridos, testem o Mistral aí, me conte se você vai usar no teu dia a dia.
Vou deixar o link para ele aqui no comentário fixado e também vou deixar no comentário fixado um link para você entrar no meu grupo de marketing IA. Nesse grupo, na descrição dele, tem 12 prompts de marketing para você usar no teu dia a dia, tá bom? Tamo junto.
Valeu, falou e até o próximo vídeo!