[Música] [Música] você está ouvindo o história [Música] FM inteligência artificial na história Inteligência Artificial é aquele tema que tá na boca de todo mundo tá todo mundo ansioso com as possibilidades ou mais temeroso com os problemas e já tem problemas aparecendo questões éticas enfim mas a pergunta é as ias como ferramentas como elas podem ajudar o nosso trabalho quais as dificuldades quais os lados negativos e Quais as implicações éticas disso esse é o tema de hoje do história FM eu sou iis Rodriguez e para falar sobre esse assunto eu convidei o professor Rodrigo bonaldo a
quem eu passo a palavra para se apresentar para vocês então Rodrigo seja muito bem-vindo fique à vontade para se apresentar pro pessoal obrigado wiis é um prazer estar aqui conversando com você e eu gostaria também de mandar um um alô pros pras pessoas que estão nos escutando Eu sou professor da Universidade Federal de Santa Catarina dou aulo de teoria da história e nos últimos anos eu venho me dedicando a entender o fenômeno da Inteligência Artificial E para isso eu resolvi desenvolver também sistemas de a que sejam úteis paraa Nossa prática historiográfica Então é isso vamos
entender um pouco mais os usos e problem áticas das inteligências artificiais na história Depois que eu falar para vocês da nossa campanha no ap afinal de contas é a nossa campanha do apes que financia esse podcast o históri FM é um projeto Educacional gratuito já tá no ar desde 2019 já ajudou milhares de pessoas mas ele só existe porque nós temos colaboradores que ajudam a financiar esse projeto e você pode fazer isso em apoia.se bar obrigahistória 2 por mês você já ajuda o programa você tem o seu nome citado aqui tem acesso ao mural com
os spoilers que vem pela frente 5 por mês você ouve os Episódios com antecedência R 10 por mês você tem acesso aos roteiros inclusive logo logo eu tenho que poar mais um lote de roteiro dos que estão atrasados E você tem acesso a tudo isso por um valor módico e ao mesmo tempo você apoia um projeto Educacional gratuito os nossos novos apoiadores e apoiadoras são luí tat Danilo Lins jancarlo Gonçalves Iago Hubert Carolina Macedo Alex Ribeiro e Marcelo Cruz Muito obrigado pessoal é graças a vocês que esse programa existe se você que tá ouvindo quer
apoiar também é só acessar apoia.se bar obrigahistória e fazer a sua colaboração Ou se você quiser fazer um apoio diferente assim um apoio único ou não quer fazer cadastro no apoi quer ajudar de outras formas e não faz questão de receber recompensa você pode fazer isso via PX Pela chave leitura obrigahistória @gmail.com repetindo leitura obrigahistória @gmail.com [Aplausos] Inteligência Artificial segue sendo blá blá blá técnico na prática se trata de uma máquina um sistema artificial inteligente que consegue executar uma tarefa de forma precisa barata rápida e em geral melhor do que uma pessoa faria mas apenas
esta tarefa [Aplausos] [Música] específica bom pra gente começar essa conversa eu queria começar te perguntando o básico O que é uma inteligência artificial Eu vejo algumas pessoas questionando esse termo por exemplo dizendo que elas não são exatamente inteligências que o termo certo deveria ser outro mas esse é o nome que se consolidou né então a gente vai usar esse termo para que as pessoas entendam do que a gente tá falando então de novo o que que seria uma inteligência artificial Então essa é uma ótima pergunta Porque de fato inteligência artificial é uma espécie de nome
fantasia ou de nome comercial Ou de nome de efeito para um campo da da computação e a história da inteligência artifici ela se confunde com a história da computação de fato Claro computadores máquinas de calcular eles existem desde a antiguidade e no século XIX Elas começam a ficar bem sofisticadas eram máquinas mecânicas mas cada uma delas fazia uma conta diferente tinha máquina de de adição máquina de subtração e máquinas muito mais complicadas máquinas de cálculo integral por exemplo até que lá pelo pelos anos 20 30 do século passado século XX começaram a surgir propostas de
comput comp adores universais né ou seja computadores que fazem todos os cálculos possíveis exceto alguns bem específicos né como as equações de gle por exemplo então o Alan tuny foi o mais famoso desses Engenheiros e cientistas da Computação Quando Ele propôs né o seu computador Universal que acabou se transformando né na máquina de touring e que hoje é o computador como a gente como a gente conhece mas aí daí que nos anos 50 60 a expressão que aparecia que lente o que seria hoje a inteligência artificial ela era computação inteligente é só em 1955 na
chamada de um seminário organizado por dois grandes expoentes do campo da Computação Marvin minsk e jo mccarty que eles lançaram nessa chamada nesse Call of papers né a expressão Inteligência Artificial que se transformou no que no ano seguinte em 1956 e ser assediado no no no em Dartmouth né uma grande conferência né com com especialista nesse nesse assunto e essa expressão Então ela surge aí Inteligência Artificial e ela dizia a respeito assim de maneira muito Ampla tem várias definições mas uma que eu gosto é de que a inteligência artificial desz respeito a sistemas que realizam
tarefas que se acreditava que só seriam possíveis de ser realizadas por agentes humanos inteligentes não uma definição muito Ampla né só que aí dentro da Inteligência Artificial a gente tem alguns paradigmas o primeiro paradigma deles eu V fala de dois né primeiro paradigma deles é o simbólico o segundo é o conexionista ou sub simbólico bom o que que é isso vou explicar da seguinte maneira el Imagina assim que existem dois tipos de robôs tá existem vários mas vamos simplificar para pessoal entender com mais facilidade o primeiro tipo de robô é um robô assim programado hardcoded
se eu escrever um código aqui e eu fizer tudo direitinho eu posso fazer um robô que vai levantar daqui e vai abrir a minha porta certo mas ele só vai fazer isso ele é baseado em cim SOS em manipulação de símbolos e em regras agora tem um outro tipo de robô que é assim eu pego um algoritmo esse algoritmo é o maquininha de de executar tarefas e eu jogo um monte de informação dentro deles e daí ele vai ficar lá processando essas informações reconhecendo padrões reconhecendo os padrões e depois eu coloco Depois que terminar esse
treinamento de máquina eu coloco ele nessa sala daí ele vai começar a interagir com a sala e ele vai fazer coisas muito malucas ele vai botar o dedo na minha orelha ele vai abrir a janela e toda vez que ele fizer uma uma coisa que eu não quero que ele faça eu dou um estímulo negativo nele uma punição e toda vez que ele fizer algo que eu queira que ele faça como abrir a porta por exemplo eu dou uma recompensa para ele e daí ele vai sendo assim vai vai vai vai acontecendo o que a
gente chama de ajuste fino né dos parâmetros do robô e ele vai fazer as tarefas que eu quero né esse segundo tipo de robô a gente chama de o robô de aprendizado de maquina um programa de aprendizado né que foi proposto lá pelo Allan touring num ensaio do década de 50 quando depois de descrever famoso ensaio chamado podem as máquinas pensar né que começa com o famoso jogo da imitação né mas o jogo da Imitação é a primeira página né um experimento de pensamento que ele diz ah pode um robô enganar um ser humano né
assim tem uns caras dentro de uma sala e daí tem duas pessoas ali discutindo e tem um interfone e você só pode se comunicar pelo interfone né e do outro lado tem uma pessoa e se se o se o o tem um robô né e uma pessoa dentro da sala e se se esse robô conseguir enganar a pessoa que tá fora de que ele é o humano e que o humano é o robô então ele é inteligente mas é a primeira parte na última parte desse ensaio né Podem as máquinas pensar o alantur diz o
seguinte Ok até agora a gente discutiu como é programar um computador como se fosse uma pessoa adulta cheio de regras tudo prograd e tal que tem que fazer que não pode fazer e se a gente fizesse o contrário se a gente programasse um robô para ele ser uma criança e aprendendo com o tempo né Isso é o aprendizado de máquina né e o aprendizado de máquina ele tem o um um um um um grande salto nos últimos nos últimos 20 anos mas com mais forço chamado aprendizado profundo de máquina nos últimos 10 10 15 anos
não é por quê Porque esse tipo de procedimento né o aprendizado de máquina que é um nome meio antropomórfico assim como muitas noções da Computação como a memória do computador por exemplo que a gente usa o tempo inteiro né é uma metáfora antropomórfica para processamento de informação por reconhecimento de padrões com uso de redes neurais artificiais e esse tipo de procedimento ele de aprendizado de máquina ele vai ter um salto como eu falei nos últimos eh 10 15 anos por conta de duas coisas para você fazer isso você precisa de muito muita capacidade de processamento
por um lado e de muitos dados por outro lado então você vê que que aconteceu nos últimos 15 anos um um salto enorme na na na no processamento de informações gráficas né placas de vídeo por conta da indústria dos jogos dos Games né e dois muitos dados disponíveis por conta da redes sociais dados comportamentais humanos Então você junta essas duas coisas muitos dados e capacidade de processamento você tem esse buom da inteligência artificial com aprendizado profundo de máquina então vocês podem perceber quem quem trabalha com com com texto né E quem quem quem estudou na
na na universidade Ah e tendo que ler textos em outras línguas deve ter percebido que nos últimos 10 anos por volta de 2010 em diante tradutores online começaram a ficar cada vez mais comuns e cada vez melhores esses tradutores online eles trabalham com processamento de linguagem natural né E isso teve um avanço muito grande justamente nesse mesmo período que a gente vê rede social e Indústria dos Games se juntando a grande novidade então né da ia nos últimos tempos é justamente a passagem de uma ia analítica né para uma EA generativa existem eas fazendo várias
coisas no mundo atualmente eu não quero cobrir todas aqui meu foco desse Episódio é a gente discutir as aplicações que já estão em andamento e as que ainda podem surgir que dizem respeito à história oo trabalho dos historiadores e tal né porque né isso aqui é um podcast de história então eu vou focar esse primeiro bloco nas ferramentas de a que estão mais popularizadas por aí né E aí a gente pode começar esse papo mais aplicado de um jeito mais familiar que mais gente conhece e tal eu queria falar sobre as ias generativas de texto
e aí claro que a gente tem que falar do chat GPT que é a mais famosa do mundo como é que você avalia o uso que as pessoas têm feito dessa ferramenta e De que maneiras você acha que ela pode ajudar ou atrapalhar o trabalho de professores e historiadores ah Issa é uma ótima pergunta não é porque veja aí clis quando a gente fala do chat GPT do Bing do Bard não é Ou agora Gemini né esses a gente tá falando de large language models né os modelos de linguagem grande ou massiva né como você
quiser e esses modelos eles eles trabalham com uma arquitetura neural proposta pelo Google lá em 2017 chamada Transformer né e o Transformer ele foi proposto como um tradutor era um tradutor Se você pegar o o artigo is all unit que ole Google Brain publicou né era isso era um tradutor tradutor muito bom por sinal essa é uma função é função objetiva desses chatbots era traduzir texto né e e é muito louco porque daí eles perceberam com o tempo que ficam mudando um pouquinho os parâmetros ali do do chat do do do transformer Eles podiam gerar
texto também essa é a passagem da EA analítica para EA generativo né e e claro quando você tá conversando com o chat PT você tá conversando com uma uma tabela né uma tabela de Excel ou de csv na verdade muito provavelmente né que é um formato mais mais menor né mais leve e e que que tem nessa nessa tabela nas colunas na nas linhas você tem lá sei lá 20 trilhões de tokens ou palavras né ou Queens são as unidades simbólicas da programação que a gente chama no caso é processamento de linguagem natural palavras e
nas colunas você tem mais ou menos 800 dimensões Se não me engano ou seja profundidade da tabela e às vezes essa tabela ela se cruza quer dizer a a probabilidade de uma palavra tá próxima da outra ou de metade de uma palavra tá próxima da metade de uma outra palavra Como faz o chat GBT daí isso gera parâmetros esses números ali esses pesos são os parâmetros e eles perceberam que mudando esses parâmetros ele podia gerar texto e daí eles ficaram lá anos desenvolvendo isso desenvolveram métodos de aprendizado mais sofisticado como o super aprendizado por feedback
humano que é o grande que permitiu a Open e lançar ainda antes que o Google né o chat GPT e ainda continua na minha apreciação com continua melhor do que o do que o gemin né porque eles estão eles ficaram mais tempo fazendo esse esse aprendizado por feedback humano que era os caras lá dizendo Ah tá bom tá ruim tá bom tá ruim nas universidades Americanas e depois começaram a contratar gente no sul global no Kênia por 2 dólares uma coisa assim uma precarização do trabalho também outra dimensão da da ia até e ess dimensão
do do capitalismo contemporâneo né Então teve esse grande bum né Todo mundo começou a falar do do chat PT Eu lembro que eu tava escrevendo Tava terminando de escrever um artigo sobre Inteligência Artificial e daí eu lancei o artigo e daí Todo mundo começou a falar sobre isso ficar apavorado pensei não agora vou começar a desenvolver né eu comecei a estudar isso e uma os riscos né que que que que a i generativa de de texto particularmente envolve né eles são bem conhecidos Né desde do da geração de textos falsos né da do do da
falsificação acadêmica né iso tem preocupado muitos professores né embora quem interage com esses modelos vai com o tempo perceber na hora assim que o foi o chat GPT que escreveu né porque tem assim um template ele não é programado para isso mas o o aprendizado por feedback humano aprendizado de reforço que é a última etapa do desenvolvimento de de um EA dessas né ele vai meio que moldando né uma espécie de template ali além de vícios de linguagem né e e você percebe né claro que isso exige que você esteja também interação com esses modelos
Esse é o primeiro o primeiro primeiro risco né o segundo risco i é a Alucinação da ia né que também é um termo polêmico mais um termo antropomórfico como todo termo antropomórfico na computação um termo polêmico mas o que que isso significa e enquanto a gente tiver um paradigma estatístico na Iá que é esse paradigma sub simbólico conexionista de que eu falei né do robô que aprende por reconhecimento de padrões isso aí é outra outra definição de aprendizado de máquina estatística com esteroides né é uma estatística turbinada então a gente sempre vai ter assim cinco
pontos para baixo cinco pontos para cima que nem né o a pesquisa leitoral né então ele sempre vai estar sujeito ao erro porque ele tá ali tentando prever a possibilidade da próxima palavra e às vezes ele prevê muito errado né você tem a ver com a regra de Bis né que eu chamo de e o Molly Hall problem né mas que eu chamo de problema da porta do Malandro assim você tá lá num programa de auditório tem três portas atrás tem atrás de uma tem um brinquedo no outro tem um macacão né nas outras duas
daí você escolhe uma eu quero a um daí o malando diz não você não quer trocar daí mostra a dois daí na dois tem um macacão vem aquela aquela música assustadora a criança ch coisa horrorosa dos anos 90 né não sei como sobrevivi Mas enfim nesse momento que ele te mostra o outro macacão é contraintuitivo mas quando ele diz você não quer trocar você deve trocar porque aconteceu uma coisa chamada mudança variável antes a chance era de 1/3 agora a chance se você trocar é de dois ter isso não faz muito sentido Se você olhar
para uma porta para uma escolha de porta só mas se você olhar em 100 portas faz sentido então moral da história mesmo que um um um uma ia seja muito bem validada otimizada em algum momento vai aparecer o macacão e esse macacão é a Alucinação da i então ela vai inventar coisas né vai chegar para nós com uma coisa inventada né E isso pode levar desinformação isso pode levar um aprendizado incorreto né ou e às vezes é muito Sutil né você tá ali com texto muito né convincente e de repente é uma bobagem enorme no
meio acontece né isso acontece bastante agora de maneira bem mais prática I né quando a gente tá interagindo com o com com o chat GPT por exemplo a dica que eu dou para um bom uso a primeira dica que eu sempre dou é a seguinte como eu falei são maquininhas de aprender por que que ao invés de sair perguntando pro chat GPT como se fosse Moisés falando com Deus por que que a gente não ensina algo para ele antes pô tô aqui lendo um texto muito difícil nunca vi isso aqui antes e tal uma matéria
nova é uma coisa muito teórica ou muito empírica não conheço essas pessoas que que tá sendo faladas aqui joga o texto ali né No início você tinha que quebrar o texto em 3500 caracteres e tal daí p um prompte para ele dizendo assim olha eu vou te ensinar um texto Ele é bem grande vai Resumindo as partes aí daí quando terminar né avisa eu aviso mas agora parece que a janela janela de contexto ele tá bem Ampla então dá para botar o texto inteiro se dá até para mandar o arquivo dependendo do do do modelo
de linguagem você tá interagindo né Manda lá para ele e depois faz as perguntas pede para resumir o texto pede para reduzir o texto a um tweet ele faz é bem engraçado pergunta qual o problema de pesquisa né pergunta qual a hipótese e pergunta pede para fazer assim Bullet points né os principais pontos do texto faz o que você quiser né inclusive discute olha essa hipótese do autor é essa beleza né mas e como é que eu posso pensar hipóteses alternativas porque eu tô querendo estudar o mesmo tema tô tentando chegar no problema de pesquisa
original por meu TCC eu gostei muito desse texto mas eu quero pensar um pouco diferente com outras fontes daí faz um Brainstorm lá com depois de ensinar o robô entendendo e claro Leia o texto antes né Veja se o resumo que ele fez porque a primeira coisa que eu vou vou pedir para vocês fazerem é pedir pro GPT fazer um texto né um resumo daí você lê vê se tá mais se é aquilo mesmo tem alguma bobagem no meio você corrige você pode pedir para ele corrigir e tal Ensina ele direitinho e depois começa a
perguntar Vocês vão ver que o os resultados de você vocês vão ser muito melhores do que sair perguntando né como se fosse assim um um grande guru né então eu eu acredito que a primeira etapa assim é eh não apenas saber o que perguntar mas também ensinar alguma coisa para pro pro chat PT pro pro Bard né agora não é Bard mas Gemini né do Google né e outro modelo de linguagem grande que você esteja interessado em em em utilizar né Nós estamos entrando em uma nova era da informação que é a era da informação
sintética a revista vog confundiu uma montagem do Papa que foi feita por inteligência artificial com uma foto real é só o começo do dilúvio de conteúdo delirado para chamar a nossa atenção logo vem os vídeos os amigos imaginários mais convincentes que você já teve redes sociais onde não dá para saber quem é real ou não e muito mas muito mais que a gente mal sabe conceber [Aplausos] [Música] agora um outro tipo de ja que tá B voga é o asiá de criação de imagem a partir de texto de prompt de comando né mais pra frente
gente aqui mesmo no programa A gente vai fazer um bloco só de perguntas sobre os limites éticos os problemas que isso pode trazer mas por enquanto eu queria te perguntar o seguinte que usos você percebe que professores historiadores graduandos e afins TM feito dessas ferramentas de geração de imagem relacionados à história no caso né E se você acha que há aplicações éticas desse tipo de ferramenta na geração de imagens pro nosso trabalho uhum então uma boa pergunta também n sabe que um ano atrás um pouquinho mais eu assinei o mid né midj é um desses
geradores de imagem que me pareceu aquele que é o mais realista de todos né se você tem um bom Prom de no mid Johnny você pode inclusive escolher a câmera que você quer você pode escolher iluminação você pode pedir o estilo né E claro depois quando a gente fala das implicações éticas disso a gente pode explorar melhor os problemas relacionados a isso né mas daí eu comecei assim na minha no meu grupo né que que a gente tem aqui Um grupo de de I história aqui na ufsk que eu fundei a um pouco mais de
um ano atrás né a gente começou discutindo o texto mas depois a gente começou a brincar também com as ferramentas né e o medion chamou atenção do pessoal né clar que é coisa na época assim a gente ficava impressionado com aquilo né hoje já faz mais parte do nosso cotidiano e daí a gente ficou discutindo né tinha ali estudantes de ações afirmativas e tal o que que a gente pode fazer com isso né ã e daí a gente teve a ideia de lendo um texto da saia hartman que fala sobre a fabulação crítica né na
assim o limite da ficção para se falar de história de pessoas que a gente tem pouca com informação primária um pouco isso Vênus em dois atos esse texto Ela também tem um livro chamado los your Modern né Acho que tem em português já ela trabalha com isso né daí a gente ficou pensando Bom ela faz isso com narrativa com texto né e a gente pode fazer isso com imagem daí teve a ideia assim de pegar umas e descrições de pessoas do século XIX né esquecidos da história subalternos da história vista de baixo e tal daí
um estudante e eh pensou não vamos vamos trabalhar com registros de de de pessoas escravizadas né e a professora Beatriz deu a dica daí pra gente de trabalhar com relatos de fuga porque daí os senhores né de pessoas escravizados os cvag eles colocavam no jornal uma descrição física da pessoa né daí pô a gente pegou essa descrição né traduziu pro inglês né fez um prompt assim e começou a jogar no Midon para ver o que acontecia né daí a gente começou a ter imagens das pessoas claro isso é uma fabulação né mas a ideia era
um pouco isso chamar atenção pra presença Negra e tal depois a gente começou a discutir também implicações éticas B nca divulgou and essas imagens né mas foi uma forma só internamente aqui no curso fazemos umas discussões aqui com os outros estudantes de ações afirmativas que que eles achavam daquilo se era problemático se não era né É mas eu confesso que eu não sei mais para onde levar esse esse projeto foi uma série de experimentos que a gente fez né com descrições de pessoas a partir de fontes primárias né então H acredito que pode ser uma
ferramenta assim para você né produzir assim a sensações de presença do passado né uma coisa que a indústria dos Games já faz há um bom tempo mas né a gente pode ir explorando essas essas essas ferramentas para isso né quem sabe eh no futuro a gente possa ter outras ideias também né mas eu confesso que no momento tô mais voltado pro texto né do que para pra imagem mas o princípio no qual eles funcionam é é bem parecido né eles têm pontos de dados né recebem grande volume de dados no caso volume imagem ou ou
ou texto Daí eles tokenizar o token é a unidade simbólica da programação né humanidade que você você atribui um valor e no caso do mid Journey né o que ele tá fazendo ou do dauli ou do ou do stable diffusion né dessa arquitetura Difusora né o que ele faz é é desintegrar as imagens em pixels e recompôs pixeis né sub simbolicamente né isso tem Claro implicações éticas também e de direitos autorais que a gente pode discutir depois um outro uso relacionado à geração de imagens e esse eu acho muito interessante eu mesmo já usei Em
algumas ocasiões são as ferramentas de a para upscaling de imagem para quem tá ouvindo não sabe o que que é isso né E sabe quando você pega uma imagem na internet mas ela tá muito pequena numa resolução muito ruim aí você tenta esticar porque você precisa aumentar ela né para botar num numa rede social fazer um papel de parede do computador não sei e aí você vai aumentar ela e aí Esse aumento vai distorcendo a imagem ela fica com a qualidade péssima fica horrível e tal então uma iad up scaling Ela faz o quê Ela
lê a imagem e redesenha tudo que tá na imagem num tamanho maior aí Claro quanto maior a diferença do tamanho original da da imagem original pra versão grande quanto mais detalhes você pedir para ela desenhar mais isso afeta o resultado final às vezes não fica bom mas para mim isso tem sido muito útil em casos em que eu acho que uma boa imagem para fazer uma capa de história FM eh né eu procurei vi uma imagem e pensei pô essa é a capa ideal só que a imagem é muito pequena sabe E aí isso acontece
muitas vezes com temas de história da África história do Brasil que são temas que às vezes é mais difícil achar uma boa imagem para fazer uma capa e quando eu fui no inteligência limitada para falar sobre o Dia D eu queria mostrar uma foto da destruição de alguma das cidades que foi destruída por bombardeio aéreo dos Aliados na campanha da Normandia e eu achei uma foto excelente assim só que ela era pequena eu passei por um a de upscaling conferir Claro né tem que você tem que depois de pronto você tem que conferir com o
original do lado para ver se tá tudo certo e ficou muito bom e eu consegui levar a imagem pro programa e tal então assim tem teve esse caso em particular tem essa questão das Capas do histó FM né Porque aqui no caso ela não tá gerando uma imagem do nada a partir de texto e pegando a Estilos artísticos de outras pessoas O que ela tá fazendo é só redesenhar né em cima da imagem que você mesmo forneceu Mas enfim e o que que você acha que que essas ferramentas de upscaling podem ajudar no trabalho de
historiadores especialmente pensando aqui em historiadores que trabalham com imagem né então Boa pergunta também e eu não não sei se sou a melhor pessoa para responder como eu falei eu faço fiz esses experimentos com imagens né Mas o negócio mesmo é texto sempre foi né como é que eu imagino que esses sistemas funcionem você tem ali numa imagem pequenininha você tem um padrão bem bem claro ali né então você não tem muita dificuldade em extrapolar esses padrões né Eu não conheço né na verdade esses essas ferramentas também para dizer para ter uma avaliação da da
da validação delas né mas eu acredito que o uso que você tá fazendo já é um uso bastante criativo né porque por vezes a gente pode tentar encontrar elementos que estão numa imagem muito pequena e nem nem uma imagem na internet vê assim por exemplo o cara tá estudando selos ou alguma coisa assim ou estudando padrões de uma moedinha né ã ou padrões muito pequenos isso daí tem sido usado também né a gente vai falar daqui a pouco acredito né para encontrar padrões em em em tabletes de de de argila antigos lá da Mesopotâmia né
para tentar decifrar aquelas aquela as aquelas inscrições as inscrições mais antigas que existem também no Wind saras vash né nesses lugares assim porque ali você consegue se você com a ferramenta de upscaling né você vai conseguir notar coisas que podem estar ou apagadas pelo tempo ou que são muito sutis ali que tem um significado inscrito dentro delas né então esse tipo de análise ela também é útil não só para quem vai trabalhar com imagens mas também com quem vai trabalhar com cultura material né que você vai conseguir identificar padrões que seriam imperceptíveis né para na
escala Dimensional do do raciocínio humano ou mesmo da nem do raciocínio humano mas da percepção visual humana mesmo né é e eu tava lembrando agora de uma situação que eu acho que PS Elin teria ajudado muito 2019 eu tinha pensado em fazer um documentário sobre a FEB eu acabei desistindo por causa da pandemia e tudo mais mas eu lembro que na época eu entrei em contato com algum arquivo lá do Rio de Janeiro Não lembro qual era enfim e eu perguntei se eles tinham fotos digitalizadas da força expedicionária brasileira t E aí eles era Na
verdade era algum órgão relacionado à FEB mesmo não sei se era Associação de veteranos enfim e aí eles me mandaram e-mail ah Estamos te mandando as imagens que a gente tem digitalizada eu pensei pô vai vir um monte de imagem com uma resolução gigante fotos digitalizadas de arquivo negócio né E o pessoal me mandou umas fotos assim tamanho 300 e poucos P por 400 e pouco P para quem trabalha com imagem sabe que isso é um tamanho minúsculo sabe é um negócio que não dá para trabalhar e era um monte de foto minúscula de do
de assim coisa que provavelmente foi digitalizado para postar em blog no começo dos anos 2000 e o pessoal ainda tava com essas imagens e tal e aí se você não tem condição financeira de ir para um arquivo tipo assim ó eu sei que tem fotos da FEB um arquivo tal no Rio de Janeiro mas eu não tenho dinheiro para ir pro Rio de Janeiro e você precisa fazer algum trabalho alguma coisa você pega a foto em baixa resolução passa pelo upscaling da inteligência e ela refaz essa imagem maior se ela não cometer erros grosseiros dependendo
do uso que você faz é uma coisa que dá para fazer pessoal que trabalha às vezes com análise de imagem de fotografia que não não tem condições às vezes de viajar para um para um arquivo público de outro país mas consegue a imagem numa resolução um pouco menor aí a up scaling pode resolver o problema né então enfim me vem essa ideia na cabeça agora ah não é uma um uso me parece bastante legítimo eu fiquei pensando também que muito Possivelmente já para usar isso com imagens fora de foco coisas do tipo assim também porque
essas ias de upscaling elas às vezes você é uma coisa que o pessoal inclusive faz é pegar uma imagem um pouco desfocada e aí a essa ia ela redesenha a imagem toda só que focando então Eh é um uso bem interessante porque aquela coisa né bom a gente vai entrar no na discussão de da questão ética de gerador de imagem mas em grande medida isso tem a ver com as polêmicas t a ver com você treinar a as ias com trabalho de outras pessoas e essas ias roubarem entre aspas o trabalho das pessoas nesse caso
não nesse caso a ia tá sendo usada como ferramenta Eu acho que isso é o grande ponto que a gente vai discutir no bloco três Ah o uso ético da ia é usar ela como ferramenta e não como uma substituição de um trabalhador né mas enfim e o GPT e os novos modelos de linguagem que são capazes de gerar muito mais do que textos devem estar em algum ponto entre os benefícios da eletrificação e os problemas que a radiação criou para quem usou indiscriminadamente com o potencial de a gente só descobrir na prática se os
usos vão ser tão benéficos quanto a eletrificação ou se podem deixar marcas como deixou a radioatividade [Aplausos] [Música] aqui eu queria falar de algumas iniciativas e possibilidades de trabalho com ia né E para começar eu queria falar de uma ferramenta já existente que é o transbus eu descobri ela porque Comentei no Twitter né eu falei um dia no twitter assim bem aleatoriamente que ah eu acho que um ótimo uso de a trabalho de historiadores seria uma ferramenta que faz o trabalho mais pesado de paleografia de documentos né de leitura de documentos com caligrafia antiga que
é difícil de entender e tal uma I que pega essa caligrafia antiga e transcreve com texto legível para quem não conhece a a caligrafia ou a linguagem da época e tal seria um um uso extremamente útil E aí me apareceram algumas pessoas falando Ah já existe tem o transcribes não sei o quê Então queria para você pedir para você explicar melhor pra gente como é que isso funciona os limites dessa ferramenta também porque ela também não é perfeita né as principais vantagens e desvantagens do transcribes e e aproveitar e perguntar Será que a gente não
deveria estar trabalhando em alternativas brasileiras para essa ferramenta se é que elas já não estão em andamento então o transbus é uma um Você lembra que existe assim lá nos anos 90 começou a surgir o ocr o ocr foi assim a primeira aplicação comercial né bem-sucedida de redes neurais artificiais né O que que é isso né Eh o ACR né o O reconhecedor óptico né começou a surgir no início dos anos 90 umas agendas assim que se você abrisse a agenda você tinha que assinar o seu nome e aquilo virava senha porque ali tinha uma
pequena rede neural que identificava o padrão da sua assinatura e aquilo se transformava né na forma de você abrir a agenda né ISO que isso evoluiu bastante né hoje a gente tem ocrs em basicamente tudo você pode colocar o CR em qualquer documento hoje em dia né só que é aí que tá do ACR ele tem diferentes níveis de validação e todo mundo que me escutou já deve ter percebido isso Às vezes a gente pega um texto que tem um ACR defeituoso a gente puxa ali para tentar copiar aquele texto e vem um monte de
caracteres espues umas coisas estranhas né e o transcribo Eh ele também sofre decimal né porque o transbus ele é uma espécie de ocr turbinada ele é um hun britan Character recognizer né um hcr tá ele ele ele é treinado para entender caligrafia humana né Eh E também algumas formas de e de de inscritas serifas e né tipografias né antigas é uma coisa que os ocr não fazem muito bem ele foi desenvolvido pela Universidade de inbook na Áustria aliás Áustria é um país muito avançado em ciência de dados né e e ele foi desenvolvido e ele
foi treinado num Corpus documental bastante vasto mas aparentemente limitado a à Europa ocidental e também a lugares onde né os os pesquisadores europeus têm interesse em pesquisar um interesse mais tradicional né na história do do do colonialismo europeu então ali ele consegue transcrever tabletes de argila sumérios Mas ele tem dificuldade de entender Fontes aí que a gente tava colocando aqui do Brasil aqui de Blumenau aqui de perto de Santa Catarina né onde onde um trabalha resíduo né e foi muito engraçado quando a gente viu isso né pô traduz textos transcreve textos em grego antigo mas
não entende o português daqui da esquina entendeu E E por que isso porque ele não foi exposto a documentações que vem daqui né e a paleografia daqui ela tem as suas particularidades também né então o TRC ele consegue entender aquelas paleografia medievais com um monte de abreviatura mas não entende uma coisa que um escrivão aí de São Paulo do Rio de Janeiro da Ilha de Santa Catarina escreveu no final do século XIX que para nós nem talvez nem seja tão difícil assim né às vezes é então assim eu tenho uma uma estudante de TCC fazendo
validação no transbus né com em diversas línguas né vendo quantos por acerta Quantos por cento erro então aí tem algumas alternativas a gente poderia tentar desenvolver uma parceria com esse pessoal em insburg né teria que juntar aí várias pessoas e fazer um projeto para eles porque ise é um sistema pago você pode usar lá 300 documentos por mês uma coisa assim mas mais do que isso você tem que pagar e quem trabalha com história serial quantitativa ou Quem tá treinando e a que n eu a gente precisa de muito mais do que isso 300 documentos
não é nada né então e complica um pouco pra gente teria que fazer uma parceria com eles ou desenvolver o nosso próprio sistema né que é uma coisa plenamente possível né porque a gente tem aí bibliotecas de computação que que que um pouco de trabalho digo bastante trabalho poderiam render né um sistema como esse né mas aí que tá tá tudo isso exige bastante financiamento né porque para treinar ia a gente precisa de bastante processamento gráfico né e aluguel de GPU essas coisas assim custa dinheiro além dos recursos computacionais os recursos humanos para isso a
gente precisa de gente que saiba fazer já fez né então é um esforço muito coletivo que a gente precisa fazer mas eu acredito que esse tipo de de de ferramenta de auxílio à pesquisa né ela precisa ser a gente precisa começar a pensar nisso né porque e por outro lado também eu fico muito triste em saber I que colegas aqui da da da ufsk e uma parceria com o pessoal lá da UFRJ pessoal que trabalha com trabal da uf perdão que trabalha com história econômica e serial fizeram um projeto mandaram pra Caps e uma das
das coisa que eles pediram era era a o subscription né a assinatura do transbus e o pessoal lá em cima disse que não ia financiar o projeto porque isso aí foge ao escopo e blá blá blá não sei o qu eu fico muito triste porque Poxa é uma coisa nova É verdade né O ideal seria que a gente desenvolvesse o nosso mas eu acho que tem as pessoas né mais poderosas no campo da história hoje ainda não entenderam que a gente tá vivendo uma espécie de mudança de paradigma né especialmente algumas áreas é claro história
cial né Econômica né ã Mas isso é assim eu achei um pouco uma cabeça um pouco pequena dos avaliadores lá da Caps né fiquei triste que os colegas não conseguiram né enquanto isso né a alternativa quando a gente não tem acesso a Fontes a a digitalização massiva de fontes primárias é a gente usar dados nativos digitais né que essa é a alternativa que eu tenho perseguido quando eu fui conversar contigo sobre a possibilidade de a gente gravar um episódio sobre esse tema e tu comentou comigo que tava trabalhando com um pessoal em um software de
processamento de linguagem natural e tal então eu quero abrir o espaço aqui para você me contar Que trabalho é esse quem são os envolvidos o que que esse software tá fazendo como é que você chegou nisso enfim fica à vontade Obrigado Wi então como eu falei a lá em 2022 Eu estava terminando um texto para uma revista americana chamada History and Theory que era para um projeto que continua rolando que é um projeto chamado futuros históricos né historical futures eu decedi ali me juntei com a com a com a com a Ana Carolina Barbosa né
e eu queria discutir Inteligência Artificial né ah você né parece uma alternativa aí para pensar os futuros históri tá daí fiz o texto e tal a gente fez o texto tava pronto e daí o que aconteceu chat GPT todo mundo começou a falar de Inteligência Artificial né porque eu cheguei nisso também porque eu cheguei lá pro meu supervisor tava em pdoc né olhei lá com o professor Sebastian conr lá em Berlim eu falei para ele Ah tem essas duas coisas que eu tô interessado antropoceno mudanças climáticas e inteligência artificial da ele me falou o seguinte
não antropoceno você vai entrar num debate consolidado Tem muita gente falando disso na Europa então monte né inteligência artificial tem bem menos gente falando sobre isso né daí eu resolvi fazer fazer isso daí comecei a escrever o artigo tava pronto e daí Todo mundo começou a falar disso deu Poxa não tem escapatória né eu vou ter que aprender realmente como é que isso acontece daí eu comecei a perceber lendo assim críticas sociais da técnica que eh muitas pessoas assim das chamadas humanidades digitais TM uma reticência grande com teoria e essa é a minha área né
teoria da história H tem reticência com teoria porque às vezes os teóricos vem com umas coisas muito interessantes mas que na prática não é o sujeito que entende programação ali ele sabe que aquilo ali não é bem assim né E daí eu queria juntar quero até hoje né juntar Teoria com com com programação né E daí eu pensei não eu vou ter que aprender isso daí né para conseguir fazer uma coisa que o pessoal das humanidades Tais veja não o bonaldo sabe o que ele tá falando ele não tá só teorizando no no vácuo né
E porque eu realmente hoje eu percebo muitas críticas da técnica parecem dessincronizados do desenvolvimento tecnológico lá repetindo que os críticos da TCA dos anos 50 da críticos da técnica dos anos 50 falaram e hoje os paradigmas são diferentes né daí eu resolvi montar esse grupo quando voltei do pós dooc né 2023 E para discutir a história e a gente começou ali com sociologia dos algoritmos ética informacional história da tecnologia né filosofia da mente né começamos a discutir isso só que daí a gente atraiu atenção ali de alguns estudantes das ciências exatas da engenharia particularmente né
porque eles têm pouca discussão teórica negócio deles é vão fazer né E E daí chegou um momento que o né um estudante falou para mim assim professor a gente vai ficar conversando sobre é muito legal mas a gente não vai fazer também alguma coisa eu pensei primeiro eu pensei Ah por que que a gente a gente vai fazer depois eu pensei não vamos fazer vamos fazer daí a gente começou a ler sobre modelos ler uns artigos de engenharia assim as coisas maluca assim a gente ficava lá meu deus o que que é isso um monte
de fórmula né mas com os estudantes da exatos a gente começou né a entender melhor né E daí eu fiz lá um um um projetinho de iniciação científica conseguir duas bolsas né E daí quem entrou para trabalhar comigo é o Igor Caetano de Souza né que é programador faz engenharia de automação e a Franciele Dias da Silva que é estudante da história que que que tá muito interessada em processamento de linguagem natural né que é uma área assim mais ligada à linguística mais de humanas né mais aplicada à história né Alé de montou esse grupo
e resolvemos começar a desenvolver com com com com texto né porque afinal de contas assim Claro hoje em dia tem historiadores trabalhando com todo tipo de fonte né mas as fontes mais tradicionais do nosso Camp né são documentos escritos bom vamos começar por aí né E essa área processamento de linguagem natural trabalha justamente com isso né Ela vem a teoria por trás dela vem da chamada hipótese distribucional que diz que o significado de uma palavra é determinado pelas palavras estão a redor dela numa sentença ou seja os o o a semântica é uma função da
sintaxe né das classes subclasses gramaticais que será com a palavra alvo né E é assim que chat GPT funciona poressa é teoria por trás a gente começou com um modelo muito mais simples Até porque para desenvolver um Transformer desses é milhões de dólares e alugando GPU e um monte de gente é muito complicado tem bilhões Miles de parâmetros é uma coisa muito maluca o Transformer né a gente começou com um modelo menor que é um um modelo de um chamado worden bading é é um modelo de vetorização de palavras ele pega as palavras atribui um
número para elas faz um ponto de dados e vetoriza então com isso a gente consegue extrair algumas informações semânticas da sintaxe que é ser a sacada né porque veja o computador ele não compreende direito as coisas não compreende nada na verdade Ten o o dos anos 80 né quando se falava que a inteligência artificial né eu ia chegar um filósofo da linguagem chamado John sou Ele propôs um experimento de pensamento chamado experimento do quarto chinês da ele disse o seguinte imagine assim olha que você está pres você está dentro de um quarto e esse quarto
tem um buraquinho de um lado e um buraquinho de outro e por esse buraquinho chegam ideogramas chineses e pelo outro buraquinho você coloca outros ideogramas chineses porque você tem um monte de ideogramas chineses ao redor de você e você tem um livro de regras que diz que ideograma você deve colocar depois com relação ao ideograma que você recebeu né E daí ele vai dizer olha com o tempo você vai ficar tão bom nisso você vai pegar o ideograma que chegou vai olhar no livro de hexs vai dizer Ah tem que botar esse aqui aí você
vai botar o outro ideograma e daí você vai ficar fazendo isso fazendo isso você vai ficar tão bom vai decorar as páginas do manual do livro de regras vai ficar tão bom nisso que suas respostas vão ser indistinguíveis das respostas que um falante de língua chinesa tá dando numa sala ao lado só que você não vai aprender nada de chinês nada zero então ele bolou esse experimento de pensamento para defender o seguinte argumento computadores entendem sintaxe mas não entenda a semântica Então é assim o chat tpt não entende nada até porque ele não é ele
não é um ser é só uma entidade né um ente né não ser é um objeto técnico né então ele não entende nada não compreende nada pelo menos não como Nós seres humanos mas ele consegue simular compreensão semântica porque ele trabalha num num paradigma sub simbólico onde você no tem um token né uma palavra com um significado programado nos anos 60 o MIT desenvolveu um chatbot assim o Elisa vocês podem procurar aí Elisa n dá para interagir com a Elisa na na na na web aí tem vários várias interfaces aí que vocês podem procurar e
a Eliza era assim você falava uma coisa para ela e ela pegava alguma alguma palavra algum toquezinho ali que você colocou e te respondia com uma mensagem que alguém escreveu e daí assim mas claro essa era era a computação simbólica o limite disso era que se você quisesse fazer um robô que fala sobre tudo você teria que programar o mundo inteiro isso é impossível e agora mas agora o o o a computação sub simbólica que usa redes neurais artificiais n também chamado de conexionista ou de paradigma estatístico o que ela faz é é que o
significado de um token ele não é programado mas ele é é determinado pela ativação de redes neurais uma camada muito mais baixa de processamento a partir dos dados que que que o modelo foi exposto então a gente começou a desenvolver esses e esses modelos de wording beding né para criar vetores vetores que nos permitem estudar palavras e suas relações dentro de clusters a gente consegue por exemplo nosso modelo é muito bom em detectar vieses em grandes bancos de dados por exemplo a gente também consegue ver a correlação de palavras a gente consegue ver quando que
uma discussão Começou quando é que ela vai meio que terminar né pela frequência pela frequência da correlação e mais outros 40 parâmetros que a gente tem e atualmente o nosso dataset ele é composto por 3.463 teses e dissertações aqui da ufsk né nós começamos primeiro nós nós nós fizemos um código de raspagem de dados o Igor né nosso programador fez um código de raspagem de dados a gente raspou os dados da da história de 2013 a 2023 foram 41 11 teses e dissertações com esse modelo menor a gente fez alguns testes foi aprendendo e depois
em fevereiro a gente entrou em contato com a ctic né com o setor de tecnologia com aval deles a gente raspou todos os dados que a gente conseguiu da Universidade ficamos assim na mão 90 5 v alguma coisa por de todas as teses e dissertações já defendidas na ufsk entre 2003 e 2024 Por que 2003 2024 porque foi a partir dessa data Inicial que a UFS começou a exigir que a tese a deação fosse depositado em formato digital como eu falei eu não tenho nem nem Fundos e nem ocr para digitalizar todas as teses eações
da da minha universidade desde lá na década de 60 né mas eu tenho né tive com condições de raspar todos esses dados então eu tô treinando ias também não só com Big Data mas com com com dados de qualidade para conseguir construir ferramentas de aplicações e recursos de de de processamento natural que vão poder ser usado por pesquisadores e no futuro por não também né criar sistemas de divulgação Científica né porque nós também estamos criando ferramentas de referenciação né que é uma crítica muito comum aos sistemas de ar que ah é difícil é opaca saída
você não sabe da onde saiu mas a gente já resolveu isso a gente tem um sistema de referenciação Então nesse caminho assim a gente desenvolveu um monte de coisas porque as ferramentas ali de processamento de linguagem natural pro portuguê elas não eram muito boas a validação delas era meio baixa daí a gente teve que desenvolver eh ferramentas melhores para tokenização para remoção de Stop Word paraem matização né para fazer um um um aprendizado de máquina que fosse eh compreensivo e adaptado à natureza do nosso dataset né então o o futuro do projeto também né ele
ele envolve né trabalhar com muito mais dados do que um ser humano consegue ler no espaço de uma vida Construir sistemas responsáveis né éticos que sejam realmente alimentadas não com bobagem que meu pai falou no Twitter né que não diz aquele seriado né o discurso de ódio essas coisas todas né mas com dados científicos humanistas artísticos né produzidos na universidade não que não tenha vida inteligente fora da Universidade Não de jeito nenhum mas eu acho que a nossa missão também é trazer né O que que existe melhor na produção aqui para dentro né e eu
acredito muito no no papel da ciência das humanidades né na na com uma uma voz importante aí no no espaço público e bom e você falou bastante ali com relação às limitações financeiras a falta de investimento que realmente é um um gargalo pra produção científica no Brasil e e tudo mais e o estado da arte junto com a falta de financiamento eles criam Barreiras com relação ao que a gente consegue fazer até onde a gente consegue ir né você já falou um pouco disso minha pergunta é a seguinte que outras possibilidades você vê pro pro
futuro do uso da das ias para essências humanas especialmente no caso da história que você acha que são plausíveis o que que que futuro próximo você vê de usos para essas ferramentas aí aqui eu tô pensando assim ó imagina que se você pode especular sem os limites orçamentários que a gente tem no momento imagina que ó o governo tá tá investindo nisso não sei o que temos carta branca para experimentar o que que você acha que a gente tem de possibilidades no futuro pelo menos a Médio prazo Olha eu acho que essa discussão sobre o
que pode acontecer no futuro né ela também envolve não só as possibilidades mas também os riscos né Eu acho que isso a gente vai vai terminar falando sobre isso né mas com relação a à pesquisa ao ensino né bom o que que a gente tem no horizonte né digitalização de documentos históricos massivos né com uso de de de de reconhecedores de de de de escrita manuscrita né de caracteres manuscritos né a gente tem capacidade já isso já já existe né tô falando de coisas que já existem mas que poderiam ser ampliadas no nosso no nosso
no nosso ambiente acadêmico né e profissional né isso é uma coisa né transcrição de documentos a outra coisa também é organização de servidores para pesquisadores isso é uma coisa que a gente precisa muito porque a gente por exemplo a gente tá sediando nossos dados aí em repositórios das Big Tex Eu não queria fazer isso mas eu não tenho dinheiro para ter um servidor né não tenho né a gente precisa construir isso né E não é só para quem tá trabalhando com programação com humanidades digitais mas é pra gente ter bancos de dados né que sejam
acessíveis tudo muito fragmentado né ainda né a gente precisava ter um que que unisse todos isso seria muito legal ah outra coisa que a gente pode ter também a gente já tem né embora não funcione tão bem H pras publicações e feitas em língua portuguesa isso a gente poderia desenvolver nossos sistemas também são esses essas Iá que fazem levantamento bibliográfico né como o research Rabbit por exemplo que eu sempre recomendo também que você coloca n research Rabbit assim o doi de um de um artigo e ele vai lá e te dá Todo o estado da
arte entendeu você coloca lá qualquer assunto tem um doi da você vai ver quem é que o artigo citou então você vê a discussão que veio antes e quem é que citou o artigo você vê a discussão que veio depois te dá recomendações de leitura então assim se você tá trabalhando numa área muito nichada né Você vai ter ali 10 15 20 artigos para ler né Isso facilita muito aí quem tá fazendo TCC e tal eu vi que agora começou a funcionar um pouco melhor para publicações emem línguas que não são o inglês né né
mas isso é uma coisa que também já tá no já tá no nosso Horizonte né O que mais também a gente pode começar a pensar agora com assim pensando alguma coisa mais um escopo mais pedagógico também né Essa como eu falei do projeto das imagens Lá a gente pode começar pensar assim em em produção de vídeos artificiais né que envolvem Como era a cidade onde você tá dando aula no século XIX né juntar todas essas esse arquivo iconográfico e Trein uma ia com que que produz não só imagem mas também vídeo e fazer umas interfaces
assim eu acho que isso tá muito próximo de acontecer também porque a tecnologia já existe tentando de extrapolar aquilo que é aquilo que já existe tecnologicamente Depois eu quero falar dos riscos também que eu acho que são muitos também né H Então eu acho que também já respondendo um pouco a questão eu acho que o espírito da coisa é a gente usando isso e vendo utilidades para elas né e e e tentar ser criativo né com com essas I né você já encontrou um um jeito aí de usar o upscale Já Foi útil para você
tem gente que faz um monte de coisa com chá de GPT eu uso aí várias ias para fazer análise de dados para gerar gráficos visualizações trabalho com programação também mas eu também crio muito muitas visualizações com ias né visualizações de dados meus coloco lá meus vetores Faço umas análises e construo funções né para tirar o tipo de informação que eu quero do do das Ferramentas e tal né então eu acho que o espírito é um pouco esse assim experimentação pra gente ver o que que a gente pode fazer com essas ferramentas que seja um ú
um uso responsável uso ético da coisa nós já estamos vivendo sob uma curadoria de conteúdo feita por Inteligência Artificial curadoria essa que prefere entregar conteúdo falso indignante e polarizador como que tem incentivado ataques em escolas ou que levou um bando de brasileiros à Brasília em 8 de julho [Música] bom aqui a gente entra nos debates éticos sobre o uso de a que tem sido um dos gargalos em relação a ao uso dessas ferramentas tem esse gargalo financeiro de investimento e tal tem o gargalo da falta de conhecimento técnico de Muitos historiadores e tal e ter
o gargalo da das discussões éticas né que que é um dos mais importantes e como os ouvintes H vão perceber na nossa conversa essas questões éticas de uso de a elas quase sempre giram em torno do Mundo do Trabalho ao menos se a gente focar nesse recorte de pensar a relação das ias com a história como disciplina e profissão né então para começar eu queria pedir para você comentar sobre os problemas e questões de caráter ético que envolvem o uso de a generativas de texto na historiografia no ensino enfim Pois é essa é uma questão
muito importante né sabe que lá no relatório no System Card do GPT 3.5 lá em 2020 já antes de ser lançada público a Open a já dizia assim olha riscos potenciais associados ao chat PT que nem tinha sido lançado pro público ainda né escrita fraudulenta de ensaios acadêmicos né engenharia de pretexto social que é por exemplo você pega o você pegar o chat de GPT conseguir dar um jailbreaker nele tirar ele lá do sistema aconteceu algumas vezes acho que uma ou duas foram divulgadas né e jogar ele na internet né liberou o monstrinho e tá
terr isando povoado pode fazer muita muito estago aquilo ali né porque na verdade a gente trata o chat GPT como um chat mas ele é bem mais que isso né Ele é bem mais chate é é a interface então existem também assim suspeitas já foram levantadas eu não tenho como provar isso eu deixo como uma hipótese pra gente pensando né que a gente trata o chat PT como um chat mas na verdade ele pode ser pode ser uma ferramenta de acumulação primitiva de dados né que é uma expressão que tem sido utilizada aí no Campo
da crítica social da técnica que que significa é isso depois eu vou dar umas indicações de leitura para quem quiser se aprofundar mais né mas o que as Big tchs fazem hoje em dia né Lembrando que aí que é a Open é só uma Startup que hoje tá numa Joy venture virtualmente controlada pela Microsoft que assumiu todas as dívidas que eles fizeram mas comprou a ideia porque tá dando Milhões de Dólares né o chpt é de graça né quando é de graça sabe que eles estão tirando alguma coisa dali que que eles estão tirando dados
eles não t condições de armazenar tudo que você tá dizendo não tem um dat set tão grande no mundo né mas eles pegam alguma coisa eles pegam né então algumas informações do seu comportamento das questões que você mais se interessa né porque aí que tá essa é a questão lá dos vetores da informação né o indivíduo não interessa muito o indivíduo é a posição que você ocupa dentro de um cluster de interesses Então você vai tá ali você é um ponto de dados num gráfico e isso daí vai determinar padrões de consumo padrões de comportamento
político isso vai alimentar todo um ecossistema ali político de consumo né do chamado capitalismo de vigilância né ou do colonialismo digital tem várias expressões aí que competem né para entender a condição histórica atual isso daí é uma questão assim muito problemática né porque a gente parece que a gente tá aprendendo com o chat tpt mas o chat chpt que tá aprendendo com a gente né só que na verdade o chat GPT não é um ser não tem consciência não tem intencionalidade tá lá preso no quarto chinês tá fingindo que saiu do quarto chinês né mas
tá preso lá dentro mas agora as Big Tex não as Big Tex tem responsabilidade tem intencionalidade então a questão é a seguinte Olha o chat PT pode fraudar um texto chat PT pode pode escrever uma bobagem porque alucinou mas a responsabilidade disso acaba sendo nossa se a gente pegar e publicar aquilo né então eu não vejo como uso errado você pegar lá o um texto que você escreveu e tal e pedir para ele corrigir o português ou pedir para deixar sua escrita menos confusa né aquele é o seu texto né E no final você tem
o Final Cut do seu próprio texto não gostou do jeito que o chat ter fez o seu texto refez ele ou arrumou a gramática ou deixou aquela frase muito longa menor e tal isso é muito bacana assim pra gente quando tá escrevendo aí um trabalho acadêmico fazer um trabalho pr pra faculdade ou mestrado doutorado ou quer que seja um artigo Às vezes a gente né fica travado o que que eu vou né O que que eu vou fazer agora tá muito confuso esse texto aqui pô joga ali discute com com com o robô né Isso
é um uso legítimo mas isso se torna um problema né na medida em que você começa a incorporar coisas que ele falou e que você não tinha pensado né ou seja até um problema do ponto de V do raciocínio lógico Pode parecer convincente Mas é uma fraude né então ã Esse é o primeiro problema né a escrita fudul lenta de de de artigos acadêmicos a a segunda né diz respeito à falta de referenciação desse sistema isso tem sido começou a ser contornado né se gemine já faz isso o o o GPT para quem assina não
sei agora porque o 4. Zero eles estavam liberando para todo mundo não sei como é que vai ficar mas ele faz buscas na internet e ele te dá referências acontece acontece que essas referências que ele dá em geral são muito superficiais né E quando elas são específicas eu não tenho algumas coisas bem estranhas eu vi que eu pedi uma informação mais específica para ele ele me deu uma referência e era uma tese de de de doutorado que tinha sido defendido no Brasil mas estava sediado de deu uma pesquisada nisso estava sediado numa numa empresa em
Portugal que tava vendendo esses dados para Open ai e eu fico pensando né Será que isso é ético quer dizer a pessoa que fez a tese de do aado dela tá tendo seus dados vendidos assim acumulados por uma Joy venture em Portugal que revende isso lá pro pessoal na Califórnia Poxa isso é ético eu não sei né Eu acho que não eu acho que a pessoa que escreveu a sua tese deveria ter né ã por outro lado é uma zona cinzenta porque tese de dissertações do Brasil é tudo Open access né o de acesso aberto
e tal mas é no mínimo estranho né Ou seja a pessoa tá capitalizando em cima tá ganhando dinheiro em cima da da nossa produção né Então esse é um um outro problema né Ou seja que não é de agora da ia mas tem sido potencializado por ela né vai saber se a sua seu trabalho de de doutorado não tá sendo copiado lá em fala lura e traduzido uma língua que você não sabe né porque esses esses geradores de texto eles falam qualquer língua porque na verdade eles não falo nenhuma eles estão ali é tudo matemática
né então eles estão né o chat GPT o GPT 4 ele aprendeu Pavel sozinho né a língua literária do império per sassani lá aprendeu sozinho é o pessoal lá do do Cazaquistão não do do Paquistão e da da Índia lá que os caras são muito bons de computação né os empregados do Google eles perceberam né do da Open Eye perdão perceberam não pera aí tá falando pavil que loucura porque ele foi exposto a esses dados L Leu as 1 Uma Noites e começou a falar então quer dizer eles podem traduzir para qualquer língua né Isso
é um problema ético muito grande né para para direitos autorais e tudo mais mas isso não significa né que o GPT ou Bar ou ou Gemini ou ou Bing que é um api do GPT né esteja ali copiando e colando texto da internet isso acontece quando você pede para ele buscar referências no entanto porque quando ele tá gerando texto ele tá ali tudo estatística né tá ali gerando gerando gerando gerando gerando Ah mas pode ficar parecido pode pode ficar parecido se né a estatística funcionar do jeito que não deveria mas a Rigor tá recompondo o
texto no nível sub simbólico com sub tokenização não é nenhuma palavra que é um toque é metade de uma palavra no caso do arquitetura Transformer né e ele tá reconstruindo isso nesses conjuntos de embeddings né esses conjuntos de palavras assim que são vetores 0,9998 né e o mais próximo e e e a transição entre eles né ele tá construindo isso mas se você pede para ele fazer fazer referência muitas vezes ele copia direto assim eu vi vejo isso da Wikipédia Por exemplo agora eles começaram a colocar aspas né começaram estão estão melhorando isso e tal
mas também é um problema né que pode entrar em em em na questão dos direitos autorais né e bom que mais e problema de ag generativa de texto né você pode construir documentos falsos você pode construir a falsificar artigos mudar uma coisinha aqui uma coisinha ali né assim eh golpes de todo tipo né tudo isso tá Tá previsto pela própria empresa que criou esse essa ess essa ferramenta né E então a o impacto da da da da zagem generativa de texto em questões ético-políticas né Ela é bastante grande a gente tá começando a ver isso
e um outro problema né Eh disso é que é o seguinte olha toda a i enquanto ela for um Paradigma estatístico e enquanto ela enquanto ela funcionar da seguinte maneira né Você tem um algoritmo que foi exposto uma quantidade massiva de dados uma arquitetura algoritmo no caso do GPT né o Transformer né E daí a partir desses dados você estabelecem os hiper parâmetros os parâmetros E daí daí depois do aprendizado supervisionado aprendizado de reforço e tudo mais né daí você faz uma pergunta pro modelo daí o modelo vai dar uma volta né nos dados de
treinamento e vai te devolver aquilo que é mais representativo no dataset em função da pergunta que você fez aquilo que é mais representativo que que isso significa significa que visões que Clamam pro representatividade né visões que ainda estão lutando para serem representadas numa certa discussão né Elas tendem a ser anuladas né Isso é um problema ético isso foi levantado por luí Amour no num num livro chamado the Cloud Cloud ethics né a ética das nuvens onde ela diz isso olha o problema da ia não é só que ela simplifica o mundo mas o problema da
ia é que ela ela tende a a abafar né visões que não são mas mais representativas de um cão claro que se você fizer outras perguntas lá pro chat tpt né ele vai começar não mas tem essa visão aqui tem aquela outra tem aquela lá mas o problema também é que quanto mais específico vai ficando wiles mais chance de ele alucinar por exemplo é meu irmão era acó né Alexandre bonal e eu perguntei lá pediu para fazer um teste lá eu fiz um teste lá para uma vez pro GPT e perguntei Ah você conhece Alexandre
bonaldo eu dis eu conheço sei lá é um zoólogo né aracnólogo trabalha no museu Gil de publicou isso e aquilo e daí eu pergi meu irmão falou ah pergunta quais as espécies de aranha que que eu identifiquei daí eu perguntei ele me deu uma lista assim eu fiquei satisfeito não entendo nada disso daí eu mandei pro meu irmão daí ele disse assim Rodrigo essas espécies nem existem então quer dizer qual é o problema ali ele alucinou quanto mais específica a pergunta mais ele alucina por isso que eu falei ensina alguma coisa antes para ele porque
quando chegar no específico você perguntar lá ah me fala aí da obra do do kozelek ele vai te dizer lá espaço experiência Horizonte de expectativa aquilo mais básico né agora se você perguntar coisas bem específicas né Qual é a definição de mudança semântica coa daí ele vai dizer outra coisa ele vai dar uma alucinada Então é isso quanto mais específico e se quanto mais específico quanto mais nichada é uma um uma informação que você quer isso também significa que visões que não são as mais majoritárias vão ser representadas de maneira errada eh por exemplo Uma
vez eu tava lá discutindo com o GPT Eu ia dar uma aula sobre os anal na primeira fase eu tava lá discutindo Ah como é que né discutindo estratégias pedagógicas eu falei que eu queria falar sobre as mulheres nos anal na primeira geração tem várias a Luci Vargas é mais famosa né mas tem outras ali um texto da Natalie zim Davis lá que ela fala de todas né daí eu perguntei para ela tá mas tem mulheres na na primeira geração dos zá ela falou claro que tem é muito importante mulheres na ciências humanas todo esse
aprendizado de reforço que tem para ele ser ser ass inclusivo né fala de diversidade muito engraçado aquela coisa californian e da liberalismo californiano e daí não que legal não muito legal mulheres das ciências humanas Tá mas tem um qual qual que tinha né que mulher que tinha nos anal na primeira geração falou Fernando brodel eu falou Fernando brodel primeiro lugar não é da primeira geração e não é mulher né e ele ficou lá alucinando alucinando em cima falando do brodel como se fosse uma mulher ou seja ele não tinha informação sobre uma coisa mais específica
e sabia falar sobre os análises sabia que era Mark Block sabia topologia da história mas não sabia falar das mulheres que trabal trabalhavam com eles lá né que eram muitas não apenas secretárias deles historiadoras importantes lá que ficaram que começaram a ser né resgatadas mais mais recentemente e tal né e e ele não sabia então quer dizer esse também é um outro risco ético dos geradores de texto simplificar a realidade mas não apenas simplificar muito uma questão mas também não conseguir representar posições minoritárias o que pode ser um um benefício no caso assim de negacionismo
e de tudo mais né que que esses modelos que a gente a gente tem eh interação eles geralmente não vão por esse lado embora o willon musk tenha prometido um robô politicamente incorreto né que a gente sabe que ele vai fazer um robô de direito mas depois a gente fala disso H né esses modelos end não né você pergunta simples El não vai te sair dando informação negacionista não sei que você dê uma série de promos ali Tent manipular manipular o processo processamento dele mas ao mesmo tempo também posições né muito minoritárias eles vão tentar
de de minorias sociais ou minorias sociológicas melhor dizendo né aquelas minorias que não são minorias de verdade né só são pouco representadas tem pouca representatividade elas vão tentar vão tender a ser anuladas isso é um grande problema né um grande problema porque isso nos lembra muito do projeto político da modernidade né no qual aá tá fazendo uma previsão nem nem GPT não é um modelo preditivo não serve para prever o futuro mas toda aa é preditiva tá prevendo o próximo Tok ele vai fazer essa previsão e não vai incluir posições que não são aquelas mais
hegemônicas né numa resposta E isso também é um outro problema ético da da i eu diria que é um dos maiores né então o o o o problema ético da ia hoje em dia né e eu fico muito feliz de ver a mudança de de de assim de percepção Popular né que até um tempo atrás O pessoal tava falando muito na coisa da singularidade tecnológica não sei se os as pessoas estão escutando já ouviram falar disso mas é aquela hipótese né exterminadora do Futuro né chegar um momento que uma ia muito inteligente vai criar outra
EA mais inteligente ainda que vai criar outra EA mais inteligente ainda Isso vai acontecer em um segundo né porque é tudo muito rápido e vamos chegar na chamada Inteligência Artificial geral que é uma inteligência artificial tão inteligente qura a gente e vamos chegar numa inteligência mais inteligente que é humana e quando chegar isso daí a ela vai nos vai nos escravizar vai nos dominar né aquela coisa terminador do Futuro que é um tropo da ficção científica muito antigo né H mas que foi formalizado matematicamente por um um um um cara chamado Werner 20 em uma
conferência da Nasa em 1993 que basicamente o argumento dele é mais complexo que isso mas era basicamente Ele tava dizendo que a sociedade Avança como uma PA e a e a tecnologia Avança como uma PG e vai chegar um momento que é momento de singularidade onde vai surgir o maa super inteligente né E tem os caras aí o Val harari willon musk pessoal lá do institute for the future of Life e tal eles ficam tentando nos assustar com essas coisas aí eu acho assim olha ponto de vista político cultural é para se levar a sério
porque tem caras aí muito Poderosas querem nos convencer de que isso aí vai acontecer mas do ponto de vista assim de aprendizado de máquina eu acho uma tremenda uma bobagem porque o chat GPT PR vocês terem uma ideia o 3.0 não é o 3.5 o 3.0 ele precisou de 11 trilhões de tokens palavras né 11 trilhões para aprender a falar 11 trilhões tá aí duas coisas né a ia realmente consegue ler muito mais do que a gente no espaço de uma vida mas isso não é informação mais importante a informação mais importante é o aprendizado
de máquina é muito menos eficiente do que o aprendizado humano porque ninguém precisou você não precisou eu não precisei ninguém que nos escuta precisou de 11 trilhões de palavras para aprender a falar né Ou seja a máquina é burra burra para burro burra para burro né E E por quê Porque reconhecimento de padrões processamento de informação por reconhecimento de padrões não tem nada que ver com com com com a maneira como a gente pensa no pensamento humano é uma coisa diferente uma coisa totalmente diferente e eu fico muito feliz e muito satisfeito de começar a
ver a discussão crescer né sair disso daí da da da singularidade tecnológica e ir pro problema do alinhamento cultural que é o grande problema ético da o alinhamento cultural do sistemas porque aí a gente tem fenômenos do tipo racismo algorítmico né a gente tem gente aí do do da p a gente fala de imagens né Eh Teve teve pessoas que foram presas aí por conta de software de reconhecimento visual né ai Vision né na Inglaterra porque eram pessoas assim de origem né da Síria e tal né e o algoritmo falal reconheceu que eram criminosas né
então tem documentário no Netflix sobre isso né quer dizer Esse é um grande problema então eu acredito que eh do ponto de vista ético né Essa mudança da preocupação de um cenário de ficção científica que o willon musk quer nos convencer de que é real né é a passagem disso pro problema da ética informacional né o problema do alinhamento cultural dos bancos de dados que é uma coisa que eu tô tentando explorar também com com a Ea que estamos estamos desenvolvendo porque ela é muito boa para para capturar esses vieses né isso eu acho eu
vejo com com uma coisa muito positiva né acho que a gente tem que atentar muito mais para isso do que para baboseira de de ficção científica se você quiser colaborar com oor FM você pode fazer isso Mob of just about Everything Going uping inflation wees so to Help US we in a reverse auction which is apparently Aim Premium wireless 20 20m.com via pix usando a chave leitura obrigahistória @gmail.com e assim você colabora para manter esse projeto Educacional gratuito no ar e agora eu queria perguntar essas questões éticas mais focadas na questão das ias geradoras de
imagem porque elas são as que mais geram debates públicos e Protestos movimentos de boicote esforços de regulação as vias generativas de imagens são as que mais levantam essas questões né E então queria te perguntar Quais são os problemas éticos do uso dessas ferramentas e que problemas elas podem trazer pra historiografia pra pesquisa pro Ensino sim de fato as ias generativas de má Elas têm chamado bastante atenção né porque algumas são muito surpreendentes Eu lembro que H um ano atrás mais ou menos começou essas Trends né no do Mion e apareceu o Papa vestindo umas roupas
estranhas apareceu o Obama fazendo sei lá o quê né e e bom aí a gente tem várias implicações éticas né como você já já já adiantou né eh como é que esses esses modelos de fusores São treinados eles a invés de jogar monte de texto Como fizeram com o GPT né trilhões de tokens eles jogam trilhões de tokens que são na verdade pixels né de imagens que eles jogam ali e e eu acho que o uma questão importante de ser ressaltada é que assim como o GPT não tá copiando e colando texto da internet a
não serem em em momentos muito específicos como você quando você faz pede para ele buscar referência daí isso pode acontecer Porque daí a gente tá em face de um de um componente simbólico e não do componente sub simbólico da mesma forma que o GPT não tá em geral e copiando e colando o texto o Midon e o dauli eles não vão fazer isso também eles estão recompondo padrões a partir da da decomposição de uma imagem em pixels ou em meio Pixel né uma sub tocan eação e estão te devolvendo em função de um prompt Então
quando você coloca assim ã eu quero um relógio no estilo do Salvador da li vai aparecer uma imagem muito parecida né então de fato a discussão não é se você tá copiando a imagem IPS literes mas sim se você tá copiando o estilo de alguém e é muito engraçado brincando com isso eu pedia para fazer umas misturas muito malucas a mistura né no sentido no no no no René magrid com and warel só que como se fosse um filme do las Von trier ele faz assim uma pintura feita pelo las Von trier faz umas coisas
que faz N um sentido assim né uma pessoa que nem é a pintora né então dá para misturar várias coisas assim com aquilo ali e e o que tem acontecido também eu tenho visto esse uso né é que E essas críticas né que tem tem artistas que são mais e reticentes né porque o que tem uma visão mais romântica da arte assim como visão assim que na história a gente de assim benjaminiana coisa da aura ã ou porque na verdade estão receosos né com os direitos autorais propriamente daí resistem a isso mas tem outros artistas
são artistas digitais há muito tempo né E que tem incorporado essa o o esses geradores de de imagem como mais uma ferramenta que eles usam no seu trabalho então eles pegam aquilo geram a imagem daí modificam ela pintam em cima né E porque até um tempo atrás O problema desses geradores é que você não conseguia mudar nada na imagem Então tinha várias imprecisões er nisso as pessoas apareciam com muitos dentes muitos dedos né o mesmo problema assim uma espécie de Alucinação só que visual mas agora agora eles estão vindo com componentes que de IMP Painting
né que eles chamam IMP Painting né Adobe tava investindo nisso também agora o miding também não D ali não sei né que é assim por exemplo e você quer você gostou da imagem que você criou mas você não gostou desse ponto dela você vai lá e pede para fazer aquele ponto de novo e assim eu eu acabei assim eu não sou artista não tenho nenhuma pretensão com isso mas brincando com as imagens né esse com com no meu grupo ali fazendo esses experimentos eu aprendi a ter muito respeito pelos artistas de digitais sabe porque para
você fazer uma imagem assim do jeito que o pessoal tá fazendo assim perfeita que parece né muito real e tal demora muito tempo você fica meses ali trabalhando aquele promp porque se tiver informação deais o robô se confunde se tiver informação de menos não vai ser aquilo que você quer e tal né E também porque depois de pegar isso os caras vão lá e manipulam ainda com muitas outras coisas né Como sempre fizeram né os artistas digitais né eles pegam as imagens e e jogam mas eu acho que a discussão A gente vai voltar isso
né a discussão de regulamentação a gente não vai conseguir avançar muito nela dizendo que o o midone ou dauli ou o stable diffusion tá plagiando alguém porque daí as empresas vão dizer o seguinte não mas não é assim que funciona e de fato não é assim que funciona eu acho que a gente tem que que começar a discutir isso do ponto de vista sub simbólico porque ele não tá copiando e colando minha imagem da da internet mas ele tá refazendo ela num nível ali que seja subatômico né sub pixelar né e e mas isso não
significa que não tem essa implicação dos estilos né eu só só meu adendo que é dizer que apesar disso eu tenho respeito por artistas digitais que conseguem em cima dessas trabalhar com essas ferramentas como mais uma ferramenta e e incorporar o seu estilo ali né em cima em cima delas mas é claro que ainda existem muitos outros riscos né né e a gente está falando de coisas muito específicas né ah mas acredito que a gente vai vai discutir isso no próximo tópico né sobre falsificação e negacion é porque no caso essas ferramentas de de geração
de imagem querendo ou não o o que elas fazem tá bebendo de estilos de outro outros artistas a ponto de que os resultados estão ficando bons o suficiente muitas vezes nem sempre para que trabalhadores sejam substituídos né o que eu tinha falado é você sair da esfera do uso da da ia como ferramenta e passar usar ela como uma substituta de trabalhadores porque aí tem um todo implicações trabalhistas econômicas sociais enfim E aproveitando o gancho eu queria te perguntar sobre essa questão da geração de conteúdo pu Iá E sendo usada para negacionismos e para falsificação
histórica porque afinal de contas as I generativas de imagem elas estão cada vez mais refinadas né algumas atualmente estão até fazendo vídeos que parecem realistas O que é uma coisa que que é absurdo porque há pouco tempo atrás O que sen tinha de vídeo de a era sei lá aqueles vídeos bizarros da i tentando fazer um vídeo do smif comendo macarrão aquele negócio e hoje em dia você tem umas coisas impressionantes e tal e alguns dias Inclusive eu li que na Índia eles estão tendo um problema sério com Deep fake sendo usado para manipular eleições
com casos até de políticos já morreram aparecendo em vídeo Para apoiar um candidato já me apareceu muita imagem de a referente ao massacre que tá ocorrendo em Gaza desse momento e algumas relacionadas à guerra na Ucrânia Então nada impede que em algum momento sejam fabricadas imagens sobre o passado para manipular ou negar eventos históricos né um exemplo mais inocente mas que eu presenciei há algumas semanas eu tava no Facebook não sei nem porque que eu entro naquilo ainda mas apareceu uma postagem que era uma imagem claramente feita por Iá de um samurai negro com uma
mulher e vestida com trajes japoneses negra com traços japoneses também e uma criança negra um castelo ao fundo e a foto feita para parecer uma foto tipo século XIX com tom de séia e tal e ela acompanhava um texto sobre o iasc que era um escravizado acho que tip se eu não me engano ou moçambicano não lembro que foi levado pro Japão aí fez parte do da corte do od Dan Naga existe um debate se ele teria sido ou não um samurai isso voltou à tona porque vai sair no fim do ano aí um Assassin's
Creed o jogo com o yask como um dos protagonistas né e eu fui ver os comentários e tinha gente achando que aquela foto era real sabe perguntando Ah não era o cara era assim mesmo tal Gente pelo amor de Deus yas que vive no século X 1 a fotografia inventada do século XIX então paraa gente que é Historiador e para pessoas é com Cabedal cultural mínimo é fácil saber que aquilo aí Ah mas para parte do público não é e como eu disse é uma aqui esse caso da da imagem do yasker falsa é uma
falsificação digamos assim que não tem grandes implicações sociais é mais inocente entre aspas mas com a mesma ferramenta que você gera uma imagem como essa para ilustrar um post Facebook você pode gerar uma imagem de falsificação histórica Então eu queria pedir para você comentar sobre os perigos né do do negacionismo e da falsificação histórica a partir de inteligência artificial é e acho que essa uma das grandes questões né eu fico pensando que essa eleição americana agora como foi a eleição na Índia e tal vai ser um pouco um esquenta para ver o que que vai
acontecer no Brasil né porque o uso de robôs na internet assim ele já é presente aem algumas eleições né mas eram uns robôs assim bem burrinhos né você reconhecia e tal né podia enganar muita gente mas agora imagina você antes de chegar na questão das imagens imagina se na próxima eleição a gente tiver Transformers você sech gpts da vida interagindo com pessoas fazendo militância online porque assim eu eu posso tentar fazer isso mas eu só sou uma pessoa fazer militância online né e eu também não vou ter muita paciência de conversar com negacionistas e pessoas
vou ficar brav o robô não robô vai ficar lá né tentando convencer a pessoa simulando empatia né vai ser milhões isso é um grande problema né para começar com o texto né você ter assim milhares desses robôs na na internet interagindo com um monte de gente ao mesmo tempo e compartilhando no conteúdo e tal e isso é algo que tá no nosso Horizonte isso já existe e eu tenho certeza que tem gente inclusive gente tá nos escutando que já deve estar fazendo isso né porque enfim porque não fariam né não existe regulamentação ainda então a
selva né é aquilo que eu falei joga o chat GPT na internet para aterrorizar o tirar o monstrinho da jaula e aterrorizar o povoado com implicações políticas evidentes né sobre a IAG generativa de imagens Olha eu acho que a fotografia é só o início né a gente tem a questão do Deep fake né que são nos vídeos né é tecnologia muito parecida na verdade né e sim isso já foi apresentado a nós nas últimas eleições né ainda era um pouco Tosco mas hoje o Maia consegue por exemplo se consegue facilmente pegar um vídeo seu né
e trocar a a linguagem que as palavras que você tá usando inclusive se você quiser falar em japonês a gente coloca você falando em japonês perfeito e mais do que isso a sua boca vai mexer como se você tivesse falando japonês que que isso significa eu também posso fazer isso com português e posso fazer você dizendo barbaridades né e jogar nas redes sociais o wile dizendo barbaridades ou bonaldo dizendo barbaridades né E se podem fazer isso com a gente podem fazer isso com políticos e já estão fazendo é por isso que né a gente vê
aí o o Xandão né tão preocupado com a regulamentação das inteligências artificiais porque não é assim ó vamos regulamentar as redes sociais Sim essa é a discussão mas agora seguinte que que são as redes sociais são arquiteturas algorítmicas entendeu o Facebook é um algoritmo inventado lá pelo pelo Waldo né o Eduardo lá né o cara que era colega do zberg né e o o o Instagram é isso aí né é esse algoritmo aí do tradicional e mais o algoritmo tiktok aquele que você treina você né Você vai lá dizendo que você gosta você vai marcando
vai salvando vai te recomendando mais daquilo são arquiteturas de a essas empresas de de de de redes sociais né o Face a meta o Facebook Microsoft a IBM a Amazon né Aí é essas os gafam né e Google Apple Facebook Amazon Microsoft BM né as Big Tex né Elas são empresas de ia é isso que elas fazem né Elas capturam nossos dados elas treinam esses modelos depois elas treinam a gente né a gostar de coisas ou descobrir o que a gente gosta tentar manipular o nosso nossas práticas de consumo e tentar manipular nessas práticas de
de de de de políticas né você tentam mapear isso e e e tentar não seduzir jogando com o nosso desejo o tempo inteiro fazendo as pessoas brigarem né construindo essas bolhas e tal e e que o Deep fake né Essa se a gente não tiver regulamentação isso aí vai dominar as próximas as próximas eleições porque assim você pode me dizer olha a gente precisa ter uma educação digital melhor PR as pessoas entenderem a realidade da diferença Sim ok Mas isso também não é muito realista né esses dias eu vi um vídeo assim muito tosco de
um avião batendo num guindaste dando marcha ré e indo para outro lado eu fui olhar os comentários est um cara assim dizendo isso é fake Pelo amor de Deus né quem é que não sabe que isso é fake quer dizer mas agora pensa assim né minha avó minha mãe e tal meu meu pai não tem a menor ideia fica lá recebendo essas coisas o tempo inteiro em Corrente de WhatsApp né Olha nem precisa ser muito bom para eles caírem nso Daí até porque é aquela coisa o o o o Fake News tem muito a ver
com o desejo a pessoa quer acreditar numa coisa daí ela encontrou aquilo no qual ela acreditava Não interessa se é falso não não vai questionar mais e agora cada vez mais esse limite entre entre realidade e e falsidade não vou nem dizer ficção porque eu acho que ficção não é Falsidade ficção ela ela digamos assim verdade poética né é outra coisa tem outra categoria para mim mas eu tô dizendo mentira mesmo né mentira é disseminada dessa maneira né ela tá muito presente por isso que a gente precisa regulamentar Esse sistema de alguma maneira entendeu E
isso nos leva também a Claro os mundos do trabalho né eu quero voltar a isso para falar do Nossa da nossa profissão mas mais adiante né porque eu acho que nós também estamos estamos em risco né não é só o o tradutor né não é só o o o dublador né os dubladores estão apavorados com essa coisa que que eu falei né da da da dublagem e tal né e com razão né não é só o escritor freelancer que precisa escrever muitos textos e e é um problemão né porque um outro dilema da ia que
eu não falei né e da simplificação da realidade é que é ia de texto por exemplo ela é treinada com muitos textos tir da internet e nesse momento não sei como é que você chegaram nesse cálculo mas eu esse cálculo esses dias assim a aí a a internet tá sendo inundado com textos escritos por por por Iá né cerca de 30% 40% dos textos novos são tudos escritos por Iá né você entra no site você vê na hora assim tudo muito tosco e e que elas são treinadas com E então quer dizer com com texto
quer dizer eles vão começar a treinar a eles mesmos começam texto a gente vai est numa espiral de emburrecimento né vão mandar as pessoas embora os roteiristas embora e vão treinar desse jeito a gente viu a greve dos eh do dos trabalhadores lá dos roteiristas de Hollywood né Pens ah os caras são ricos não são ricos não cara os caras são trabalhadores entendeu a maioria lá no não ganha muito bem Entendeu né Não é tão ruim quanto a situação aqui no Brasil mas né um mercado que existe lá né eles fizeram uma greve lá uma
greve heróica de meses né e a gente viu agora a regulamentação agora saindo na União Europeia e uma das coisas que a União Europeia falou é ó na educação vocês não vão mexer não vai entrar ia na educação e aqui no Brasil não entra só ia na na educação mas entra também na vigilância né você vê aí o governo Tarcisio aí tava fazendo negócios aí para para trazer esses esses esses mecanismos de reconhecimento facial né que andaram praticando que a gente vem chamado de racismo algorítmico né ou racialização algorítmica Ah vamos vamos colocar isso agora
no Brasil agora quer dizer e e tudo que é com domínio aqui pelo menos na minha cidade tudo já tem essa porcaria desse reconhecimento facial tem todosos nossos dados todas nossas faces nos reconhece na hora é um grande mecanismo de vigilância né E ao mesmo tempo também pode usar Nossa Face para fazer Deep fake por aí entendeu né não a minha porque eu como indivídu como eu falei não interessa só se eu for famoso né não sou famoso mas pode ser usado para alimentar a aprendizagem de máquina e fazer que esses sistemas sejam mais críveis
ainda né O que é assustador porque a gente vai ver isso nas próximas eleições já aqui municipais que a gente vai ter no Brasil e a próxima se presidencial se a gente não tiver regulamentação vai ser uma grande tragédia se a tragédia algoritmica como diz o mas por um momento por por um um lado diferente do que ele [Aplausos] pensou nessa escola primária na Suíça as crianças lidam com a inteligência artificial desde cedo [Música] Verner odat é um dos primeiros professores do Ensino Fundamental no país a ensinar crianças de 10 e 11 anos a usar
a [Aplausos] ia e para terminar já cantou essa bola na resposta anterior mas que é a questão da automação da educação ou do que você chama ali de controle de dos vetores da educação e tal você pode explicar pra gente o que que seriam vetores da Educação e como é que estão tentando aplicar a inteligência artificial naé automação da educação os bom os problemas disso acho que qualquer ouvinte do históri FM consegue ter uma ideia mas vamos aprofundar isso aí né vamos vamos mesmo ras porque eu acho que a gente precisa conversar sobre a automação
da educação sabe por quê que eu poderia falar com você sobre vários problemas dos dos mundos do trabalho né Essa questão do trabalho morto que tá por trás aí do da sua preocupação com os estilos dos Artistas né is que o Marxismo chama de trabalho morto né a poderia falar sobre isso mas eu não tenho tanta propriedade porque eu não sou dessas outras áreas Eu sou professor né então eu tô preocupado também com a nossa profissão aqui professor de história e as pessoas aí que ensinam história que nos estão nos escutando também devem estar né
porque assim olha para falar sobre isso a gente tinha que falar um pouquinho sobre como que diversos críticos e críticas sociais da técnica estão pensando o capitalismo tardio com relação a Essas tecnologias de automação né Não só a inteligência artificial como a gente já percebe porque que ela já tá aí há muito mais tempo a gente só tá interagindo com ela mais diretamente agora não é agora que ela começou a existir mas com todas as tecnologias de automação a internet das coisas e porque é o seguinte né Tem vários termos aí que tentam dar sentido
dar significado para que eu chamaria de condução histórica contemporâneo né tem aí gente que fala do a xoana zubov por exemplo que é a professora de Harvard fala do capitalismo de vigilância é um trabalho assim 700 páginas assim volumoso ela entrevistou aí 600 pessoas 900 Não lembro qual é algo entre 600 e 1000 pessoas do Google e tornou-se um texto assim né impossível de ser contornado por causa disso piores hipótes é uma grande fonte primária para você estudar aquilo e daí ela ela ela conversou com pessoas lá do Google e chegou na seguinte conclusão Olha
quando a Apple né lançou lá o iPhone o pessoal do Google ficou né que que a gente vai fazer a gente tem que lançar um também daí Alguém disse não vamos lançar um super tecnológico Vamos bater a Apple daí daí o pessoal que tinha entendido qual é que é do capitalismo de vigilância Na expressão da zof né disse o seguinte não a gente vai fazer o mais barato possível Vamos fazer um sistema que fou o sistema Android para todo mundo no mundo inteiro ter condições de comprar Ah mas por quê Porque esse é uma ferramenta
de acumulação primitiva de dados tá dados comportamentais o que que eu faço o que que eu compro o que que eu digo o que que eu o que que eu vou né Por exemplo is é a internet das coisas né significa que que até a sua chaleira pode ser hackeado você compra aquele robozinho para limpar sua casa Manda informação lá pra bigtech a respeito de como é a sua casa do seus hábitos de higiene você tá entrando na nas redes sociais não é só o que você clica é o jeito que você mexe o mouse
tá alimentando máquinas que vão te dar estímulos behavioristas né de condicionamento operante mesmo jeito que a gente treina e a e a Tá treinando a gente mas não é ia os caras lá nas bigtech e ela chamou isso Chan zof de Capitalismo de vigilância porque isso serve para manipular as nossas escolhas de consumo mas também as nossas escolhas políticas com pequeno ajuste de parâmetros como a gente viu ali com o escândalo da da Cage de analítica que é só o ponto do só o que apareceu né né Toda uma rede em cima disso mas existem
outras H outras formas de se conceituar isso né que no Brasil o Walter lippold e o David Faustino né Tem falado em colonialismo digital e e fora do do Brasil né estudando né esses fenômenos de disparidade Econômica mas também o alinhamento cultural dos sistemas né acumulação primitiva de dados a expressão que eles usam bastante né porque do que que se trata isso veja não é os dados que alimenta A Iá o dado ass um repositório ou ou um grande Database é como uma mina pensem assim é uma mina dessa mina você vai lá e extrai
o minério de ferro esse minério de ferro são os dados estruturados daí você vai pré-processados daí você faz barra de ferro daí você tem dados pré-processados daí você vetoriza esses dados né você cria pontos de dados que se relacionam com outros pontos de dados e um e um gráfico tentem pensar assim né daí tem os clusters né Tem um monte P num gráfico com um monte de pontos cada um desses pontos é experiência humana renderizada datif né foi transformada em dado eu Minha experiência foi transformada em dados daí você tá lá no no no Netflix
por exemplo tem um monte de de pontos de dados são a experiência dos usuários né daí você vai reconhecer padrões ali ah pessoas que gostam de ficção cífica pessoas que gostam de filme de ação pessoas que gostam de comédia romântica e daí você vai começar a traçar relações entre elas vai aplicar técnicas de regressão linear exatamente aonde esses esses dados se cruzam né esses grupos essas bolhas se cruzam e E aí vai fazer previsões do que as pessoas vão querer assistir aí você dá as previsões para elas mais ou menos assim que funciona sistemas preditivos
né para para de recomendação porque com o gráfico com esses vetores com essas linhas que se formam você pode calcular o ângulo entre elas né que se forma ali com álgebra linear você calcula isso daí e você estabelece relações entre elas né você extrai informação ali dessas dessas relações pode fazer previsões n mais ou menos assim que funciona então você tem esses vetores que são esses vetores né essas linhas dentro de um gráfico que vão alimentar a ia e esses vetores eles funcionam como direções num espaço vetorial né são direções que um robô anda por
exemplo mas também pode ser interesses pode ser informação semântica né como a gente faz no nosso sistema né Eh e daí esses vetores vão treinar várias ferramentas diferentes Então as nossas informações de de de nossos dados comportamentais acabam virando né Eh alimento da ia Essa é a lógica da acumulação primitiva de dados eles acumulam muitos dados muito dados muit dados e investem em alguma coisa que vai gerar D maior mais acumulação ainda né E existe então uma outra tese né da McKenzie work que tá lá no livro O Capital está morto que essa é a
mais ousada né ela diz assim olha ela se diz uma marxista vulgar e daí ela diz ah o Marxismo no últimos 100 anos ela é muito provocadora não sou que tô dizendo isso ela que é né Marxismo nos últimos 100 anos sonhou em dizer aquilo que Marx já havia dito né só com uma nota de rapé expandindo naquilo Às vezes a gente precisa de imaginação para entender um mundo Complet ente novo e ela diz vamos imaginar que o capitalismo acabou vamos imaginar um cons assim uma coisa herética né para alguém que se diz uma marxista
né vulgar como ela diz que é né mas contra o marcisa Ortodoxa eu sou uma marxista vulgar tô pensando no trabalho morto tô pensando nos trabalhadores vão perder seus empregos nos próximos anos e tal daa diz o seguinte o que que tá acontecendo a gente tem uma nova luta de classes entre a classe que se se apossou dos vetores da informação todos esses dados Nos quais nós somos pontos dentro de um gráfico reduzidos a coisas né não é o não é nós que interessa é só o nosso comportamento para poder manipular nosso consumo e como
a gente pensa politicamente e tal né tem essa classe que se apoiou que são ali os os Big texs e tem a classe hacker só que o hacker não é o cara com capuzza ali né escrevendo ali um código locamente numa tela preta com verde não é isso é qualquer pessoa que tenha criatividade de produz coisas novas é o poeta é o historiador é o professora é a galera que tá na rua protestando Sei lá o qu né são pessoas né as pessoas que TM a sua sua criatividade privatizada pelas Big tch Então essa é
uma uma dessas imagens né E e aí CL bom Depois tem várias outras teses aí né Essas trago essas três aí que são para mim são muito impactantes né terminando com essa muito mais ousada que é um experimento de pensamento algo pra gente pensar né que é uma coisa muito comum no campo da computação e da crítica da técnica né e o interessante a gente pensar isso claro então com relação à nossa profissão né o que que vai acontecer com ela e eu acho que a gente deve começar a discutir o problema da automação na
na na educação sabe por quê Porque eu sei como se faz nunca fiz e não vou fazer porque dá muito mais trabalho inclusive do que preparar uma aula mas eu sei como se faz eu conheço as ferramentas conheço os princípios sei que essa tecnologia já existe e essa tecnologia já existe só que dá muito mais trabalho de preparar uma aula mas eu sei como fazer um robô que fala com a minha voz com a minha cara que que dá uma aula e que que não vai ser uma aula maluca porque eu que vou treinar ele
né e noos textos que eu quiser que vai fazer jogos pedagógicos que vai responder perguntas entendendo se eu que eu sou um cara assim que não sou da Computação sou professor de história filho de um farmacêutico do Partenon entendendo Se eu ti se eu sei como faz isso imagina vocês realmente acham que não tem ninguém aí já pensando nisso essas empresas de de educação privada né Essas coisas aí os amigos da táa Amaral né esse pessoal aí Lima né esses caras aí será que eles não estão pensando nisso já porque porque olha só Ah vai
ser muito pior do que alguém um ser humano dando aula sim com certeza não tem nenhuma dúvida disso tem nenhuma dúvida disso ainda mais no início depois vai ficar um pouco melhor mas dá no início no início vai ser uma tragédia só que é o seguinte se isso é óbvio que vai ser muito pior do que um ser humano dando aula então Essa não é a pergunta mais interessante a pergunta mais interessante é vocês que me escutam acham mesmo que os empresários aí do ramo da da educação privada não vão se sentir minimamente seduzidos com
duas grandes oportunidades primeiro botar um monte de gente pra rua coisa que eles já vem fazendo desde a pandemia quando a gente teve estudantes aqui da u ganharam um bom dinheiro para um doutorando uma doutoranda né para Dara ganhar R 5000 para gravar 10 aulas mas Devi ganhar isso todo mês só ganharam uma vez então lá repetindo that naen a aula que eles deram é o que elas deram isso é o primeiro ponto eu meti um monte de gente segundo ponto controlar completamente os vetores da informação que que significa isso gente significa o seguinte Ah
o seu colégio Aí é um colégio Progressista Toma essa aí a Paulo Freire Ah o seu colégio Aí é uma é uma é um é um Colégio Cristão Ah toma aqui ó Jesus Cristo é o senhor esse é o seu professor Ah mas o meu colégio é conservador toma aqui ó moral os bons costumes a família toma esse professor aí Ah esse colégio aqui é mais x ou Y você não tá entendendo para não falar de homeschooling para não falar de homeschooling Então olha eu acho que a gente tem que começar fazer essa discussão tem
que se adiantar nela porque olha se alguém como eu que não tem venda computação não é particularmente inteligente assim como muitos outras pessoas que trabalham com essas coisas são né Olha gente eu acho que a gente precisa est atento a isso e a gente precisa regulamentar esses sistemas viu porque na europeia já fez hã assim como baniram lá esses sistemas de reconhecimento facial jogaram tudo para cá como sempre né o negócio não funciona lá eles joga um lixo aqui e eu acho isso muito muito muito muito preocupante e o Governo do Estado de São Paulo
anunciou um projeto piloto que integra a inteligência artificial à educação basicamente a medida tem a ver com tecnologias como chat GPT formulando conteúdos para o material digital a ser utilizado por professores dos últimos anos do ensino fundamental [Música] recomendações de leitura para quem ouviu até o final eu sei que é um campo muito novo ainda então normalmente eu peço PR os convidados recomendarem livros mas eu imagino que seja um campo ainda muito novo então focando na história no caso né então assim ó uns três textos de qualquer tipo seja livro artigo enfim que você recomenda
para quem tá começando para ter um um pontapé inicial assim o que que você recomenda então e eu pessoas que nos escutam acho que o primeiro texto que eu recomendaria em português é o livro de Tarcísio Silva racismo algorítmico não apenas porque ele traz ali uma explicação muito importante a respeito desse fenômeno né e da da de como que né Rigor No Limite cálculo diferencial produz a diferença integrado numa crítica ao capitalismo e ao colonialismo mas também porque ele explica de maneira muito agradável e resumida como é que funciona EA né tudo isso que eu
falei do simbólico do sub simbólico qu ele explica muitos autores Mas ele tem uma didática muito boa e além disso terc do Silva é um das pessoas que vem ali debatendo com muita seriedade o problema da regulamentação né que eu acho que é um problema muito muito sério como como eu já argumentei né ah o segundo livro que eu recomendaria também em português é o livro colonialismo digital do do do Walter lipold e do David faustin né que expande muitas das considerações do Tarciso Silvo mas também faz uma análise mais mais abrangente né e e
inclusive com uma perspectiva mais histórica também e depois assim olha Claro esse é um livro sobre ia assim né de maneira muito mais geral e sobre problema do digital mas aí a gente tem também pessoas no campo da história já praticando aquilo que a gente chama de história digital ou humanidade digitais né E aí eu recomendaria os trabalhos da da nossa Pioneira dos dois nossos Pioneiros Anita luquez e também o Alison rota né E também recomendo dos artigos do do do Thiago nicodemo que é o o o nosso é o diretor do Arquivo Público de
São Paulo é colega nosso é Historiador e é uma pessoa que vem nos atentando uma coisa muito importante que eu deixei de falar agora de que dados são uma questão de soberania Nacional dados valem muito dinheiro hoje dados dizem respeito a nossa vida hoje em dia e como as decisões são tomadas hoje em dia são todas baseadas em dados e é lamentável que o governo que eu tenho ajudado a a a eleger governo Lula ainda não entendeu isso né e quem entendeu isso foi o governo bolsonaro antes né a gente pode ver isso com o
Tarciso em São Paulo claro que eles vão praticar isso do jeito que eu não não não esperaria né seja não gostaria que praticasse né que o capitalismo de vigilância o colonialismo digital né o controle dos vetores da informação mas acho isso muito importante e de ser dito né como diz o Thiago nicodemo também recomenda os trabalhos e as palestras dele e por final né eu deixo eu sabbe que eu gosto de coisas ousadas né então eu eu deixo como recomendação também o trabalho da mackin War o o capital tá morto que é um texto muito
imaginativo porque eu acredito que precisamos de imaginação para compreender o mundo em constante mudança um mundo sem [Música] precedentes Então é isso Rodrigo alguma consideração final Olha eu gostaria de dizer de novo que o grande problema da ya não é que as máquinas vão acordarem nos dominar e blá blá blá esse é papo do Elon musk certo o grande problema da ia ele é dupla ele é político e cultur cultural né econômico político econômico e cultural primeiro alinhamento cultural dos sistemas que podem reproduzir preconceitos e praticar coisas como racismo algoritmo ou racialização algoritma como prefere
o w lipple e o segundo é o controle completo dos vetores da informação né isso que a ma chama de um novo modo de produção se é um novo modo de produção não sei essa é a discussão Mas essa é a provocação dela fato é que essa acumulação primitiva de dados é uma marca do capitalismo tardio Esses são os dois grandes problemas da ia não é que a ia não Não se preocupem aa não vai acordar e escravizar todo mundo mas as Big Tex talvez façam isso então é isso gente muito obrigado por ter ouvido
até o final não se esqueçam de que as leituras recomendadas aqui estarão no post desse Episódio no nosso site stor fm.com e claro não se esqueçam de colaborar com o nosso projeto em apoia.se bar obrigahistória Então é isso muito obrigado e até a [Música] próxima o stor FM é uma produção do canal leitura obriga história apresentação I Rodrigues edição Samuel gambini roteiro I Rodrigues o financiamento deste programa é realizado pelos nossos colaboradores em apoia.se obrigahistória [Música] esse podcast Foi editado por Samuel gamb Samuel gambini audio.com