meu nome é alexandre eu sou professor da faculdade de saúde pública da usp a na área de estatísticas de saúde né essência de dados eu sou originalmente economista e fascinado por pela questão da análise de dados principalmente na área da saúde que é uma área tão cheia de imperfeições de mercados e novas novas interesses científicos a serem abordados com a análise de dados bem vindos ao curso de inteligência artificial com foco na área da saúde a gente vai falar sobre bastante o comércio online as possibilidades de machine as aplicações técnicas de marchi lane a gente
vai começar desde o início neder e como rodar modelos de mach lane né principalmente como inserir variáveis o que fazer com essas variáveis quais variáveis importantes a gente vai falar sobre todas as técnicas iniciais de de pré processamento de dados daí vamos falar sobre os modelos de um machinho lane aí no fim vamos terminar atestando a qualidade desses modelos então você o curso que vai do início ao fim de mach lane então vai ser uma parte essa parte vai ser bastante técnica com a gente vai também vai ter parte mais gerais né principalmente no início
pra explicar às pessoas que não conhece o que é essencial é explicar um pouco o que é possível dentro da área e desmistifique desmistificar um pouco essa história de inteligência artificial que parece uma coisa muito distante para muitas pessoas mas que já é uma realidade hoje a eficiência e é uma realidade hoje cada vez mais nas indústrias e nas empresas tá então bem vindo ao curso espero que todo mundo tenha bastante proveito com esse com esse curso é que é uma área que hoje é como vocês sabem tatá explodindo muitas pessoas a acham que essa
explosão do interesse e inteligência artificial às vezes é uma coisa criada pela mídia é porque porque porque hoje você abre qualquer jornal você assistir qualquer canal de tv você abre qualquer revista vai ter alguma coisa de inteligência artificial ea área que domina hoje a agência oficial que é machina online então muita gente pergunta assistindo ao hype criado pela mídia tá eu estou aqui primeiro lugar para admitir cá isso e dizer que não tá então inteligência artificial é uma realidade hoje ela está presente na nossa vida muito mais que as pessoas sabem que as pessoas pensam
tá e porque e na verdade esse hype da mídia é uma consequência do nosso avanço ataque tenha ocorrido na área na área da ciência na área da da empresa então a mídia está começando a se dar conta dessas mudanças que estão acontecendo a nossa área e por que tá acontecendo essas mudanças nos últimos cinco dez anos são por três fatores principais em primeiro lugar à direita então a gente nunca teve tantos dados disponíveis para treinar os nossos modelos de machine aí a gente vai ver que esses modelos de fato necessita de muitos dados ao contrário
da gente que aprende coisas novas já tem uma noção da realidade os modelos estão aprendendo 02 opção de muitos dados em segundo lugar capacidade computacional então finalmente os computadores novos modelos ainda leva muito tempo a rodar é um dos modelos mais complexos que nós fazemos no meu laboratório vou falar um pouco sobre sobre ele que o lobby da pepsi eles ainda levam bastante tempo mas cada vez menos tempo com os alunos computacionais e principalmente os avanços na área de gpu que tem permitido rodar modelos de plano em cada vez mais rápidos e terceiro lugar o
desenvolvimento técnico da o aparecimento de novos algoritmos the machine muitos desses algoritmos the machine já existem há muito tempo desde a década de 60 70 e 80 mas alguns deles são relativamente novos e algumas pequenos ajustes têm ocorrido umas pequenas inovações de ajustes a de parafusos aqui e ali técnicas de otimização a para a paralisação a função de perda diferente então a gente está sendo alguns avanços técnicos e nos últimos anos principalmente nessa área está cada vez mais forte e mash lane que a gente vai falar no curso que é de plani então só para
deixar claro esse crescimento da área hoje a demanda por profissionais de saúde profissionais que sabem analisar machine lane há muitas muitas vezes na área da saúde é gigantesca hoje tá então hoje as empresas estão de fato pagando salários milionários para especialistas em marketing online e é uma das áreas mais quentes do momento aí as empresas não estão conseguindo preencher essas vagas porque devido à falta a de profissionais da área é demanda por profissionais na área científica também está bastante alta como a gente vê todos os dias no meu laboratório então pesquisa do do linkedin o
link faça pesquisa todo ano é das várias habilidades que você consegue colocar o currículo do linkedin com a habilidade que conseguem emprego mais rapidamente tá e todos os anos no brasil há já vários anos é a análise de dados então você ter habilidade e analisar dados é a tua habilidade que consegue um emprego mais rapidamente e o emprego de qualidade mais rapidamente porque eu quis deixar isso claro nessa demanda que já se demanda porque se você tiver trabalhando em uma empresa que não está de acordo com os padrões éticos você precisa sair dessa empresa a
demanda profissionais de marketing online é muito alta hoje e você não precisa participar dessas dessas empresas então a gente vai usar uma finlândia para o bem vamos fazer muita coisa a positiva provas a humanidade como a finlândia mas algumas empresas vão usar uma senha única coisa errada a gente tem muita empresa hoje é que finge que está aqui objetivo é conectar o mundo não é na verdade está manipulando voto estão manipulando sentimento já existem hoje empresas que utilizam uma chicane para vigilância de funcionários em fábricas por exemplo a gente hoje empresas que estão usando uma
china que alimenta a limitar o acesso a bens e serviços a pessoas com necessidades se você está trabalhando em alguma das empresas você precisa sair da empresa a demanda pelo seu trabalho é muito grande você vai conseguir emprego muito bom fora dessas áreas não contribua à para essas a pressa as empresas e por outro lado há muitas empresas numa chicane para o bem dá pra fazer grandes mudanças positivas na sociedade como por exemplo o google está usando machiline para evitar diminuir o desmatamento da amazônia sim existem a empresa várias pesquisas melhorando o trânsito nas cidades
mas sim lane para melhorar o trânsito nas grandes cidades e desenvolvimento em tecnologias verdes nec nosso laboratório a gente usa para melhorar a situação de saúde do brasil é melhorar políticas públicas e melhorar o diagnóstico dos pacientes etc então tem muita coisa boa ter feito em washington de começar o curso que deixar isso claro para você se torna essa empresa não precisa dessa empresa a demanda por você é muito grande ver contribuir para para o bem da sociedade como shane que é uma que é uma técnica uma ferramenta muito poderosa para ser usado para coisas
pra coisas erradas então na área acadêmica que tipo de na área de pesquisa científica que tipo de estudo estão aparecendo que já usam mexe lane por exemplo um estudo publicado há o site teve como objetivo para dizer a presença de transtorno de estresse pós traumático utilizando dados de 24 países incluindo o brasil totalizando cerca de 69 mil indivíduos a prevalência do transtorno é relativamente baixo à população cerca de 4% então qual foi o objetivo do estudo pra dizer baseado em várias variáveis por editoras como sócio demográficas distúrbios mentais tipo de evento traumático é certa quem
provavelmente a a desenvolver transtorno de estresse pós traumático eles usaram o super lana que o algoritmo de the machine e o que encontraram que os 10% de pessoas que o algoritmo falava que tinha maior risco incluíam praticamente todas as pessoas 95 por cento e noventa e cinco a seis por cento das pessoas que de fato tinha dois na então imaginem uma aplicação prática no hospital já que tem um limite de atendimentos a priorizar alguns pacientes prioriza esses 10% apenas você vai ter praticamente todo mundo aqui vai ter esse esse transtorno os 10% que o algoritmo
fala que tem maior risco incluem basicamente todo mundo que vai desenvolver esse transtorno outro artigo recente que sair esse ano a procurou para dizer quais mulheres grávidas tinham maior risco de ter um evento adverso no parto que seria esse evento adverso filho prematuro combate peso ou internação na uti ea morte no primeiro ano tá aí pra que isso para orientar a inscrição no bar bar tal tucanos que é o programa nos estados unidos de prevenção já que ajuda a gravidade a previne a o desenvolvimento desses desses problemas adversa nascimento eles testaram quatro algoritmos the machine
lane para predizer risco de parto adverso e compararam com a regra anterior a regra anterior a gente vê muito isso serviço de saúde e às vezes tem umas regras para a tomada de são luís são muito simples e que a china está trazendo tá melhorando os critérios de inclusão nos programas então existe uma regra que 17 fatores de risco se tivesse 2 a pessoa incluída no programa daí que os algoritmos mostraram que eles têm muito melhor capacidade preditiva de quem vai ter esse evento adverso do que essa regra anterior tha e os autores chegaram à
conclusão que a cada duas mil mulheres o algoritmo incluiria mais 170 mulheres que de fato eu te desfecho adverso no parto então você inclui muito mais as pessoas que de fato você ia conseguir prevenir esses problemas no parto eu falei dos artigos científicos agora falar um pouco sobre o nosso laboratório que a oab da pepsi laboratório de big data e análise preditiva em saúde da faculdade de saúde pública da usp apesar da enorme crise dada ciência que a gente vive hoje a gente tem o financiamento a gente a sorte o financiamento da fapesp cnpq da
e da fundação lemann a e que tipo de perguntas ele está respondendo nosso tentando responder nosso laboratório está em primeiro lugar é possível predizer como boa a qualidade preditiva quem vai morrer em breve e por qual causa a pessoa vai morrer que é uma das grandes questões da epidemiologia desde os clássicos estudos de um grau de 1.662 que ele procurava ver quais fatores estão associados ao óbito nos próximos anos a probabilidade de óbito porque isso é importante pra gente conseguir determinar que essa pessoa tem alta probabilidade de ter um infarto por exemplo eu tenho um
derrame por exemplo a gente consegue iniciar medidas preventivas a com bastante antecedência ea gente descobriu né as pesquisas recentes que isso é um problema resolvido então mesmo com poucos dados ea gente tem um tutorial a e publicação né o tutorial de uso de machine com foco em prevenção de óbitos em idosos que a gente consegue predizer relativamente bem mesmo com poucos dados que vai morrer nos próximos cinco anos é principalmente idosos ea gente conseguiu agora acesso a um banco de dados bastante grande da inglaterra que a gente está bastante otimista que a gente vai conseguir
não só para dizer que vai morrer mas também por qual causa de obras que as pessoas vão morrer outro outro desafio que a gente está tentando abordar a predizer qualidade de vida futura em pacientes com doenças graves então a gente está analisando uma mostra uma pesquisa do hospital do coração hcor é que eles fizeram um estudo com pacientes com câncer internados não tem orientado para dizer esse paciente que são graves a paciente com câncer internados na uti é quanto tempo de qualidade de vida eles têm pela frente é porque isso é importante pra pensar em
orientar cuidados paliativos então os pacientes têm poucos dias poucas semanas pouco apenas um mês por exemplo de qualidade de vida pela frente dá essa possibilidade do paciente e profissional de saúde tomar essa decisão você quer continuar hospital ou você quer passar os últimos dias tentando melhorar de minerador melhorar a qualidade de vida na sua casa com seus familiares seus amigos em terceiro lugar a outro outro grande desafio do nosso laboratório identificar boas práticas de políticas públicas em saúde a identificar quais municípios brasileiros estão tendo uma boa gestão e saúde o que é bastante difícil né
então como é que realmente você vê é bastante na mídia nos jornais um ranking é normalmente de por exemplo expectativa de vida então fica implícito que o município com maior expectativa de vida tem a melhor de sua saúde e seu absurdo daí porque que os municípios mais ricos vão ter melhor expectativa de vida então isso é simplesmente um ranking de riqueza dos municípios no ranking de qualidade de gestão e saúde a gente tava na área da saúde a gente sabe muito bem que fatores socioeconômicos fundamentais pra ver a qualidade de saúde da população então o
que a gente está fazendo com o conheço tudo no meu lugar a gente está tentando predizer na testado é possível predizer qual é a expectativa de vida dos municípios brasileiros sem usar informações saúde só usando informação sócio econômica e demográfica então por exemplo dada a renda desse município o desemprego desse município a aaa escolaridade esse município de certas você tem 60 variáveis do nosso algoritmo consegue falar o município com as características tem expectativa de vida de 73 5 a 2 ea gente olhar de fato e 73 dos ladrões eu vou mostrar pra vocês que a
gente consegue tá e daí a gente entra no segundo desafio que é por mais um município a 7 mas tão anti ele erra alguns casos alguns municípios vão melhor do que deveriam ir do que a predição eu sou melhor do que eles deveriam ir que a gente chama de owach vers a gente está chamando esse estudo de ovar ativas a gente entra nessa segunda fase depois que identificar o que estou ativos diferem do sandero artigos municípios que vão pior do que o nosso algoritmo disse que ele deveria ir aí sim comparar a situação de saúde
para ver boas práticas de políticas públicas tá então primeiro lugar a gente mostra que consegue predizer com boa performance a expectativa de vida dos municípios então aqui né no gráfico se conseguem ver que a medida que nosso algoritmo fala que até que a expectativa de vida deve ser alta a gente vai lá cheque de fato é alto o nosso objetivo fala que deve ser baixa a gente checa de fato é baixo quando ele comete em geral poucos erros mas mesmo assim tem alguns outline em alguns municípios que o nosso algoritmo é bom ou melhor que
o esperado ou pior que o esperado ea gente entra na segunda fase que já adianto para vocês nosso artigo está em fase final de revisão em uma revista científica aí que a gente encontrou que houver tiver se investem mais em atenção primária à saúde então são os municípios que têm mais tato é só da família passa o município tem mais base na ação são municípios têm mais programas federais de saúde e odontológico por exemplo tá isso é o resultado que a gente esperava a gente ficou muito feliz no fim é porque isso confirmou que os
outros estudos têm mostrado com uma técnica totalmente diferente do que tem sido feito até hoje e mais o mais interessante disso é que a gente viu que o sandro ativas ou seja os municípios que vão pior do que deveriam ir do que o nosso algoritmo prediz que ele iria também investe em saúde e são melhores em algumas áreas mas em atenção secundário tá então são municípios que têm mais máquinas de raio x do que os outros são municípios que fazem mais seis áreas do que os outros municípios que fazer mais uma monografia do que os
outros já então interessante aqui de fato eles estão também investindo em saúde mas tem investido em áreas com o retorno marginal menor esses são alguns exemplos de pesquisas na área pesquisas de outros grupos e nosso grupo mas como além desse existem milhares de outros grupos do mundo né fazendo essas pesquisas agora trabalhando isso agora mandando os ativos agora então é uma área da saúde relativamente nova que está explodindo agora num no máximo no último ano que é quando a gente entrou também nessa área [Música]