k [Música] k [Música] Olá querido aluno querida aluna deixa eu trocar aqui o w que esse dá um reflexo danada agora sim ó Professor lindo na área vamos iniciar mais um evento aqui pelo Gran Cursos onde a gente vai falar do concurso do BNDS né então Ó a ideia aqui é trazer para você os conhecimentos transversais Mais especificamente princípios de análise de dados e informações a gente vai conversar um pouco sobre a matéria sobre eh eh como essa matéria pode ser cobrada e depois a gente vai vai tô com a tossezinha viu gente Verê se quando ela aparece a gente depois vai responder algumas questões sobre lgpd tá que é um dos assuntos cobrados e que eu acho que é uma aposta certa para prova pela configuração do edital Tá bom boa noite para todo mundo que tá chegando aí que tá assistindo ao vivo esse evento e vamos Sem muitas delongas para o nosso material material na tela olha aí professor lindo danado Professor Vittor Kessler Esse é demais viu e aqui tá o nosso querido e amado edital 4. 1 2 3 4 5 6 7 isso aqui é o que você vai ter que vencer para essa parte de conhecimentos básicos do do conhecimentos transversais do BNDS tá princípios de análise de dados e de informações porque informática básica é coisa do passado a moda agora é análise de dados Inteligência Artificial ciência de dados fluência em dados são esses os os assuntos de ti que serão cobrados a partir de agora já estão sendo cobrados na verdade nos grandes concursos tá Não pense que você vai encontrar no seu concurso inform Eita que meu cabelo foi embora informática básica Windows Excel Word internet navegador isso aí já é obrigação meu jovem o que o serviço público quer São pessoas que entendam do processo de extração de Formação processo de formação de conhecimento paraa tomada de decisão gerencial extraindo isso de bases de dados nem que usando Excel mas que o cara tenha a se o cara não for fazer isso que ele tem a capacidade de conversar com alguém e dizer ó a gente pode fazer um aprendizado supervisionado desculpa gente essa tosse aprendizado supervisionado porque a gente tem uma base de dados aqui que o que eu quero aprender tá aqui nessa coluna aqui aí vai ter que o cara vai ter assim vamos dizer assim é um plus é uma uma capacidade que ele vai ter de conversar com quem é de ti no mínimo tem que ter essa capacidade tá bom E aí os assuntos vão cada vez mais vir dessa forma aqui minha tosse vai parar já já dados e organizações tipos de dados dados estruturados e não estruturados temos uma aulinha sobre isso né os dados estruturados são os dados no formato tabular os dados não estruturados são dados binários como imagem como textão do Face como um vídeo um áudio e assim os dados estruturados as tabelas a gente consegue colocar no banco de dados tradicion fazer consultas e extrair os as informações que a gente precisa mas dado não estruturado não como que eu vou fazer um quem já ouviu falar em SQL né estrutura langage como que eu vou fazer um select e extrair informação de uma imagem não rola né eu tenho que jogar a imagem dentro de uma de uma inteligência artificial para que ela nos traga e a informação que a gente deseja tá dados quantitativos dados qu ativos quantitativos são numéricos qualitativos são categóricos tipos de produtos de dados bases de dados relatórios planilhas análise exploratória de dados aqui a gente precisa da ajuda do nosso professor de estatística que nos mostra como fazer uma estatística descritiva de uma base de dados dashboards painéis modelos de aprendizado de máquina aqui ó entra aprendizado de máquina forte aqui machine learning Inteligência Artificial e seus usos explorar alertar descrever explicar prever recomendar otimizar é um tipo de edital gente que inova tá porque a gente nunca viu no edital o cara escrever isso tipos de produtos de dados e seus usos Tá bom mas é algo que pode você pode prever qualquer coisa relacionada à Ciência de dados a inteligência artificial machine learning tá aqui ó aprendizado de máquina tá escrito aqui você tem que saber o básico de aprendizado de máquina para chegar na prova bem princípios de organizações orientadas a dados né a gente vai conversar muito com a disciplina de governança de dados tem um curso lá para você assistir tá bom E aí vem pro 4. 2 deixa eu ver se alguém me deu boa noite porque Boa noite às 8 horas da noite na sexta-feira Tá difícil eu conseguir um boa noite aqui hein ninguém para me dar um boa noite aqui ao vivo e tem gente assistindo ó vai gente me dá um boa noite aí ó volta Vitor etapas do ciclo de análise de dados o crisp DM ó crisp DM é Cross industri da indústria né Standard process de data mining então é o processo padrão da indústria de mineração de dados gente o que é mineração de dados opa deu um apareceu aí os Boa noite graças a Deus ó mineração de dados ou data mine é a ideia de que você vai extrair informações de uma base de dados jeito que eu falei para vocês só que você vai usar uma picareta né que é que é mineração só que essa picareta tem três tipos de picareta tem a estatística tem a matemática e tem a melhor de todos Ultra moderna que ganhou todo que todo todo toda a empresa de mineração quer usar que é inteligência artificial que é o machine learning O aprendizado de máquina tarefas de classificação tarefas de agrupamento onde você vai pegar aquela base de dados e vai extrair dessa base os padrões que explicam aquela base as informações que você precisa para ter uma vantagem competitiva tá isso é mineração de dados E aí para você fazer mineração de dados tem um processo Esso padrão que é o crisp DM que você vai primeiro entender o negócio para você saber o que que você vai fazer entender os dados onde é que tem dado nessa administração Quais são os dados estatística descritiva ou análise exploratória dos dados aí agora eu vou preparar os meus dados para que ele essas são as etapas do cristic DM tá aí eu preparo os dados para colocar dentro da etapa de modelagem que vem na sequência nessa preparação eu vou tirar uler eu vou tirar dado faltante eu vou fazer transformação de variáveis eu vou mudar tipos de variáveis eu vou eu vou eh eh preparar um dataset um conjunto de dados que vai entrar na modelagem aí A modelagem eu vou usar o meu algoritmo de aprendizado de máquina que vai fazer um treinamento com aquela base de dados que eu preparei vai aprender a prever coisas que estão naquela base ali e aí e eh esse modelo pronto vai pra próxima fase que é a de avaliação que eu vou verificar onde eu vou verificar se o que eu criei na fase anterior está tchã tchã tchã com dados do mundo real tá normalmente eu eu eu pego parte do meu dataset tiro do treinamento não deixo a máquina aprender com eles Para quê Para que depois eu avalie com esses dados que ela nunca viu se ela tá acertando ou não Qual é a acurácia do modelo frente a esses dados tá moral da história se passou na avaliação termino com a implantação do meu modelo que eu desenvolvi se reprovou eu volto para começo do no ciclo aí eu vou tentar entender melhor o negócio tentar entender melhor meus dados preparar um dataset melhor fazer uma uma uma modelagem melhor E aí eu rodo o meu crisp DM tá bom esse é o crisp DM meu jovem crisp dm e tem 4.
2 fundamentos para criação de métricas de negócio kpis né tem o professor Darlan que ensina isso tem muitos professores aqui no Gran nessa parte mais de administração diagrama de ichikawa o famoso diagrama de espinha de peixe cinco porquês do Porter né análise de Pareto famoso glorioso 8020 tudo isso é coisa lá da administração que tá caindo aqui nos princípios de análise de dados 4. 3 aí eu vou pedir licença porque aqui começa a parte de raciocínio lógico E aí só o professor de raciocínio lógico que vai te trazer essa parte de lógica e de noções básicas de lógica tá lógica lógica lógica que não falta é lógica aqui pula esse daqui Vita que eu não vou me meter a E aí vem o 4. 4 que traz o item que tá aparecendo a coleta e a preparação dos dados lembra que eu falei no no no crisp DM que eu tenho uma etapa de preparação dos dados pronto ela foi promovida a uma a Um item do seu edital Então você tem que saber quais as diversas Desculpa mesmo por essa tose hein gente Quais as diversas técnicas que eu posso utilizar para montar o meu dataset como que eu faço para tirar ponto fora da curva ponto fora da curva é bom trazer essa essa visão para vocês imagina que eu tenho um conjunto de dados com altura e com peso e e a minha tarefa de mineração é conhecer a a a relação entre altura e peso e a partir da altura de uma pessoa prever o peso de uma pessoa como os dados são muito relacionados entre si tem uma correlação Grande Ó seu ploto altura e peso num gráfico 2D vai ficar um praticamente uma linha e aí qual é a a a graça desse negócio eu vou usar uma regressão linear que vai construir uma linha quase que torou ali que explica a altura Oh agora entortou muito a altura vai ter um peso associado de acordo com essa linha que eu coloquei no meu que eu criei usando uma regressão linear tá só que o que acontece meu jovem se eu colocar deixar na minha na minha na minha base de dados outliers por exemplo um cara que é muito alto mas é magrelo ele vai sair por aqui ó vamos supor que essa base tenha três magrelas o que vai acontecer com a minha regressão linear ela vai tender abaixar porque esses caras puxam ela para baixo porque ela vai ter vai tentar incluir eles na na na regressão E aí o que vai acontecer vai ser gerada uma retinha mais para baixo assim ó essa retinha mais para baixo ela tá ela não tá explicando a relação Ela tá aqui ó torta tá para baixo ela não tá mostrando os principais dados da minha relação ela não explica vai sair um um os Car as pessoas vão sair mais magras do que o que elas deveriam ser então eu tenho que remover os outliers para quando eu fizer um modelo que explica os dados ele só leva em consideração os dados comuns os dados padrão tá um outlier normalmente ele não vai ser bem compreendido pela máquina quando ela tiver aprendendo tá tá faltando dados tem muita tem muito algoritmo de aprendizado de máquina que não gosta de dar faltantes o que não funciona com dados faltantes tá um buraco na sua tabela Tem uma tabela lá de altura tá faltando altura de uma pessoa você pode fazer uma regressão linear pegar o peso a partir do Peso definir a altura e preencher é uma forma de você tratar esses dados faltantes tem erro nos tipos dos dados os dados foram coletados errados você tem um viés de seleção O que é o viés de seleção você selecionou dados que tem viés que tem problemas que não que não são tão bons para eh fazer a relação entre os dados e o que você quer aprender tá esse viés é como se a máquina e e é como se nos dados tivessem informações erradas queer um exemplo bom de viés em base de dados Você tem uma base de dados de pesquisas realizadas no Google isso é um problema do passado que Mas é muito bom de explicar E aí a pessoa que E aí você tá querendo fazer um autocompletar você o Google né Aí você faz o auto completar que é você começa a digitar o termo de pesquisa ele vai vai completar com os dados que todo mundo pesquisa só que o o o ser humano ele é ruim ele é ele é marxista miso misógino desculpa racista tudo que não presta homofóbico E aí quando as pessoas vão fazer pesquisa no Google elas colocam seus preconceitos tá então você vai ter uma base de dados de pessoas que que preenchem a pesquisa do Google cheia de viés E aí você tem que tirar todo esse preconceito da base porque senão você vai ser processado né que aconteceu muito no passado então viés tem a ver com erro um erro que existe lá dentro da base de dados que você tem que limpar pra máquina não não aprender aquela coisa errada tá certo muito bem Tem alguém aí online tá desesperado meu jovem Boa noite boa noite boa noite boa noite boa noite boa noite Vitor primeira vez que te assistem um X dizem que eu falo rápido alguns não gostam de botar eu em 1.