Unknown

0 views18986 WordsCopy TextShare
Unknown
Video Transcript:
Opa est ao vivo est ao vivo E aí pessoal tudo certo como vão as coisas aí muito frio caramba aqui tá gelado aqui o escritório hein meu Deus do céu vão as coisas aí deixa eu ver quem tá online internet deu uma bambada aqui alguns minutinhos de atraso mas vamos que vamos vai dar certo já deu né E aí gente preparados mais uma live 31 como escolher a técnica certa pro nosso projeto de dados essa é uma dúvida que todo mundo que começa a a analisar dados aprender mais sobre técnica sair da superficialidade e só
de ferramentas né de dashboards ou coisa do tipo quando você de fato começa a entender que o mundo de análise de dados é muito mais do que simplesmente você ir lá e aprender fazer um curso de power Bi é muito mais do que isso né E aí você tem muita dúvida você fala caramba onde que entra estatística onde onde que entra inferência onde que entra probabilidade eh onde que entra o tal do machine learning modelos iia chat GPT enfim aí já começa a ter tanta coisa que eu me coloco no lugar das pessoas e falo
caramba É verdade né Eu passei por todo todas as principais áreas de dados ao longo da minha carreira eh tenho mais de 17 anos né de carreira quem me acompanha sabe disso e eu fui aprendendo de forma muito natural né ao longo de 17 anos então para quem tá começando agora nos seus primeiros 2 TR anos mais firme né de análise de dados eu fico imaginando como deve ser mesmo desesperador muitas vezes quando você tem acesso a tudo isso que você pode aprender é se falar meu Deus né Por onde que eu começo o que
que eu aprendo primeiro Qual é a técnica conceito fund que vai me ajudar no meu trabalho o que que eu deveria fazer enfim né se você tá nesse nesse momento eu me solidarizo com você mas fica tranquilo acompanhando a gente aqui a preditiva as coisas estão ficando cada vez mais fáceis né Muito mais simples não quer dizer que não dá trabalho Claro que dá né você fazer um bom projeto na empresa que tenha né Eh um projeto pautado em dados que é o que traz segurança para você tomar uma boa decisão isso leva tempo né
porque você precisa extrair o dado para extrair o dado você precisa conhecer alguma linguagem conhecer alguma ferramenta extrair o dado você tem que conhecer o negócio conhecendo o negócio você levanta as hipóteses do que você quer resolver que você quer perguntar pro dado aplica as técnicas as técnicas bem interpretadas vão te responder e nessa resposta você vai entender se tá suficiente se não tá aí você vai seguir um método né para saber isso então essas coisas Dão trabalho mas quando você treina e quando mais importante né você aprende no lugar certo que é o que
eu espero que seja aqui com a gente eh fica muito mais simples essa jornada tá bom é isso Então essa é a introdução para hoje vamos ver quem tá aqui ao vivo com comigo Marcão tá por aí tudo certo aí Marcos como vai a Juliana a Edna tema muito relevante Sem dúvida Kauan Tá por aí também boa noite o Artur Gabriel kéber o Cláudio também mas comu tamo junto é isso aí isso aí pega um chocolate quente aí liga o o o ar condicionado se tiver eu tenho aqui um um mini arcondicionado climatizador né que
tá dando uma ajuda boa boa noite aqui a todos pessoal tem gente nova aqui na live sempre né Geralmente as lives aqui da primitiva fica 50 60% aluno e 40% ainda não aluno né quero ter uma ideia aqui quem é a primeira vez aqui na live da coloca aqui para mim por favor no chat ó o den aí vamos que vamos den mais uma hein o professor Hudson também mais uma ala preditiva o Denis outro aluno muito bom muito bom aqui sofreu também com certeza com certeza aqui tá frio não tá só muito bom muito
bom o jance aqui boa vind boa noite a todos É isso aí Boa noite Marcos dúvida para começar começa escrevendo curso dativa boa Marcos obrigado aqui pela força Marcão sempre presente nas lives aqui indicando a gente muito bom Marlon atrasado mas presente boa mar isso aí cara obrigado pela presença mais uma vez Renatão também tá por aí Boa noite a Dani muito bom Dani isso aí Boa noite o Eduardo legal ó novo aqui o f serviços novo a Fabiana aqui também o Eduardo primeira Live a fila n diferente muito bom seja bem-vinda aqui Fábio e
Tamar aqui ó segunda vez muito bom primeira várias pessoas novas aqui né Não Sou aluno ainda vai se tornar hein o dney aqui aparecendo deu uma travada aqui deixa eu ver tá aparecendo para vocês os os os comentários travou Ah agora foi tá dando um delay aqui eh bom citar que vai ter reajuste aproveit o momento exatamente vai ter um belo reajuste que a gente a gente há muito tempo né ficou segurando o preço do curso abaixo do valor de mercado a gente sempre fez questão de ser um dos mais baratos só que vocês acreditam
que tem gente que acha que porque a gente tem um dos melhores custos benefícios é meio fake pode ser que não seja verdade como assim é tão bom e é barato então a gente falou assim bom então vamos resolver isso vamos começar a cobrar mais porque aí a a a galera Acorda né É Por incrível que pareça isso pessoal é muito engraçado né a percepção de de valor muitas vezes tá no preço você vê dois produtos um tá mais caro que o outro para qual produto que você vai geralmente Você vai no mais caro porque
você acredita que é é mais caro porque é melhor né então aqui na escola a gente por muito tempo né Eh ficou abaixo o mercado concorrentes aí b não vou falar do mal do concorrente mas não vou falar o nome mas concorrentes com cursos muito superficiais que não resolviam cobrando R 6 r 7.000 e a gente aqui sempre abaixo do 1500 1600 Então a gente vai mudar agora porque eh chega uma hora que não dá mais as pessoas vão lá e simplesmente não valorizam escolas que t ou produtos que T um custo benefício alto É
impressionante a c aqui ó didática maravilhosa mand curso obrigado C fico feliz aqui que esteja ajudando é isso pessoal muito bom aqui deixa eu ver o Anjo você vai fazer alguma análise portfólio novamente gostaria de ter o meu analisando eh sou novo na área Estou buscando Olha é tudo depende de do volume de pessoas pedindo alguns temas tá então lá no link que tá na descrição que é a lista de presença lá que as pessoas podem pedir sobre assuntos a gente vai colocando assuntos à medida que isso vai acontecendo tá bom boa pessoal deixa eu
ver quem mais aqui ó fiz um curso de análise de dados achei ruim vocês teriam um pacote de tipo de complementação o que que é um pacote de complementação xará Vini não sei o que você quer dizer com isso Mas quer fazer um curso bom você vai fazer aqui com certeza eh o n aqui ó justo agora quero comprar Então já até o final do mês aqui você garante o preço atual é isso pessoal aqui deixa eu ver o o json pesquisei muito antes de fazer a minha inscrição Estou bastante impressionada com a qualidade parabéns
a equipe preditiva muito bom muito obrigado Gelson fico bem feliz aqui o nosso time também tá bom é isso pessoal bora bora trabalhar vamos falar aqui sobre o nosso tema então como eu disse tá chegando agora Live 81 vamos falar sobre como escolher a técnica de análise de dados né Existem várias técnicas Existem várias abordagens e cada uma delas Tenta resolver uma etapa do seu projeto de dados e é importante que você tenha ciência disso tá então quando você vai aprendendo as técnicas você já tem que ir com o tempo entendendo qual técnica é mais
adequada para qual parte do seu trabalho desde a parte da extração desde a parte de você fazer o tratamento dos dados eh de você fazer a visualização desses dados se assim for necessário criar tabelas responder hipóteses fazer previsões tudo isso são etapas de um projeto de dados um projeto que tá lá na sua área que você vai usar dados para responder esse projeto E aí você precisa entender a técnica né Então essa é uma live que se você já assistiu várias outras lives da preditiva ou mesmo se é aluno vai ser uma excelente oportunidade para
você rever muita coisa para ver se você tá claro como que você você liga as peças de tudo isso e se é a primeira vez aqui ou as primeiras vezes na primitiva vai ser uma boa eh uma boa introdução para você entender todas as oportunidades que essas técnicas te trazem né porque não diria nem a área porque você não precisa ser um análise de dados mas você precisa desenvolver a sua habilidade em dados né todos nós profissionais não importa a área tem lá um sistema esse sistema eh captura dado e esse dado tá lá de
bandeja mostrando para você assim ó por favor me analise aqui me analise para tomar uma decisão é basicamente isso né E aí você com certeza começa a ser muito mais valorizado na sua carreira quando você tem uma habilidade tão importante quanto essa e que poucas pessoas têm qualificação é impressionante a quantidade de vagas que buscam profissionais que tenham essas habilidades Isso foi ontem é hoje e vai continuar pros próximos eh anos isso daqui não não tenha dúvida tá eh então é muita gente desqualificada no mercado então só onde você tá aqui você já tá fazendo
parte de um grupo seleto de profissionais que querem dar o próximo passo querem se especializar querem se manterem relevantes no mercado e fazer não só a sua transição de carreira se é assim que você quiser ou permanecer relevante na sua carreira atual só que muito mais produtivo com uma habilidade tão importante quanto essa não é legal pessoal então recados dados né ou melhor eh introdução feita alguns recados se você não é aluno da preditiva no mínimo se inscreva no telegram porque é lá que depois de eh nos próximos S dias a gente compartilha os materiais
da Live quando é aluno da preditiva fica lá disponível na plataforma que aí você tem acesso a todas as lives eh passadas né você tá aqui na plataforma da preditiva você vem aqui em em lives e nas lives você tem todas as lives anteriores A gente já tá somando mais de 158 horas de conteúdo só de Live anterior que não tá mais disponível essas lives materiais dessas lives no YouTube né só fica disponível aqui pra plataforma da preditiva para quem é aluno então Eh se inscreva lá na no telegram para você ter acesso enquanto isso
tá E aí a gente tem uma lista de presenas se essa é a primeira vez que você tá aqui no final da Live eu falo uma palavra-chave essa palavra-chave você coloca na lista de presença que o link tá aqui na descrição e lá você fala o que que você achou da Live e você pode sugerir temas né Eu sempre olho aqueles temas mais sugeridos aqui por vocês para colocar aqui no cronograma das lives que a gente tá fazendo todas as terças às 8 Tá bom então isso é bem importante E além disso para quem se
inscreve na nessa lista de presença eh depois de umas 8 10 lives Inclusive eu acredito que já tá na hora de fazer a gente faz sorteios de Prêmios aqui então livros camisetas canecas eh mentorias o próprio curso da preditiva é bem legal daqui é divertido esse momento então faça aqui a sua inscrição na lista de presena Belê é isso pessoal bora lá então bom quem nunca viu aqui se sentiu nessa situação aqui né Você tá no meio de um monte uma enxurrada de técnica de ferramenta de palavra chave parece que cada hora aparece uma coisa
nova e você não sabe o que que você faz para qual caminho você segue né Então essa imagem aqui o nosso chat GPT criou aqui pra gente para representar esse momento né então tem uma infinidade de fato de caminhos de ferramentas de técnicas desde a coleta processamento interpretação do dado e é bem importante que você entenda como cada uma delas funciona Principalmente as técnicas base que é o que eu vou mostrar aqui para vocês que essas técnicas você vai aplicar em qualquer área de negócio então aprendendo elas você meio que aprendeu tudo né E aí
o restante é mais para você fazer complementos e melhorar a precisão no fundo no fundo é isso né E aí pessoal não sei se é claro para todo mundo não sei não eu tô sendo humilde aqui na verdade eu sei eu sei que não é claro pra maioria né então o que que não é claro a jornada dos dados certo o dado pessoal ele tá lá no sistema origem tá num banco de dados tá no aplicativo da empresa tá no sistema ERP tá no SAP tá né em qualquer parte aqui que captura dado E aí
esse dado a gente chama de dado bruto né É aquele dado que ainda não foi manipulado que ainda não foi eh extraído aqui do seu sistema origem não foi manipulada a ponto de nós das áreas de negócio trabalharmos com esse dado né E aí tem uma jornada o dado até gerar o diamante né então é essa analogia aqui de você ir lá e e gerar valor com o dado mesmo né porque o dado bruto é uma pedra bruta e aí você lapida ela até ela Virá uma uma pedra preciosa basicamente essa a analogia então gerar
valor com dados inclusive o nome do curso aqui da preditiva né formação gerando valor com dados é todo esse processo de você desde o dado bruto entender todas as etapas até você conseguir eh gerar valor com ele n e para gerar valor com dados pessoal Você tem o data Lake certo o dat Lake é o repositório onde dois times trabalham para eh criar né o primeiro time é o time de arquitetura de dados o arquiteto ele vai lá um profissional que ele planeja como dado será armazenado seu fluxo e e a segurança e aí tem
um outro time que fala olha agora que eu arquitetei como que vai ser tem um segundo time que são os engenheiros de dados que eles vão lá e vão pegar o dado que tava aqui ó no dado bruto e colocar dentro do data Lake ou data Warehouse existem vários nomes e estruturas de como que você armazena esse dado nas empresas certo e quando você armazena esse dado ele fica disponível para os times de negócio incluindo um analista de marketing um analista de de de operação analista de RH o advogado não importa a área e também
fica disponível para os analistas e cientistas de dados que são os profissionais mais especializados em dados então para tudo lembra todo profissional precisa aprender a analisar dados só que você não precisa ser um especialista se você não quiser você pode ser um analista de marketing só que versado em dados Então você é um analista de dados com potencial de analisar dados e conseguir gerar mais valor em marketing agora se você quer fazer uma transição de carreira você eh para você trabalhar especificamente resolvendo problemas de dados de todas as áreas você pode ser um analista de
dados ou cientista de dados então eu tô representando aqui esses profissionais nessas próximas etapas né o análise de dados análise de negócio ele desenvolve análises exploratórias e dashboards tá E você tem o cientista de dados que ele desenvolve modelos de estatísticos modelos de Machine learn Inteligência Artificial é geralmente o profissional que tá atrelado a essa etapa da jornada tá E aí depois você precisa criar um produto desses dados né e colocar eles para rodar então todos os profissionais os analistas de negócios analistas de dados e os cientistas de dados eles criam produtos e esses produtos
né Entra aqui na etapa de produtização E aí você pode tanto esses mesmos profissionais fazerem essa etapa ou tem empresas mais estruturadas do ponto de vista de times de dados que eles têm por exemplo o engenheiro de analítico e engenheiro de machine learning que ele vai lá e coloca para rodar Isso numa periodicidade que fica disponível para toda empresa por exemplo o seu produto Então são possibilidades aí dessa dessa galera trabalhando na jornada do dado então o dado bruto até ele virar valor existe aqui todo um caminho né para isso acontecer então isso aqui é
uma coisa importante de ser notado E aí depois pessoal a gente tem as engrenagens como cada um dos profissionais trabalham principalmente profissionais de dados ou profissionais analistas de negócio eles TM basicamente três engrenagens que precisam dominar com o tempo né A primeira delas é o que a gente chama das das engrenagens da técnica as técnicas são aquelas que respondem as perguntas de negócio quanto mais técnica você conhecer mais perguntas você vai responder e Claro mais valor você vai gerar então o que que é Técnica tabelas de frequência análise de correlação Matriz de correlação modelagem eh
segmentações visualizações Então tudo isso é técnica a gente vai falar aqui de várias delas na Live de hoje para você entender um Panorama de todas elas depois das técnicas quando você aprende elas você com o tempo precisa ser mais produtivo no uso dessas técnicas E aí que entra a engrenagem de ferramenta a maior parte das pessoas acredita que dados é ferramenta O que que a gente vive batendo na tecla aqui na preditiva talvez é uma das únicas ou primeiras escolas a fazer isso ferramenta pessoal gera produtividade ao responder mas o que responde pergunta é técnica
Então você percebe que você precisa das duas engrenagens não é tanto da técnica quanto do da das Ferramentas para que aí sim você responda a pergunta e vai respondendo com o tempo com produtividade então em ferramentas Você tem o Excel né um simples planilha eletr Google sheets Você tem o SQL para você manipular bases de dados que estão lá no dat Lake que estão no data Warehouse você tem linguagens como Python que é uma linguagem de programação Universal que você pode tanto criar sites aplicativos como também analisar dados né e criar modelos de machine learning
com ele você tem ferramentas de visualização como Power Bi e o tablô no Brasil é mais comum Power bi né você já deve ter feito um curso de power bi já deve utilizar na sua área você vê que tem vários influenciadores e cursos de power Bi por aí porque no Brasil né é a ferramenta de visualização mais utilizada nos Estados Unidos Por exemplo o tablô é mais relevante então se você tá buscando vagas internacionais talvez vha a pena você também estudar mais tablô em vez de só Power bi mas no fundo fundo quando você estuda
uma você meio que estuda todas né todas essas ferramentas de visualização são praticamente as mesmas Tá certo bom então quanto mais mais e ferramentas você conhecer mais produtivo você vai ser certo tão simples quanto aqui na preditiva né a gente orienta as pessoas a aprender tudo com o Excel no começo porque o Excel tá na máquina de todo o computador né na máquina de melhor de todo o gestor de toda a empresa não só o Excel mas o Google sheets e ele já tem tudo o que é mais importante para você analisar dados E aí
com o tempo você vai sofisticando né Depois você aprende o skl aqui na na na trilha depois você aprende Power Bi como ferramenta de visualização depois você aprende Python para você eh otimizar as suas rotinas e fazer análises mais automáticas eh você tem também outras ferramentas que eu não falei até agora como ferramentas de cloud como aws em que você tem as principais tabelas de dados as bases eh e também né e as aplicações estão lá na Cloud E aí com isso você precisa de alguma forma ter acesso a isso então também é mais uma
produtividade tudo isso pessoal faz parte da engrenagem de ferramentas só que falta uma né Qual é pessoal conheço técnicas conheço ferramentas a próxima engrenagem é a engrenagem do negócio não faz sentido você aprender tudo isso se você não ter o mínimo de conhecimento de negócio eu tô falando de conhecimento em marketing ou em Finanças ou em vendas RH ti operações ou qualquer outro negócio agronegócio advocacia né direito logística enfim todos nós de alguma forma quando trabalhamos nas empresas a gente vai aprendendo sobre o negócio da empresa Qual é o market share Qual que é o
cliente desse tipo de empresa Qual que é o produto que vende né Quais são os seus diferenciais dentro da empresa quais são os stakeholders né ou seja as partes interessadas quem é meu chefe quem são as áreas etc etc tudo que você conhece de negócio vai te ajudar a o quê pessoal a você gerar as hipóteses que você quer respondidas por dados O que que é uma hipótese é assim poxa caímos as vendas esse mês por que será será que é porque né Eh Será que é porque a gente aumentou o preço será que é
porque eh tem um novo concorrente no mercado Isso são hipóteses será que e aí que que você faz para você entender se é isso mesmo você extrai os dados a né E para extrair os dados Você usa as ferramentas e dado que você tem Eh esses dados você vai lá e aplica as técnicas para você responder e aí você retroalimenta o negócio com as perguntas respondidas através dos dados é basicamente isso né então quanto mais negócio você aprende mais você vai conseguir fazer as perguntas certas e entender a técnica que vai resolver o problema então
perceba pessoal que são engrenagens de uma grande máquina que não tem como andar separada você precisa conhecer negócio você precisa conhecer ferramentas e você precisa conhecer técnicas E como que você faz com que essas engrenagens elas funcionem como que as engrenagens elas funcionem em harmonia você precisa de um método de uma metodologia que liga os seus conhecimentos de negócio com as ferramentas e as técnicas que respondem as perguntas de negócio né isso a gente chama de metodologia de projetos de dados e Existem algumas metodologias de projetos de dados no mercado a mais consolidada né talvez
a mais utilizada em qualquer projeto com as suas adaptações é a chamada crisp dm e nas lives anteriores eu até falei um pouquinho sobre ela quando a gente falou de documentação para quem não viu o que que é o crisp DM é um método de seis etapas para você ligar tudo isso da que eu falei das engrenagens das técnicas das Ferramentas e do conhecimento de negócio Tudo começa com o entendimento do negócio mesmo né O que que eu quero resolver ou seja qual que é o objetivo quais depois são as premissas que eu tô usando
Existe algum risco envolvido nesse projeto que eu quero mitigar Quais são os custos benefícios dele o que que eu entendo como sucesso né Ou seja eu tô com um projeto Quero melhorar as vendas quero diminuir o custo da minha área Quero melhorar a experiência do meu cliente quero diminuir o ch ou seja tudo isso são projetos esses projetos eh você vai precisar usar dados para você conseguir tomar uma boa decisão criar um bom projeto tá e portanto se Val valorizado no mercado Porque é tão simples quanto quanto melhor projeto você cria e você resolve mais
valorizado fica o seu passe em termos de salário em termos de promoção crescimento de carreira N E aí né tudo isso você precisa fazer o entendimento dos dados aqui você tem que ter a descrição deles você precisa coletar fazer uma análise exploratória para você verificar a qualidade desses dados entender que dado que tem lá né Em cada uma pessoal dessas etapas você tem técnicas de ferramentas que vão te ajudar na coleta por exemplo você tem SQL por exemplo como uma linguagem de programação você tem aqui apis né geralmente disponíveis em linguagens como Python dá para
você usar o Power bi também para isso você tem formatos de arquivos como csv quando você usa um sistema e extrai esses esse esses dados para csv tem vários sistemas que fazem isso né você clica lá extrair exportar dados aí você vai exportar csv é uma etapa de coleta você tá coletando dado lá n tem outros formatos como por exemplo Jon tá você tem outros formatos como XML você tem formatos já estruturados como XLS e x que é da própria Microsoft n um arquivo de Excel Então tudo isso são ferramentas não é E aí análise
exploratória você tem técnicas aqui que entra por exemplo tabelas aqui que entra Nossa o garrancho tá grande aqui hein tabelas aqui que que entra por exemplo os gráficos que tem vários gráficos né vários gráficos aqui que você pode utilizar e cada gráfico serve para uma coisa aqui que entra por exemplo medidas como média mediana desvio padrão quartil né mínimo máximo e assim por diante certo então olha como as técnicas que são uma das engrenagens vão aparecendo dentro da metodologia de projeto de dados não é E aí você prepara esse dado você faz a limpeza dele
esse formato para deixar ele bonitinho preparado paraas técnicas que vão interpretar esse dado preparado não é aí a gente entra na etapa de modelagem ou na etapa da análise é aqui que você vai escolher a técnica estatística que vai resolver o problema e boa parte pessoal da Live que a a gente vai falar hoje a Live aqui que a gente tá aqui a Live 81 a gente vai falar sobre essa parte né ou seja Quais são as técnicas que vão lá e eh resolve um problema de negócio né ou seja Você tem uma hipótese Você
tem o dado e você quer entender né através de uma técnica aplicada de estatística por exemplo eh O que que o dado tá te falando né Ele tá te mostrando um comportamento algum padrão alguma concentração e tudo isso gera Insight para você falar Ahã caramba eu não sabia que tava assim eu não sabia que o faturamento da nossa empresa tava concentrado eh em 10% dos clientes né isso daqui é uma análise de concentração ou caramba eu não sabia que a minha empresa tinha basicamente cinco grupos de clientes e esse aqui é a característica de cada
um dos grupos Então pessoal são as técnicas né as técnicas que vão responder isso pr pra gente tá E aí depois claro entra na etapa de validação desse projeto e na etapa de Deploy que é a implantação né Então essas coisas eu já falei em outra Live não vou aqui me estender Mas é só para contextualizar todos vocês de que a gente tá nesse momento para entender melhor Quais são as técnicas que fazem parte aqui da metodologia e vão de fato resolver o nosso problema de negócio tá bom legal estamos junto tão entendendo pessoal né
Sabe aqui eh tá mais claro o que que a gente vai fazer hoje enquanto isso deixa eu dar uma olhadinha aqui como é que tá o chat para ver se já tem alguma pergunta fiquem à vontade por favor se é a primeira vez de vocês colocar no chat eu sempre dou uma olhada eh aqui e vou né respondendo o máximo que dá tá bom deixa eu ver aqui as pessoas falando aqui a primeira vez boa deixa eu ver aqui legal pessoal aqui falando de de api Legal tem aqui um alguém falando que usa de Analytics
para analisar desempenho Desportivo né Muito bom temos um aluno eh que é o Artur ele trabalha Se não me engano no Corinthians ele faz análise de dados lá pro Corinthians é muito interessante né ver como os jogadores se movimentam no campo Eh aí várias métricas né de número de escanteios número de faltas e tudo mais e ele tenta modelar né o desempenho dos dos dos profissionais É bem interessante bem interessante Gustavo aqui falando né análise de concentração sempre mostra alguns insights legais pra gente sem dúvida sem dúvida tá deixa eu ver aqui ó excelente introdução
a metodologia do pred É bem isso boa obrigado Ricardo isso aí legal pessoal bom então vou continuar aqui como que a gente escolhe então a técnica né Eh essa é uma pergunta que não é tão simples então a gente precisa de alguma forma separar as possibilidades de análise né é basicamente isso então para isso pessoal eu criei aqui um um fluxograma que você com esse fluxograma vai conseguir abrir muito a cabeça para tudo aquilo que você vai precisar fazer de agora em diante tá e muitas vezes você usava a técnica errada pro problema que você
tava usando espero que com esse fluxograma fique muito mais simples Tá certo vamos lá então tudo começa aqui o que que você precisa resolver se você precisar resumir e interpretar uma base de dados você primeiro tem que entender o seguinte eu quero resumir e interpretar o quê de uma forma unidimensional ou bidimensional né quando a gente fala Uni ou bidimensional unidimensional é variável a variável você tem lá uma tabela E aí eu já vou mostrar algumas das tabelas aqui que a gente vai usar essa daqui é uma tabela que eu já usei várias vezes aqui
nas lives uma tabela bem simples que é uma tabela para um dos projetos aqui aqui do da formação que é uma um projeto de RH né para quem é aluno da preditiva já sabe que tabela é essa aqui eu tenho a idade de funcionários a frequência de viagens deles a formação desse funcionário o estado civil salários uma indicação se o o funcionário ele faz hora extra ou não E se ele deixou a empresa no último ano tá então eu tenho aqui uma base que tem 170 funcionários E aí quando eu falo unidimensional eu tô falando
assim ó analisar variável a variável se você precisa resumir um conjunto de dados de forma unidimensional que todos nós fazemos isso numa num projeto você tá falando que você quer analisar individualmente cada uma das variáveis ou Colunas da sua base de dados né E para eh resolver de forma unidimensional a gente tem basicamente três grandes grupos de técnicas as tabelas de frequência a visualização de dados e as medidas resumo tá bom que que são elas pessoal deixa eu passar aqui rapidinho eh as medidas Eh Ou melhor a A análise unidimensional que envolve tabelas medidas e
gráficos é o que a maior parte de nós utiliza no dia a dia então tabelas de frequência em que eu conto as coisas gráficos né como f gerado gráfico de pizza gráficos de barras gráficos mais analíticos como esse daqui que é o chamado Box plot Então são as técnicas que se usa para esse tipo de problema tá vamos dar um exemplo aqui então nesse mesma nessa mesma tabela quando a gente fala de tabelas de de frequência no Excel que é o software que eu tô usando você tá falando de usar uma tabela dinâmica né que
você seleciona todos seus os seus dados clica em inserir tabela dinâmica isso daqui você já tá criando uma tabela certo e nessa tabela pessoal você faz resumos então por exemplo se eu quiser entender qual que é é por exemplo a média de salário entre por exemplo a formação dos colaboradores é só arrastar aqui formação pra parte de linhas salário paraa parte de valores e aí eu clico o botão direito e mudo a minha medida de agregação né ou função de agregação no caso aqui ele tá somando eu quero que ele tire a média né que
Inclusive a média é uma medida resumo mais uma técnica para você resumir os dados mas tá aqui né posso ordenar aqui por exemplo do maior para o menor e pronto eu tenho uma tabelinha muito simples que eu tenho a média de salário entre as formações dos colaboradores naturalmente quem tem doutorado ganha mais e quem tem ensino médio é o que ganha menos nessa empresa então uma visualização dessa pessoal você já tá resolvendo um problema você já tá E qual problema é esse é o problema de você saber qual é a distribuição de salário entre as
formações E aí a coisas desse tipo você faz em todo lugar né você cria uma tabela essa tabela faz agregações somas contagens né concentrações e pronto você tem aqui boa parte do trabalho feito né de análise unidimensional certo você tem visualizações então criar Box plots histogramas que que se isso que que é isso né são gráficos analíticos gráficos que você consegue ter uma ideia da distribuição dos seus dados então por exemplo eu quero entender como é que é salário dessa empresa eu vou dar um cont control c aqui ó colocar salário numa outra planilha o
que que eu vou fazer vou clicar aqui no inserir né Eh histograma aqui dentro do do Excel e ele já monta pra gente um um um histograma de salário vou até dar um nome aqui ó histograma de salário e você que nunca viu um histograma ele é diferente do gráfico de barras o gráfico de barras ele coloca lá e você faz contagens um histograma ele cria para você uma faixa de valor então aqui embaixo por exemplo ele tá mostrando uma faixa de valor Olha só ele tá mostrando números que vão de 1000 a 2400 que
esse Qual número é esse é o salário das pessoas né então ele tá falando qual é a quantidade de pessoas que ganham de 1000 a 2400 Qual é a quantidade de pessoas que ganham de 2400 a 3 1800 E aí aqui no Excel como qualquer software e que você faz visualização de dados você pode clicar com o botão direito adicionar aqui o rótulo e ele te dá a contagem pronto pessoal você em questão de segundos tem uma análise de concentração por quê Porque o histograma ele te dá distribuição de como que essa variável no caso
salário está distribuída entre essa empresa então é natural né ter um comportamento como esse a maior parte das pessoas de uma empresa ganha menos e a eh certo a maior parte das pessoas de uma empresa ganha menos e poucas pessoas da empresa gerentes né geralmente a liderança ganha mais não é então esse daqui é um comportamento de variável muito comum na sociedade quando a gente fala de renda a maior parte dos brasileiros ganha né salários até R 3.000 né e pouco pouquíssimos brasileiros ganham salários acima de R 3 R 4000 tá então é bem condizente
com a sociedade que a gente vive certo e qual é a técnica que eu escolhi para resolver esse problema de negócio que eu tô chamando de entender a distribuição de Salários da empresa Qual é a técnica escolhida foi aqui o histograma o histograma já te deu esse tipo de insite você poderia também criar uma tabela que agrupava essa esses valores em cada um dos agrupamentos você vai lá e faz uma contagem né você poderia também criar as medidas resumo Que medidas são essas média que é a a uma medida de tendência central da estatística ou
seja Ela te dá uma tendência de qual é o valor Central se a gente olha aqui o o histograma O que que a gente acha de salário que tá no centro né ou melhor qual é o salário que tá mais ou menos significar o centro do conjunto de dados Será que é o salário que tá aqui ó no meio ou será que ele é ponderado pela maior parte das pessoas que ganham menos né tudo isso São perguntas que as medidas resumo respondem então se eu tenho aqui por exemplo né a média é aquela que você
já fiz várias vezes na sua carreira no Excel né coloca uma função média seleciona todo conjunto de dados e pronto tá esse valor aqui é a média de salário entre os colaboradores O que que significa significa que 6500 é a tendência central de salário dessas pessoas e aqui no histograma onde é que tá e 6500 pessoal onde é que tá o 6500 consegue enxergar aí o 6500 Está mais ou menos nessa banda né esse daqui é o 6500 mais ou menos Olha que interessante esse daqui é a média né esse daqui é a média só
que qual que é o problema eh essa média ela não é exatamente o meio do conjunto de funcionários dessa empresa não é Ou seja 50% dos colaboradores estão pra esquerda 50% dos colaboradores estão pra direita não né porque a média ela tá mais à esquerda ela foi influenciada por valores aqui à esquerda e quais são esses valores aquela grande massa de funcionários que ganha valores abaixo de 6500 não é e se eu quisesse pegar o valor né e entender o valor Central é aquele que tá mais ou menos aqui ó no centro do conjunto de
dados né e visualmente claro né porque não é exatamente aqui o centro certo o centro né é considerando todos os funcionários então o centro também vai est aqui ao redor disso como é que eu faço n Eu tenho que escolher outra medida uma medida chamada mediana e a mediana aqui no Excel eu uso a função M vou lá seleciono todos esses valores dou um enter e olha só que interessante a mediana que é uma medida Central é aquela que separa 50% dos dados pra esquerda e 50% dos dados pra direita a mediana é menor do
que a média Olha só enquanto a média deu 6500 a mediana deu 4919 por que isso vocês sabem me dizer isso aqui é uma pergunta muito simples para quem já estudou estatística básica mas mesmo assim a maior parte das pessoas não sab é natural porque a gente não não vê isso com muita frequência né Por que que a mediana tá mais ou menos aqui né Essa daqui é a mediana Por que que a mediana tá mais ou menos aqui e a média tá pra direita porque a média pessoal o que que acontece a média ela
é influenciada por valores discrepantes esses valores que estão aqui ó são de pessoas que ganham mais do que R 16.000 E essas pessoas estão puxando a média para cima e quando ela puxa a média para cima porque a média é uma medida influenciável ela tá tirando né a informação que você gostaria de obter Então olha a importância de você calcular medidas mas não depender só das medidas Mas você olhar o gráfico Porque sem o gráfico você não consegue entender mais ou menos Como é que tá a distribuição desses dados né Então olha quanta quanta teoria
pessoal né e prática eu tô falando para vocês só na no primeiro conjunto de técnicas de você entender as medidas resumo para você de fato né Eh junto com os gráficos de fato entender como que a sua variável está distribuída como que isso daqui de alguma forma representa né a a realidade dos dados da sua área da sua empresa do tipo de de negócio que você atua e tudo mais tá então igual o Gustavo falou aqui né o salário do diretor puxou a média para cima aí com certeza tá então esses valores muito acima ou
muito abaixo a gente chama de outliers tá então os outliers são justamente esses valores que são muito diferentes dos outros e eles acabam puxando a média para cima ou para baixo certo isso é bem bem importante Então pessoal isso daqui eh faz parte da análise unidimensional uma análise unidimensional usa tudo isso que eu mostrei tabelas né que eu mostrei Como cria gráficos que podem ser gráficos analíticos Eu não mostrei o boxplot né mas eh mostrei o histograma boxplot é um outro gráfico bem legal e as medidas que junto com os gráficos elas te dão um
real uma real noção do do seu conjunto de dados em Todo projeto O que que a gente faz a gente faz essa mesma análise em todas as variáveis você faz aqui essa análise por exemplo para idade para salário quando são variáveis numéricas né mas se não for variáveis numéricas variáveis que T texto como essa você faz contagens né da mesma forma que eu fiz agora a pouco eu poderia simplesmente clicar com o botão direito em vez de simplesmente tirar a média de salário eu poderia fazer uma contagem Pronto agora né não é contagem de salário
mas simplesmente Contagem né eu tô contando quantos colaboradores tenho nessa empresa por eh por formação certo Então olha só eu tenho 48 funcionários doutorado e a grande maioria dos funcionários ou tem ensino superior ou tem mestrado por exemplo tá Então olha só é uma variável essa daqui é uma variável de texto que terminologia de dados a gente chama de variável qualitativa certo uma variável qualitativa a técnica para você resumir essa variável é você fazer contagens e claro né Depois dessas contagens você consegue criar gráficos que usam essas essas contagens né Por exemplo aqui do lado
que aí a gente faz um gráfico bem simples aqui no Excel fazendo essas contagens eu tô usando o Excel pessoal que é o mais simples né de você fazer aqui ir brincando com dado mas você poderia fazer isso no power bi no tablô em alguma linguagem de programação como Python eh a linguagem a ferramenta fica gosto do freguês o importante é você usar a técnica que vai interpretar o dado para você entender o que que tá dentro do seu dado E com isso entender o seu negócio né No fundo no fundo é isso daí tá
certo bom pessoal isso só paraa análise unidimensional mas o conjunto de várias técnicas que se usa né nos projetos a gente não faz só análise unidimensional a gente faz também análises bidimensionais O que são as análises bidimensionais são aquelas análises em que você quer olhar o comportamento conjunto de duas variáveis Então quando você quer entender como uma variável tá relacionada com a outra você precisa aplicar as técnicas de análise bidimensional que no mercado são basicamente três existem mais tá mas as que mais são utilizadas é a correlação de pearson o coeficiente de determinação e o
information value tá aqui do lado eu tenho um exemplo bem simples do que que seria eh uma análise de de uma análise bidimensional gráfica e aí a gente poderia usar o correlação de pearson para quantificar o quanto esses dados estão correlacionados já ouviu falar dessa palavra um dado correlacionado é um dado que quando um aumenta o outro também aumenta ou quando um aumenta o outro diminui eles estão correlacionados né e a gente consegue medir essa correlação então voltando aqui no nosso exemplo se eu quisesse entender como que idade e salário estão correlacionados hein que que
eu deveria fazer tá eu tenho que escolher uma técnica que vai resolver esse meu problema eu quero entender se idade e salário estão correlacionados a primeira coisa que a gente vai fazer é uma análise chamada de dispersão você seleciona os dois dados clica inserir eh aqui no Excel clique em dispersão Então pronto agora ele tem aqui ó na parte eh no eixo X Ele tem a idade e no eixo Y ele tem o salário Vamos colocar isso daqui ó melhorar esse esse gráfico vou dar uma adicionada aqui em rótulos eh títulos do eixo então o
horizontal que é esse daqui é a idade certo coloquei aqui e eu vou colocar também um outro título de eixo na parte vertical que esse daqui é o salário certo boa e esse daqui é o qu pessoal é a dispersão de idade com salário Então essa é a análise que a gente tá fazendo aqui né O que que já dá para entender aparentemente quando eu vou aumentando aqui a idade tem uma galera que eu aumento o salário também né tão conseguindo perceber isso eu posso até clicar com o botão direito colocar aqui uma adicionar uma
linha de tendência no Excel e o Excel ele cria pra gente essa essa linha de tendência vou colocar ela aqui em vermelho eh e aumentar aqui um pouquinho a espessura para vocês enxergarem ão vendo aqui deixa eu diminuir aqui um pouco a bom então tá aqui né perceba que com essa linha de tendência Você já consegue ver que aumentando a idade geralmente geralmente você aumenta o salário não é para todos mas uma galera tem essa correlação dá para medir essa correlação dá e aí a gente usa mais uma técnica uma técnica é a chamada correlação
de pirson a correlação de peon é uma técnica estatística que te dá um número entre -1 e 1 e esse número pessoal ele te dá uma ideia do quanto esses dados Eles estão correlacionados no Excel a gente usa uma função chamada correl nesse correl você vai lá seleciona o seu primeiro conjunto de dados que tá aqui idade aí você dá ponto e vírgula e seleciona o seu segundo conjunto de dados esse aqui ó que é o de salário tá certo Dá um enter ele vai lá e calcula pra gente nesse nesse caso a correlação de
piron entre idade e salário foi de 0,50 significa que essa é uma correlação média né correlações próximas de um são correlações muito fortes correlações próximas de men1 são correlações muito fortes porém negativas então aqui a gente tem uma correlação positiva porque esse número não tá eh negativo certo é uma correlação positiva e significando que eh a correlação entre idade e salário é média nessa empresa então aparentemente eh existe sim um grupo de pessoas que quando você aumenta a idade você aumenta o salário e o que a gente entende de mercado é mais ou menos isso
que funciona né quando você tem uma idade maior se você fez uma boa gestão de carreira geralmente você é um gerente geralmente você é um superintendente um diretor E aí com isso você vai ter um salário maior tá então a experiência de carreira e por consequência a sua idade foi aumentando a ponto de você ter um aumento salarial contínuo na sua carreira né ou mesmo que você tenha ficado no mesmo cargo mas depender da empresa você tem dissídios que são aqueles aumentos de salário que acontecem anualmente também né vai passando tempo vai aumentando o salário
então as técnicas estatísticas só mostram aquilo que você tá entendendo do seu negócio então tudo isso que eu falei é são hipóteses por conhecer o negócio Qual o negócio o negócio de como que funciona a economia de salários na sociedade né então você tem uma hipótese você usa né as técnicas de análise de dados Como por exemplo o gráfico de dispersão e a correlação de peon para você fazer o quê pessoal para você verificar se essa hipótese é verdadeira né não dá para dizer algumas coisas aqui como por exemplo causalidade que é uma outra parte
aqui da análise de bid ional que eu não mencionei antes tá relacionado ao quê OK que os dados estão correlacionados Mas será que um causa o outro a gente já falou sobre isso em uma das lives aqui da preditiva depois busca lá Live de análise de associação e correlação a gente falou sobre isso né causalidade é um dos grandes problemas que se você não tomar cuidado você pode tomar uma decisão errada Tá certo então é importante lembrar sobre isso que mais que a gente tem a gente tem coeficiente de determinação que que é o coeficiente
de determinação ele é uma técnica que também bidimensional e ele tenta responder a seguinte pergunta olha será que eh o por exemplo Será que estado civil e e salário tem muita diferença ou melhor tem tem uma associação entre estado civil e salário Será que existe uma associação por exemplo entre idade e e formação dessa pessoa Será que existe uma associação entre idade e estado civil Então essa daqui é uma técnica que te dá também um número eh que vai de zero a 100 e ela vai lá e fala o quanto que essas duas variáveis uma
de número e a outra de texto o quanto que essas variáveis estão relacionadas né Isso é bem bem interessante E aí por fim pessoal uma que eu vou mostrar aqui para vocês que eu sempre mostro dado o quão poderoso essa técnica é o information value o information value é aquela técnica que também tenta te dar uma ideia de como que uma variável tá relacionada com outra mas geralmente uma dessas variáveis é uma variável que é de sim ou não zero e um uma variável binária que a gente chama né então por exemplo Será que eh
a frequência de viagem tá relacionada com o comportamento do funcionário deixar ou não a empresa a gente poderia pegar aqui ó Nessa essas duas variáveis deixa eu jogar aqui numa nova planilha tá E aí a gente pode criar uma tabela eh uma tabela dinâmica para fazer algumas contas né Vou colocar aqui ó do lado certo e aí eu vou pegar funcionário deixou a empresa colocar aqui na parte das colunas e a parte de frequência de viagens na parte das Linhas certo olha lá o que que nós temos aqui vamos dar uma melhoradinha nessa tabela aqui
então Esso daqui aqui é por exemplo turnover né ou simplesmente o comportamento de o funcionário deixar na empresa esse daqui ele não deu turnover e esse daqui ele deu sim certo essa daqui é a frequência frequência de viagens e aí eu tenho as pessoas que não viajam as pessoas que viajam raramente e as pessoas que viajam frequentemente eu até dei uma ordenada aqui nessa variável E aí pessoal O que que a gente pode fazer vamos pegar aqui a frequência de viagens eu vou colocar aqui na parte de valores agora com isso ele faz uma contagem
né Isso aquii é uma contagem Então eu tenho nessa empresa 1470 funcionários dentro desses 1470 1443 viajam raramente 150 não viajam e 277 viajam frequentemente a pergunta é será que frequência de viagem tá relacionada com o maior ou menor turnover A análise de v faz isso pra gente né então como é que ela funciona rapidinho aqui eu calculo percentual de n calculo percentual de Sims tá o percentual de n é o qu é a frequência relativa de pessoas que não tiveram turnover então eu pego aqui ó 138 e divido por esse total que tá aqui
embaixo certo deixa eu dar uma uma travada aqui na referência no Excel E aí eu tenho um percentual depois eu arrasto tudo isso para baixo olha como que ficou a fórmula tenho aqui a frequência a frequência relativa certo deixa eu deixar aqui dessa forma aqui depois vou arrastar para cá para pegar o Sims Então olha só como ficou o percentual relativo de Sims Beleza então o que que eu sei aqui eh a frequência relativa de nãos e Sims para turnover nessa empresa por que que é isso importante vocês vão entender próxima coisa que eu posso
calcular dentro dessa análise é a taxa de turnover Será que tem uma taxa de turnover diferente entre as frequências de viagem é simples né calcular Isso é só pegar aqui um igual todo mundo que deu turnover divido pelo total de pessoas dessa categoria dou um enter E aí eu tenho aqui o percentual 8% 15% 25% Olha que interessante que a média geral é 16 posso até colocar aqui uma formatação condicional né para visualmente ficar mais fácil enxergar Então olha que interessante pessoal nessa base né de colaboradores 16% das pessoas deram um turnover só que olha
só de quem viaja frequentemente o turnover foi de 25% muito superior ao turnover Geral de funcionários e aqui ó quem não viaja teve um turnover de oito isso já me levanta o quê pessoal uma hipótese de que caramba Será que a frequência de viagens então não está provocando um stress a ponto das pessoas pedirem mais demissão então isso olha como os dados bem interpretados com a técnica certa que é essa daqui a técnica chamada de Information value que é essa estrutura de tabela que eu tô mostrando olha como ela mostra para você uma série de
hipóteses que você levantando com as suas áreas de negócio falando lá com RH etc você traz insights muito reveladores tá você poderia a partir de agora fazer uma pesquisa e entender com as pessoas que viajam e que não viajam se são estressadas o que que tá acontecendo porque elas estão pedindo demissão tá E aí não terminou né Essa a maior parte da análise é essa E aí o que o que que é o IV o IV pessoal é uma é uma é um cálculo que a gente faz aqui ó do ladinho da tabela e esse
cálculo ele é basicamente você pegar o percentual de Sims subtrair com percentual de N E aí você multiplica usando uma funin aqui ó chamado LN tudo isso daqui pessoal é detalhes vai estar gravado né lá na plataforma da predi você virando aluno sabe que isso aqui tá no detalhe né explicado passo a passo você pega aqui o percentual de ss div pelo percentual de NS E aí você tem um valor esse valor não é um percentual é um valor geral mais ou menos como esse certo você arrasta a fórmula para todos os os os posteriores
E aí você tem uma métrica chamada de IV total e o IV Total pessoal é a soma dos ivs anteriores Olha só esse V que deu aqui é um IV médio né E por que que é médio Porque existe um benchmark dessa métrica de IV da mesma forma que as outras métricas têm um benchmark ou seja correlação de pearson quanto mais próximo de um mais correlacionados positivamente os dados estão quanto mais próximo de os1 mais correlacionados negativamente os dados estão eh o IV também tem o seu quanto maior é o IV mais essa variável está
relacionada está associada com a sua variável eh eh de interesse então aqui é médio significa que frequência de viagens tem um grau de associação médio com turnover portanto é uma variável importante que você tem que fazer um plano de ação e mostrar lá fazer uma apresentação pro RH falar olha RH toma cuidado porque a frequência de viagens ela talvez precisa mudar se você não revê essa política você tá trazendo muito turnov para os grupos que viajam dentro da empresa principalmente para grupo que viaja raramente Então pensa o grau de Insight que você consegue colocar pessoal
no seu projeto na área que você atua não importa a área toda a área você consegue fazer uma análise como essa e aí você repete essa análise para todas as outras variáveis você faz isso rapidamente né dá um cont contrl ctrl v aqui na parte de frequência tira a frequência vai lá coloca a próxima variável e vai repetindo aqui todo essa análise a ponto de você conseguir olhar como que que frequência e como que formação impacta com o funcionário Como que o estado civil impacta com o funcionário deixa a empresa como que a hora extra
impacta com o funcionário deixar a empresa e aí você faz essa análise bidimensional com todas as variáveis isso vai gerando cada vez mais Insight para você ir lá e tomar uma decisão fazer uma apresentação paraa sua área cliente consiga promover mudanças né através dos dados é isso que é valor é isso que faz a diferença perceba que nesse caso eu não fiz nenhuma nenhum gráfico eu só fiz uma tabela n e essa tabela quando bem interpretada com a técnica certa vai gerar a informação que você precisa tá bom Tudo bem pessoal então estamos aqui em
análise bidimensional dúvidas como é que estamos aí pegaram aqui tô fazendo um apanhado geral Claro n das principais técnicas mas só aqui olha o que que você conseguiu resolver você conseguiu resumir e interpretar qualquer base de dados só aqui você já consegue com essas técnicas de análise unidimensional e bidimensional fazer tranquilamente 60 a 70% de projetos de dados se baseiam nessas técnicas aqui aí a ferramenta você vai usar a ferramenta que você sabe utilizar ferramenta que te gera produtividade e tudo mais mas fazendo essas análises Você já consegue gerar muito valor coloca no chat aqui
pessoal tá claro deu PR entender esse esses pontos antes daí a gente ir pras próximas técnicas deixa eu ver como é que estamos aqui no chat Aqui ó estou nessa fase de aprendizagem na preditiva análise bidimensional boa Juliana é isso A então já um spoiler aqui né Ó o json falando ó importante lembrar que correlação não necessariamente gera causalidade É isso aí é aquilo que eu tava falando né o IV só é aplicado para variáveis binárias sim Juliana sempre que você tem uma variável binária sim ou não comprou ou não comprou cliente doente não doente
clicou no anúncio ou não clicou isso são variáveis binárias sempre que você tem uma binária você consegue cruzar com qualquer outra variável dentro daquele daquilo que eu falei você pega a variável coloca do lado cria aquela tabela gera o IV e você consegue analisar né o Gustavo aqui perguntando também o iv1 é considerado médio também sim geralmente é de 1 a 03 é médio de 03 a 05 é forte acima de cinco muito forte é basicamente isso Gustavo é isso aí aqui o Gabriel né tomem cuidado com a média se colocar sua cabeça no forno
e seu pé no congelador a média vai falar que você está tudo bem né É verdade iso é uma boa is é uma boa analogia né faz muito sentido faz muito sentido legal sim muito interessante boa eh aqui o Vitor professor não teve a necessidade de calcular a odes nesse nesse dessa vez bem legal sua pergunta Ô Vittor eh essa análise aqui pessoal eh a Tem uma parte né de algumas versões dessa tabela que a gente calcula uma coisa chamada ods e o que que é a ods é simplesmente você pegar o percentual de Sims
e dividir pelo percentual de NS né eh e aí vitor essa ods já foi calculada diretamente aqui ó quando eu cheguei aqui ó nessa parte é a ods se eu pegar aqui ó e dar um igual ao que tá aqui né ele já vai chegar no mesmo valor Tá bom eu já calculei a ods diretamente na fórmula do IV tá dos dados mesmo imagina Leonardo Obrigado aí pela presença deixa eu ver aqui ó Qual é o Range de v o que é IV alto Médio e baixo mich perguntando então deixar claro aqui pessoal ranges de
v e vs baixos baixo então é menor do que 0 pon 0 02 tá menor isso aqui médio é pode considerar aqui de 01 a 0,3 por exemplo tá forte de 0,3 a 0,5 muito forte a ponto de você tem que dar uma olhada for acima de 0,5 para ver se você não calculou alguma coisa errada então aqui ó de 02 a a 01 né para ficar com coerente com com os ranges aqui esses são os ivs pessoal tá bom fica aqui então para vocês terem essa referência tá vocês podem olhar aqui o livro Por
exemplo do sidic sidic é um que que fala sobre os ivs tem também o Laredo então tem né alguns autores aqui que falam sobre autores que falam sobre o IV tá bom para vocês não acharem que eu tirei isso daqui dos meus botões né tem toda uma literatura ura que traz esse tipo de informação tá certo boa Marcelo perguntando como explicamos essas técnicas que usam estatística para pessoas menos técnicas explicar o que significa essa fórmula LN no formato tem gestor que não gosta de análises muito técnicas Marcelo é aqui que você tem que desenvolver o
seu storytelling é aqui que você tem que desenvolver o seu deira storytelling né ou seja storytelling com dados é inclusive né neste no próximo mês a gente vai lançar uma nova formação aqui na na escola que essa formação não melhor um módulo dentro da formação gerando valor com dados que a gente vai falar só sobre storytelling né então não sei se você é aluno se não for já saiba que quando você entrar vai ter essa formação para você esse esse esse curso dentro da plataforma para você entender mas basicamente é o seguinte a gente tem
que traduzir essas técnicas para a interpretação de negócio né então aqui a gente não vai falar de ods aqui pouco importa mas a gente vai falar o quê olha gestor eh essa eh essa variável ela tem um poder médio de associação com o turnover a ponto de você ver que tem que tem categorias como a viaga frequentemente que tem 25% de quê De turnover enquanto tem outras que tem 88% né Então tudo isso você vai fazendo é esses tipos de stelling que ajuda bastante o time de negócio a a entender né o dado que tá
lá o edz aqui ó excelente conteúdo boa obrigado o Marcos o IV é utilizada para modelos de classificação boa Marcos boa bo boa pergunta ou afirmação né e o IV ele é uma etapa Inicial que vai te ajudar inclusive quando você criar modelos de classificação para você saber se o modelo ele ponderou certo as variáveis mais importantes Porque se o seu IV tá alto e lá do modelo de classificação o e a variável ficar muito muito baixa né a importância da variável ficar baixa tem algum conflito aconteceu algum problema no seu modelo que ele não
capturou do jeito que deveria capturar né então tem esses esses detalhes aí tá muito bom o Marlon perguntando V no caso se eu quisesse aplicar o IV para variá frequência de viagens por exemplo não é recomendado eu não não é recomendado eu não entendi essa parte eh no caso se eu quisesse aplicar o IV para variar frequência de viagem mas é que eu apliquei aqui eu não sei se entendi sua pergunta Marlo não é recomendado não é recomendado sim você entendeu eu falei não recomendado se eu falei desculpa não é isso não tá a a
Dani aqui né stelling Amei isso aí deixa eu ver aqui o sou graduado em comex porém não tenho conhecimento avançado em Excel esse curso da preditiva é uma boa ou Preciso melhorar mais com certeza é uma boa né ele já tem tudo aquilo que você precisa para que você consiga anal ar dados em qualquer situação tá Não precisa ter conhecimento avançado no Excel até porque o Excel tem um módulo que a gente vai do básico ao nível necessário para você conseguir analisar dados tá e é isso aí ó a própria cin aqui respondendo tá bom
legal Maravilha pessoal vamos continuar aqui então que tem bastante conteúdo ainda hein Bora lá legal falamos aqui sobre as técnicas né de eh de resumo do conjunto de dados certo é por que não tá pera aí que deu um bug agora foi então o que que faltando agora bom esse aqui é o grande grupo de técnicas que são necessárias pra gente resumir e interpretar conjuntos de dados mas a gente tem mais projetos mais problemas de negócio que as técnicas tem que resolver o próximo seria atribuir probabilidade a um evento do nosso interesse para isso a
gente vai usar a teoria frequentista certo então o que que é a teoria frequentista pessoal é quando eu quero prever o o acontecimento de algum evento certo eu quero prever a inadimplência eu quero prever chne quero prever turnover quero prever vendas da minha no meu planejamento financeiro comercial e aqui a gente tem várias técnicas né dentro da teoria frequentista que é modelo de probabilidade machine learning tá tudo dentro da teoria frequentista mas o mais importante é você entender o conceito certo e qual que é o conceito pensa nesse exemplo aqui que eu sempre dou esse
exemplo porque é muito simples de você entender imagina que você tá lá no e-commerce e como qualquer mercado e de varejo ou comercial melhor dizendo você tem um funil de pessoas né então você tem aqui os visitantes do site algumas pessoas vão lá e vão pro carrinho de compras e algumas pessoas que vão para carrinh de compra vão lá e compram né então o que que eu tenho aqui pessoal nesse exemplo eu tenho 10.000 clientes que entraram e se 1000 clientes foram para carrinho de compras eu tenho uma taxa aqui né que é a taxa
de checkout então 10% aqui dos meus clientes viraram foram pro carrinho certo e desses 1000 clientes que foram pro carrinhos imagina que 300 compraram desses 300 eu concluo que a taxa de conclusões de venda no carrinho é de 30% pessoal como que eu calculei essaa Ach muito simples é pegar aqui ó 1000 pessoas que foram pro carrinho e dividir por as 10.000 pessoas que estavam na etapa anterior isso daqui dá 10% e esses esses 30% aqui são os 300 dividido por os 1000 que estavam na etapa anterior isso aqui é o 30% certo eh o
que que são essas taxas dentro da estatística pó essas taxas são frequências né Ou seja é a frequência de clientes que foram para o carrinho aqui é a frequência de clientes que compraram frequências são eh formas de você calcular a chance a probabilidade do evento do seu interesse então se eu quisesse calcular Qual é a chance de um cliente comprar o meu produto dado que ele foi visitante do meu site como é que eu isso dado uma pessoa que entra no meu site Qual é a chance ou a probabilidade dele lá e comprar o meu
produto é só você pegar os 300 são as pessoas que compraram e dividir o por todo mundo que entrou os 10.000 n Então qual que é a chance aqui pessoal fazer a conha aqui de de cabeça a chance é 3% 3% de taa de conversão né de conversão beleza V é tão simples assim Pior que é né A Teoria frequentista pessoal é a técnica estatística que te dá uma forma de você calcular a chance de ocorrência do evento o evento aqui que eu tô interessado é o evento da pessoa comprar o meu produto dado que
ela virou eh que ela foi visitante do meu site e aí quando você faz esses cálculos você calcula a Teoria frequentista no nosso caso aqui por exemplo do turnov E se eu quisesse calcular a chance do do funcionário da turnover de acordo com a sua formação era só eu ir lá e calcular né quantos deram no caso aqui quantos deixaram a empresa pelo total de pessoas Então é muito simples eu chegar aqui fazer aqui uma uma tabelinha de de frequência eu pego aqui né por exemplo a do colaborador pego se ele deixou a empresa sim
ou não faço as contagens então ess aqui é uma contagem feita certo Lembrando que é turnover essa aqui é a quantidade e aí ó probabilidade probabilidade de deixar a empresa Qual que é a probabilidade do funcionári deixar a empresa é basicamente acia histórica que esse colaborador teve na empresa então eu pego aqui ó quantidade de Sims divido pelo total da categoria n Então olha só eu tenho aqui ó 10% para quem tem doutorado 18% para quem tem ensino médio né e eu tenho aqui um Total Geral de 16 vamos colocar aqui uma corzinha para ficar
mais fácil de de enxergar e ao contrário né olha só para quem tem ensino médio e ensino superior eu tenho uma probabilidade de deixar a empresa maior do que outras categorias por exemplo quem é aqui de doutorado é a categoria que tem menor chance de deixar a empresa então vocês viram que na análise do IV meio que a gente já calculou isso perceberam pessoal então a probabilidade nada mais é do que você usar dados do passado para você prever o futuro já ouviu falar numa questão numa técnica chamada análise preditiva análise preditiva é justamente isso
é você usar a frequência o comportamento do passado para você ir lá e falar olha se o futuro se comportar como o passado se comportou Esse é o meu melhor chute E aí você simplesmente usa esses percentuais como é a o seu melhor chute pro que vai acontecer então olha como é muito simples isso né quando você pega livros de estatística você vê lá as distribuições a normal uniforme T student tudo aquilo pessoal nada mais é do que usar frequência passada para você modelar essa frequência passada e com isso prever a frequência futura tá isso
é bem importante você entender porque tem muita gente que surpreende não Ah Duvido que é só isso pessoal é quando a gente usa machine learning por exemplo machine learning tá fazendo de uma forma mais sofisticada essa esse conceito fundamental né que você tem que tomar cuidado porque existem algumas particularidades essas particularidades não dá para falar aqui numa Live de 2 horas né por isso você tem que ir lá estudar lá na nossa plataforma eu falo Quais são as particularidades que você precisa entender para você usar isso no seu planejamento comercial no Marketing e várias outras
áreas para você usar da forma correta esses percentuais Mas isso é bem bem importante você entender tá bom legal que mais pessoal Então olha só já sabemos as técnicas para você resumir o conjunto de dados agora eu também sei a principal técnica usada pra gente atribuir probabilidade de chne probabilidade de inadimplência probabilidade né do meu cliente comprar o meu produto tudo isso você usa frequência passada né para você prever frequência futura certo e agora o próximo grupo de técnicas é aquele grupo que você quer fazer uma uma estimativa tá Eu quero estimar um valor na
população certo aqui pessoal eh esse valor né que você quer estimar ele Depende de outras variáveis se sim Você precisa entender esse valor que você quer estimar ele é numérico se ele é numérico Sim você precisa ir lá e usar uma regressão linear múltipla Essa é a técnica que você precisa escolher para esse tipo de problema tá bom então a técnica de regressão linear múltipla ela estima um valor na população e ela Depende de outras variáveis e o valor que eu quero estimar é um valor numérico Tá certo vamos olhar aqui rapidinho como é que
funciona então eu tenho aqui por exemplo uma outra base de dados ISO aqui é uma base de dados também eh que a gente usa nos projetos é uma base de dados de saúde eu tenho aqui o custo do plano de saúde de um determinado funcionário eh mostro se esse funcionário ele é fumante Qual é a quantidade de filhos qual é a o índice de massa corpórea ou IMC desse funcioná e a idade Será que idade IMC quantidade de filhos e se ele é fumante está relacionado com o custo de saúde será que eu consigo estimar
o custo de saúde de um funcionário de acordo com a idade o Mc a quantidade de filhos etc Vamos ver isso agora através de uma técnica chamada regressão linear múltipla como é que ela funciona eu preciso vir aqui e converter tudo que é texto em número tá então eu vou colocar aqui ó fumante Vou Colocar assim ó num de numérico ou colá numérico mesmo né fumante numérico e vou usar uma função C aqui do Excel se esse valor aqui do lado for igual assim então ele vai ser o valor um e zero caso contrário Tá
bom então essa aqui é a função Zinha C do Excel para trazer essa informação pra gente agora eu vou arrastar tudo isso para baixo certo arrastei para baixo pessoal ó agora eu tenho uma uma variável que é a mesma coisa dessa variável daqui só que agora ela tá como numérica tudo bem isso é importante bom no Excel aí vai depender do software que você usa cada software faz de uma forma mas no Excel a gente vem aqui em dados Aí eu clico aqui em análise de dados vai ter uma opçãoincorreta para aquelas variáveis do nosso
interesse Eu quero fazer uma Estimativa de uma variável numérica então eu venho aqui ó e seleciono toda essa variável aqui ó Tá bom vou até lá embaixo Beleza depois ele pergunta qual que é a variável x ou intervalo de x x são as variáveis numéricas que estão relacionadas que eu quero ver né se estão relacionadas com a minha variável Y então eu venho aqui ó e seleciono idade Mc quantidade de filhos e fumante numérico até lá embaixo Beleza depois aqui eu marco a opção rótulos porque eu selecionei os rótulos dessas variáveis e aí pessoal eh
eu vou colocar aqui ó nova folha de Vou colocar aqui o intervalo de saída E aí eu vou selecionar aqui na minha planilha onde que ele vai colocar o relatório final vou colocar ele aqui ó bom dou um enter feito isso é d um ok o que que esse monte de número representa pessoal esses números é o resultado da técnica de análise de regressão certo e claro Quando você estuda isso a fundo lá na plataforma da preditiva tem curso só sobre isso né que gente explica cada um desses desses detalhes Mas o mais importante é
você entender alguns números aqui bem bem relevantes para sua análise o primeiro deles é o quadrado o r quadrado ajustado que deu 75% depois os outros é esses valores P aqui que é um número em percentual certo e depois você tem aqui os coeficientes que são esses valores aqui então olha que interessante pessoal primeira coisa que que esse número representa esse número representa o quanto as variáveis que eu selecionei explicam a minha variável resposta nesse caso aqui qual é a minha variável e resposta é o nosso Y é o custo de saúde 75% significa o
seguinte a grosso modo tá quer dizer que o custo de saúde é explicado em 75% pela idade do colaborador o IMC a quantidade de filhos ou se e se ele é fumante ou não então 75% do custo de saúde da empresa é explicado por esses fatores Olha como essa análise já traz um Insight muito importante para você logo de largada né porque aqui você já consegue responder perguntas como será que esse essas variáveis aqui estão relacionadas com o nosso problema será que a venda né Ou melhor o o valor que o cliente compra tá relacionado
com a frequência que ele tem no site tá relacionada com a sua idade tá relacionada com a sua classe social tudo isso São perguntas que só você você fazer isso e analisar esse número você já consegue ter uma ideia se explica um pouco se explica muito tá só que já é fantástico Além disso você consegue saber quais das variáveis explicam mais todas as variáveis que estiverem abaixo de 5% aqui são variáveis que explicam bem o comportamento da sua variável resposta que no caso aqui é custo de saúde tá eh então todas elas aqui explicam idade
Mc quantidade se fumante E além disso esses coeficientes eles te explicam o quanto que o custo de saúde é impactado de acordo com mudanças dessa variável Olha que loucura pessoal se você nunca viu isso o que que esse número representa aqui ó 2381 eu tô aqui na variável chamada fumante numérico esse 281 fica o seguinte Olha a interpretação o custo médio de saúde de um funcionário aumenta em média R 2831 Só pelo fato dele ser fumante olha isso o custo de saúde para empresa de um funcionário fumante aumenta em média [Música] 2381 que é o
valor que tá aqui o custo médio de custo o custo médio de plano de saúde desse funcionário aumenta em R 47 a cada filho que ele tem quantidade de filho o custo médio de plano de saúde aumenta em R 32 a cada um ponto de mc que essa pessoa tem e assim por diante olha como é rica essa análise a regressão linear múltipla regressão logística que são várias técnicas para você entender como várias aves se relacionam com outra são uma das técnicas mais poderosas que se tem em análise e ciência de dados e é utilizada
em qualquer área de mercado pessoal eu fiz minha carreira fazendo técnicas como essa técnicas como regressão logística trabalhando em grandes bancos Itaú safra banco Votorantin eu usava diariamente esse tipo de coisa que eu tô mostrando para vocês e é usado Claro em qualquer área eh hoje em dia que claro uma área quantitativa né então será que você aprendendo isso já não te coloca em outro do patamar né falo para alunos da preditiva aqui e ainda quem não é aluno né o quanto que isso quando bem interpretado vale no mercado vale muito porque olha a quantidade
de Insight que você gera né você não vira um apertador de botão você tá interpretando eu mostrei aqui para vocês na ferramenta a gente apertou o botão mas depois disso a gente tem que entra a camada de interpretação de você conhecer os conceitos as técnicas e isso você aprende praticando isso você aprende lá por exemplo na plataforma da preditiva na nos cursos de regressão você pratica tira dúvida aprende e aí você aplica em qualquer outro lugar tá então isso é bem bem importante tá bom pessoal isso é análise de regressão linear múltipla quando eu quero
estimar um valor de acordo no meu caso é o valor numérico de custo de saúde né quando você quer estimar isso você usa a regressão Tá certo beleza gente a gente tá aqui mais de 70% da Live tá falta 30 minutinhos Mas já deu para ter uma boa noção acredito eu né Eh até onde a gente chegou dúvidas como é que estamos no chat aí deixa eu ver como é que estamos deixa eu ver aqui ó vesse Flux tem na plataforma para impress Tem sim Juliana quando você entra lá na plataforma você vai ver aqui
ó na parte de método crisp DM você tem a explicação desse desse fluxograma E você também aqui no módulo embaixo ó indo lá embaixo na plataforma você tem aqui ó materiais materiais complementares você entra aqui nos materiais complementares e você tem Tod as chilas do curso todos os pdfs tá aí você vem aqui ó no módulo crisp DM slides conteúdo extra tá tudo aqui tá baixa é só você baixar eh essas apostilas do curso lá tá bom vamos ver aqui que mais o Maron perguntando né no caso para variáveis categóricas com mais de duas categorias
Se eu quisesse entender pelo Prisma da frequência de viagens com outras variáveis Foi mal não formulei bem a pergunta tá então eu tenho variáveis categóricas com mais de duas categorias Se eu quisesse entender pelo Prisma da frequência de viagens com outras variáveis bom Eh aí quando você tem várias categorias em uma variável e várias categorias em outra você vai utilizar uma outra técnica de associação chamada de cramers v tá é uma técnica chamada cramers V essa técnica aqui de associação ela justamente olha quando você tem várias categorias num variável e várias categorias em outra tá
espero que tenha entendido a sua pergunta se não for me avisa aí mas é isso deixa ver Juli V quando você explica parece tão simples aplicar Mas vamos me deparar com projeto de processo eu fico limitada Não sei o que acontece com meu raciocínio tem alguma dica Ju Fica tranquila porque isso é natural tá Por que eu é mais fácil eu explicar porque gente a 17 anos n 7 anos fazendo tudo isso né Eu e os outros professores aqui na preditiva então é bem natural agora para quem tá aprendendo Qual que é o caminho é
ir lá e seguir aprendendo cada uma das técnicas aqui na preditiva por exemplo você aprende essas técnicas E aí projeto projeto para para praticar né aprende essas outras técnicas mais projeto outras técnicas mais projeto só resolvendo o projeto só ir lá e colocando né esforço em analisar dados diversos por isso que lá na plataforma a gente tem aqui projetos para para praticar em people Analytics né em finex em marketing digital CRM é Agro você tem um monte de projeto lá para que vocês consigam ir lá e praticar quando você pratica isso Ju Fica tranquila que
vai ficando muito mais natural você já pega um proga de negócio fala hum isso aqui eu consigo usar IV isso aqui eu consigo usar regressão isso aqui é só criar um histograma que já resolve e aí fica mais fácil tá É bem isso tá bom É é basicamente que o mar falou praticar bastante tá mas fica tranquila que não é limitação nenhuma não ã ó o die aqui já falando né é isso vai te ajudar imensamente No começo vai ser difícil mas os pouco vai quebrando essa limitação E aí gente tem o suporte tem lá
a comunidade tem o app da preditiva que você vai lá e testa essas habilidades uma a uma lá na nossa plataforma Então isso é bem bem tranquilo mar fumar não ter filho reduzir o Mc e idade tem ironia pois não fumar não ter filho reduzir e a idade menos avançada né exatamente aí não dá nenhum tipo de de problema para ca de saúde né boa obrigado e poderosa essa análise de regressão Sem dúvida Leonardo isso daqui gera muito Insight e gera muito valor né Odinei aqui a minha cabeça está assim ó muito bom muito bom
e não tem espaço para pls sem eh entre as técnicas da preditiva pls 100 não tem espaço para pls 100 Entre as técnicas não sei se eu entendi Diego né me recorda o que que é pls 100 aí por favor Belê vamos lá pessoal próxima eh próxima técnica e se o valor que você quer estimar ele não for numérico aí você tem que usar alguma outra técnica que estima valores de forma qualitativa uma delas é a árvore de decisão né A árvore de decisão bom a gente falou da regressão né A árvore de decisão pessoal
é uma técnica que ela cria Como o próprio nome sugere uma árvore e ela vai quebrando variável a variável ela vai quebrando isso em folhas né é o nome que se dá da terminologia da árvore de decisão e para que que serve isso pessoal é mais fácil mostrar do que exp n Então vou pegar aqui por exemplo um outro software que eu já uso bastante aqui nas lives da preditiva é um software que a gente não precisa ficar lá programando né E com isso a gente ganha tempo então né nessa nessa base de dados aqui
vamos lá eu tenho eu tenho aqui a base de dados do RH e se eu quisesse também ter uma ideia entre as variáveis aquelas que vão gerar mais chance do funcionário deixar a empresa certo aí eu teria que fazer uma técnica chamada árvore de decisão ou eh regressão logística ou qualquer outra técnica que usa variáveis binárias pra gente estimar tá então Olha que eu vou fazer pessoal aqui no no software eu vou pegar aqui a base que eu tô usando para pra aula jogar ela aqui tá bom eh deixa eu fazer aqui a configuração do
nózinho se você nunca viu pessoal e essa e esse software não se preocupe é um software bem simples que basicamente a gente vai lá e arrasta bases de dados e arrasta tarefas de manipulação e interpretação de dados né então aqui por exemplo eu simplesmente arrastei a minha base de dados do Excel aí ele foi lá e importou aqui pra gente ó tá disponível aqui nessa tabelon certo aí a partir daí que que eu vou fazer eu vou aplicar uma técnica chamada de árvore de decisão E aqui nesse software basicamente eu digitar o termo em inglês
que é o decision learner eu arrasto né a técnica para cá Olha só agora eu estou conectado à base com a técnica de árvore de decisão certo eu venho aqui configuro esse Nozinho primeira pergunta que ele faz é qual que é a variável que você tá interessado no meu caso eu tô interessado no funcionário deixou a empresa certo Não se preocupa com nada que tá sendo mostrado aqui ó vou dar um ok Clica com o botão direito e d um e abrir visualização Olha que interessante que ele traz aqui pra gente Pessoal Olha o que
essa técnica mostra aqui ele tá falando o seguinte ó eu tenho 1470 funcionários tá bom 1470 funcionários estão conseguindo enxergar aí eu tenho 1470 funcionários tá aqui ó tá desses 1470 eu tenho 16% de sim ou seja eu tenho 16% de funcionários que deixaram a empresa eu já tinha visto isso lá no Excel Tá eu já tinha visto isso lá no Excel só que para variável faz hora extra quando a variável faz hora extra É sim esse percentual de 16% de turnover aumenta para 30% Olha que interessante E além disso quando eu vou aumentando da
minha árvore aqui ó colocando mais nós para quem tem salários abaixo de 2475 Eu tenho um turnover de 6 69% vamos arredondar 70% dos funcionários da empresa que fazem hora extra e ganham 2 abaixo de 2475 eles praticamente dão turnover né % das pessoas que tinham esse perfil deram turnover Então olha como a árvore ela vai olhando todas as variáveis da minha base e ela vai criando ramificações e essas ramificações são filtros do meu público que estão mais propensos ao turnover ou menos propensos pegou pessoal pegou a visão Olha como simplesmente uma representação de árvore
é que por dentro Claro tem toda uma um algoritmo que produz isso né Eh lá nos módulos de Dea Science a gente fala como isso funciona no detalhe mas do ponto de vista de negócio de qualquer um ir lá e usar essa ferramenta olha só essa técnica né olha só o que que ela traz e por outro lado por outro lado Qual é o que não dá e eh praticamente turnover É só você ir lá e crescer a árvore do lado que não dá né Então nesse caso aqui é o não aí eu cresço a
árvore aqui certo e aí Olha só eh para quem não dá turnover ou melhor para quem não faz hora extra e ganha salários acima de 1927 tem só 9% de de de turnover vamos continuar aumentando aqui ó além disso para quem tem idade acima de 21 anos também 9% vamos continuar entando Além disso quem não viaja tem um turnover de 3.7 Olha como a gente chegou no maior nível de detalhe possível de um grupo de pessoas que praticamente não tem risco de turnover ou seja se o funcionário não viaja tem uma idade superior a 21
tem um salário acima de r$ 27 e ele não faz hora extra você tá com o grupo de funcionários mais seguro possível eles não vão pedir não vão pedir demissão não vão dar turnover porque a gente conseguiu descobrir um cluster de profissionais que não tem risco praticamente né em relação a turnover Então pensa na sua área de negócio quanto que você consegue também estimar valores no caso aqui eu tô tentando estimar turnover que é uma variável lá que é qualitativa sim ou não e através de combinações das outras variáveis isso você faz num software como
esse que é o naime você pode fazer no Python você pode fazer no r e vários outros ferramentas que tem por aí né Então olha como pessoal você vai percebendo que vai evoluindo a quantidade de técnica que você consegue trabalhar né com por exemplo a árvore de decisão E aí você tem que unir com alguma ferramenta que você consiga aplicar a técnica essa técnica por exemplo não dá para fazer no Excel Então você precisa de uma outra ferramenta e é por isso que na sua jornada de aprendizado e especialização em dados você vai aprendendo as
técnicas e também as ferramentas que são necessárias para você aplicar né Eh essa ferramenta aqui é uma chamada naime Opa naime Analytics certo e é uma ferramenta gratuita pessoal que você consegue baixar instalar no seu computador e já começar a usar só que claro você precisa aprender a técnica então não adianta você ir lá e ficar jogando um monte de botão no naime né que n um maluco e não sabe o que tá fazendo né então por isso que primeiro vem a técnica para depois ver a ferramenta que vai usar que vai te ajudar a
aplicar a técnica e gerar produtividade bom beleza gente deixa eu ver quanto tempo temos aqui temos mais 15 minutos acho que dá Então olha o que a gente fez a gente resumiu conjuntos de dados com as principais técnicas depois a gente aprendeu a técnica muito simples de atribuir probabilidade que é a teoria frequentista depois a gente tá aprendendo como que estima um valor e esse valor se depender de outras variáveis eh se for numérico é regressão linear se não for numérico no caso lá turnover que é sim ou não é árvore de decisão existem outras
técnicas poderiam ser utilizadas aqui tá tem a regressão logística tá aqui que não vai dar tempo de falar sobre todas elas né regressão logística você tem aqui por exemplo modelos combinados de árvore que são os chamados modelos eh de do inglês chamados de ensemble então modelos ensemble são modelos que combinam árvores né tá aqui você tem as redes neurais redes neurais então Inteligência Artificial usa muito redes neurais né para isso você tem modelos como KNN você tem modelos como o na base na Bas Então pessoal Existem várias técnicas mas o que que eu falei para
vocês no começo da Live quando você aprende as técnicas fundais que são essas técnicas aqui em verde você que já consegue resolver qualquer problema o restante das técnicas são técnicas que vão melhorar um pouco esse seu problema para ser mais preciso talvez ser mais rápido talvez ser mais interpretável mas quando você aprende as fundamentais você já tem Praticamente tudo aquilo que é necessário né Isso que é interessante quando você é um cientista de dados por exemplo aí você aprende mais técnicas né como essa mas o grosso do trabalho que é 95% do trabalho que tem
hoje na indústria no mercado você já resolve Com todas essas outras técnicas que eu mostrei aqui é isso que é importante você entender né você entender que existe uma concentração de técnicas e ferramentas que já resolve A grande maioria dos problemas você já tá muito à frente da concorrência porque você não perde tempo ficando aprendendo técnicas que na verdade são só extensões daquelas fundamentais né Isso é bem bem importante tá bom bom Belê deixa eu ver como estamos aqui pessoal aqui gostando da técnica de de árvore árvore de decisão né e o minha vida boa
mar é isso aí florestas de decisão né que tem uma chamada handle Forest tá então eh é uma outra técnica que você tá dentro da classe de árvores de decisão Samuel né Muito interessante árvore decisão você usa para chegar nesse módulo boa Samuca É isso aí em árvores Cross validation Se não me engano Cross validation o ô ô Jon na verdade é uma técnica para você criar modelos de árvore ou qualquer outro modelo eh preditivo que ele seja utilizável em bases que não foi treinado então aqui é uma técnica complementar Não serve só paraa árvore
serve paraa regressão logística para árvore de decisão para redes neurais e qualquer outra técnica de classificação Bom boa Belê Ah legal pessoal então vamos lá firme aí hein vamos finalizar aqui eh a nossa Live mais 3 minutinhos Olha só legal então e se a estimação que eu quero fazer ela não depende de outras variáveis nesse caso a pergunta que você tem que fazer aqui dentro da escolha da melhor técnica para resolver o seu projeto é você precisa estimar com uma certa margem de erro porque talvez a sua estimativa ela eh seja uma estimativa única que
não depende de outras variáveis por exemplo Qual é eh a proporção de clientes que comprariam o meu o meu produto eh percentualmente falando ou seja não depende de outras variáveis eu só quero saber qual é a proporção eu quero estimar a proporção de alguém né tá eh aqui pessoal Você vai precisar utilizar eh outras técnicas se você precisa de margem de erro tem aqui as chamadas técnicas de intervalo de confiança o intervalo de confiança é uma técnica que te dá um Range de estimação tá bom é basicamente é uma técnica que a gente chama do
grupo de técnicas de inferência em que você vai pegar uma amostra da população né geralmente é uma população que você não tem acesso e dessa amostra você vai aplicar algumas técnicas estatísticas iniciais e você vai fazer a extrapolação do resultado paraa população então por exemplo não dá para você entrevistar todos os clientes futuros do seu produto você não sabe quais são mas se você entrevistar um grupo deles uma amostra desses clientes Será que essa amostra já não vai te dar uma boa estimativa dessa população inteira de de clientes que você gostaria de ter entrevistado é
isso né e para você resolver isso você usa as técnicas de inferência uma delas é o intervalo de confiança e o que que ele faz pessoal basicamente ele cria intervalos Como o próprio nome sugere e esses intervalos na grande maioria deles estão representados aqui graficamente por essas linhas na grande maioria deles eles estão contidos de um número que é o número que você quer este timar que você quer verificar se está dentro do seu intervalo então por exemplo imagina que eh Será que você quer lançar um produto E você quer fazer uma pesquisa de mercado
para você saber quais desses produtos ou melhor qual é a proporção de pessoas que comprariam esse produto certo e aí o que que você vai fazer você vai fazer uma amostra das pessoas vai mandar um formulário vai pedir para essas pessoas preencherem o formulário e uma das perguntas é você compraria o produto você quer saber o Qual é o percentual lá na população de pessoas que você gostaria de entrevistar mas não dá para entrevistar todo mundo aí você entrevista lá uma quantidade por exemplo de 30 pessoas o ponto é será que não dá para você
criar um intervalo que te dá o eh um intervalo que poderia ser por exemplo de 20% a a 25% que ele te dá de estimativa E aí esse daqui esse intervalo de 20 a 25% de pessoas que comprariam o seu produto já é uma boa estimativa do real valor então se tivesse uma técnica que te desse esse tipo de interpretação não seria interessante ou seja eu não sei qual que é o valor de pessoas que comprariam o meu produto mas se eu conseguir estimar um Range um intervalo e esse intervalo tivesse uma certa confiança de
que ele é um bom intervalo seria muito útil né é exatamente isso que essa técnica calcula né não vai dar tempo pelo que eu tô olhando aqui de eu mostrar isso para vocês eu já usei essas técnicas em outras lives vale a pena você olhar mas é isso a técnica de intervalo de confiança pega uma amostra eu aplico umas contas e essas contas né Elas geram um intervalo e esse intervalo quando bem interpretado te dá uma boa estimativa com segurança estatística para você ir lá e mostrar pro seu gestor olha gestor confia em mim que
eu fiz um bom processo de estimação e a gente tem grande chance de ter acertado né mais de 95% de chance de de ter acertado nessa estimativa é basicamente isso que os intervalos de confiança most tá bom E aí pessoal para finalizar quando você não precisa de uma margem de erro por exemplo ah de 20 a 25% isso aqui é uma margem de erro né tá tá um Range tem uma margem de erra atribulada eh a gente tá chegando em momentos de eleição momentos de eleição a gente também tem essas esses intervalos né imagina que
você tem o candidato a e o candidato a tá com 35% de intenção de voto E aí né o jornal fala ó mas a margem de erro ela é de 3% para mais ou para menos não é isso então em linhas Gerais a gente tem um intervalo que vai de 32% até 38% é isso que é um intervalo de confiança para a estimativa desse candidato a na população quando chegar lá no dia da da do do voto eh se estima que ele teria algo entre 32 e 38% de de votos aferidos é isso é é
a técnica aplicada nesses casos de eleição e é aplicado em vários outros casos tá E para finalizar pessoal a gente tem também o grupo de técnicas chamadas de testes de hipótese essas técnicas tão basicamente três as técnicas para médias e proporções técnicas de teste AB que você compara dois grupos de clientes dois grupos de site dois grupos de de eh o cliente ele usou um site a ou usou um site B Qual é aquele que converte mais Pessoal pessoal de marketing usam isso bastante tem um chamado de pareado para você comparar o antes e depois
tá ele vai lá você fez uma mudança no processo ão mais ou menos assim ó você tinha aqui um processo que tinha esse nível de kpi aí você fez uma mudança e agora ele tá nesse outro nível Será que essa mudança de fato foi eh foi foi devida a por exemplo um ajuste que você fez no seu processo né outras perguntas Será que o site a ele converte mais que o site b o quanto e o quão seguro Eu estou desse resultado estudo Clínico né Você tem um tratamento a um tratamento B eu vou lá
comparo as pessoas que TM o tratamento a comparo com as pessoas que TM tratamento b e vejo qual delas teve maior Ou melhor resultado e por e eu tô seguro disso é isso pessoal que os testes de hipótese eles resolvem né então lá na plataforma da preditiva é esse módulo aqui inteiro né de testes a que a gente explica como funciona todas essas técnicas aqui né Eu pensei que ia dar tempo de falar nessa Live provavelmente não vai dar Tá bom meus amigos tão vivos até aqui muita coisa né bom numa Live é muita coisa
mas claro que você tem que fazer isso ao longo do tempo certo existem muitas outras técnicas que não são e que são complementares né as técnicas que a gente viu aqui e ou mesmo outras ferramentas e processos que fazem parte dos projetos de dados certo então aqui comparando quebrando elas em em Pilares tem técnicas e ferramentas de análise técnicas e ferramentas de cência de dados EA técnicas e ferramentas de Business intelligence técnicas e ferramentas de cloud infraestrutura então Eh recomendo você se você não viu ver a Live 61 que nessa Live eu falei de várias
outras coisas que estão aqui ó Nessa Live só eu condense no mais importante para você escolher das técnicas fundamentais né que é basicamente as técnicas de probabilidade as técnicas de análise exploratória essas técnicas de inferência regressão árvore quando você entende essas técnicas fundamentais como eu falei você já resolve vários problemas e quais problemas pessoal você aplica isso em qualquer lugar se você tá em comerci e vendas você aplica em previsão de vendas segmentação de cliente retenção de cliente otimização de preço canais de vendas se você tá em mercado financeiro você aplica tudo aquilo que eu
mostrei em gestão de risco detecção de fraude segmentação otimização de portfólio marketing segmentação de cliente análise de aquisição análise de campanhas de tráfego funil de vendas personalização logística gestão de estoque análise de desempenho de fornecedor previsão de demanda análise de devolução que mais atendimento análise de feedback personalização do atendimento volume de atendimento análise da jornada pessoal deu para entender né eu fiz questão aqui de deixar esses slides Deu para entender que você consegue utilizar em qualquer lugar tem muita gente que procura que preditiva fala Professor ou time eu consigo usar da minha área tudo isso
consegue né Por não só consegue como deve porque se você não tá usando você tá perdendo oportunidade né então a aprenda isso para que você consiga Trazer isso paraa su repertório pra sua carreira e pro trabalho que você atua porque com certeza é isso que vai fazer a diferença na sua carreira né Então pessoal Tudo isso você deveria aplicar né na sua carreira e claro se é a primeira vez que você tá vendo aqui a Live da preditiva onde você aprende tudo isso pessoal na nossa formação né na formação gerando valor com dados quem alund
da preditiva já tá aqui com a gente sabe do que eu tô falando é lá que você vai aprender todas essas principais técnicas ferramentas e metodologia para você conseguir aplicar em qualquer área de negócio tá e fazer com que a sua carreira decole não tô falando isso Palavras ao Vento pessoal quando você aprende isso aplica pratica você vale mais pro mercado é tão simples quanto né é tão simples quanto certo então na nossa formação você vai ter mais de 250 horas só das técnicas que eu mostrei aqui mais aquelas complementares vá vos projetos para praticar
cursos completos de Excel SQL Power Bi e Python na mesma formação em outros locais você compra só do Power bi né só do Python aqui você tem tudo numa formação só é o único local que você aprende tudo numa formação só tá mais de 200 horas de mentorias e lives essa aqui é uma live né Tem mostrei para vocês tá repleto de conteúdo né você tem a plataforma da preditiva com app da preditiva para você criar um plano personalizado você tem lá o melhor suporte Educacional eu outros professores aqui referência na nossa comunidade de alunos
que não tem uma pergunta que não fica sem resposta tá mentorias ao vivo semanais com outros professores eu tô aqui dando a Live mas tem os nossos outros professores tão feras quanto eu que estão lá né semanalmente ao vivo né Eh tirando as dúvidas organizando eh dando os o passo a passo aqui paraa carreira de vocês e aí se você chegou até agora esse momento pessoal eu queria te dar deixar esse recado porque essa formação que a gente durante muito tempo deixou a um preço muito muito acessível muito abaixo do que ela vale a gente
vai consertar isso agora tá então a partir do próximo mês você a gente vai ter um aumento de 850 na formação tá porque ela evoluiu muito tem várias coisas legais que estão entrando nesse ano e tem muita coisa relevante que a gente tá criando para os nossos alunos Então hoje o plano que tá custando 12 de r$ 5 que que você eh gasta hoje R 115 n sabe é é de graça praticamente esse valor tá ele vai a partir de setembro ir para r$ 7 Então você tem poucos dias para você garantir a sua matrícula
no valor atual antes do reajuste tá pessoal a gente tá fazendo de tudo para informar as pessoas porque depois vai acontecer chega lá Setembro Ah eu queria o preço antigo meu amigo mas aí o preço antigo já foi né a gente aumenta é a primeira vez que a gente faz um aumento de preço representativo nos últimos anos a gente tava lá sempre 10% 10% mas chegou um momento pessoal que não dá né as pessoas como eu falei lá no começo da Live tem gente que acha nossa formação eh ruim pelo preço porque compara com o
lixo que tem no mercado que tem muito lixo vocês sabem disso né Você vai lá faz um curso didática péssima que não agrega nada ferramenteiros né E aí você vê aqui uma formação completa com técnica com ferramenta com metodologia com carreira com aplicativo que cria planos personalizados com tecnologia de educação em dados tudo isso por 155 por mês ah estão de brincadeira né então a gente vai ajustar isso daí né e mesmo com esse ajuste pessoal de boa vale muito mais né o nosso curso Com certeza vale R 5$ 6.000 facilmente mas a gente tem
aqui o Nosso propósito de trazer uma educação de qualidade para maior parte das pessoas e a gente precisa fazer esse ajuste porque a gente não aguenta mais ficar respondendo o aluno falando que ah não comprei Não virei aluno da preditiva porque eu pensei que era pior porque era mais barato caramba Isso é complicado mas é isso meus amigos beleza que que vocês acharam aí da Live de hoje hein gostaram deu para esclarecer como cada uma das técnicas estão relacionadas aos projetos à etapas uma jornada dos dados coloca aqui né nos comentários Sempre é muito bom
se você não deixou o seu like Ainda ajuda muito a gente e aqui em YouTube entregar esse conteúdo para mais pessoas aqui oon falando Live muito esclarecedora parabéns eh deixa eu ver aqui o Samuel lives que são de grande valor para revisitar e aprender cada vez mais a jornada Cláudio aqui estou com construind o primeiro Projeto Novo esclareceu as dúvidas que tinha mais uma excelente Live boa Claud a Juliana vale cada centavo obrigado Ju tá Gabriel uma das lives da aptiva virou tema até do meu TCC Olha que legal na faculdade conteúdo rico demais muito
bom Gabriel o Marcos aqui mais um show Vini faz um vitalício desse curso Pois é teve um vitalício um momento só do ano perdeu né acabou ah muito bom deixa eu ver aqui é tanto conteúdo que na minha opinião dá para preencher em um bom tempo da nossa vida com certeza Life long Lang né É isso aí e mesmo com aumento valerá cada centavo boa Obrigado Júnior é isso aí top Adri aqui ó pena que o aprovisionamento do limite é total podia mudar isso aí vin Olha lá fica dica né fica dica Samuel Quando renovar
meu o meu curso pro acesso vitalício excelente didático plataforma do melhor do mercado vale muito investimento boa Samuca obrigado hein Ainda bem que cheguei antes do aumento Pois é Edu avisa os amigos aí para não perder essa chance né show de bola parabéns como sempre topa demais muito massa primeira que Finalmente consegui assistir Parabéns boa Emília Obrigada por ter vindo até aqui Live riquíssima legal pessoal curso é sensacional para quem tem dúvida é um ótimo investimento isso aí boa é melhor deixar para fazer o Case no final do curso ou já ir fazendo com as
técnicas que vai aprendendo Artur é só você seguir o nosso plano de estudos que tá lá no aplicativo da preditiva você seguindo lá você já tá fazendo todo a gente já fez toda a curadoria por você é só você seguir na mesma ordem que você vai conseguir aprender técnica ferramenta método no balanceio eh primordial pro seu nível tá então é só seguir pelo pelo app lá tá bom o f o curso Fica disponível Por quanto tempo Maria essa aqui é o plano de um ano tá quando você quer quiser renovar depois de um ano você
tem uma renovação por um valor mais em conta tá bom eh o Wagner aqui o investimento Vale super a pena Boa Wagner Vale investimento recomendo demais eh O Régis aqui ó vícios né Não que seja o mais relevante mas faz sempre que não tem sorteio é verdade Régis como eu falei aqui faz um tempinho pro próximo provavelmente a gente vai fazer o sorteio né olha aqui a Edna esse mês é a época da minha renovação legal renovar Com todas essas melhorias boa Edna É isso aí pessoal então para finalizar e a frase de hoje para
vocês preencherem aqui o link tá na descrição é foco na simplicidade Essa é a frase de ho hoje foco na simplicidade vai lá o link tá na descrição clica na lista de presença Coloca essa frase lá fala o que você achou da Live e diga né os próximos assuntos que você gostaria que a gente trouxesse aqui tá bom E quem vai lá e faz essa lista de presença também faz parte dos sorteios que a gente vai fazer nas próximas semanas Tá certo e foco na simplicidade por que que eu escolhi essa frase porque olha só
falei para vocês de estatística descritiva gráficos probabilidade regressão só essas técnicas Você já consegue resolver muita coisa nem precisa se preocupar com chat GPT um monte de de novas ferramentas que surgem que são legais Claro mas elas por detrás estão fazendo sempre a mesma coisa é sempre estatística descritiva é sempre regressão linear é sempre probabilidade é sempre inferência são as técnicas que nunca vão mudar né que é um ativo pra sua carreira aquele tipo de aprendizado que você aprende e vai te você vai usar para sempre são essas técnicas é mais simples que vão te
levar adiante tá bom e é o que você vai mais do que aprender né você vai dominar com o tempo lá na nossa formação certo é isso pessoal deixa eu ver quem mais só as lives da prch já vale muito eh que muitos cursos por aí com certeza Diego é o que eu me esforço para trazer aqui para vocês né Qual o valor da Renovação Gi fala lá com o nosso time tá Entra lá em contato no WhatsApp que eles passam para você bom deixa eu ver quem mais dá para dar spo de novos cursos
que vão entrar na plataforma Dá sim L vai entrar curso de etl para analistas e cientistas de dados que é um minicurso de engenharia de dados n vai entrar Story telling vai entrar análise prediel e projeções vai entrar um curso anterior a um curso de Python que a gente tem que um curso de introdução à programação para quem nunca nada vai lá e e vai vai entrar ã que mais que vai entrar deixa eu ver se eu pulei um ã vai entrar um bem legal de cloud aws para analistas né de dados C de dados
Tá show de bola esse módulo da professora Line eh falei são mais ou menos seis módulos que vão entrar nas próximas semanas e além disso a gente tem novas formações né vai entrar formação em marketing tá bem legal né tô ansioso aqui para mostrar para vocês como que vai funcionar eh deixa eu ver é isso boa Maravilha pessoal acho que é isso né obrigado Mais uma vez aqui pela presença e nos vemos na próxima semana hein grande abraço até mais tchau tchau
Related Videos
Live #98 - Como criar "Escores" usando análise de dados?
Live #98 - Como criar "Escores" usando aná...
Escola de Dados Preditiva
Live #97 - Aprenda Knime Analytics em apenas uma aula
1:57:54
Live #97 - Aprenda Knime Analytics em apen...
Escola de Dados Preditiva
1,195 views
Estudo de Caso: Perfil dos clientes - Parte 2: Análise das Variáveis Individualmente
41:58
Estudo de Caso: Perfil dos clientes - Part...
Escola de Dados Preditiva
1,846 views
Live #29 - Probabilidade e Análise Preditiva - Agora você entende!
2:15:10
Live #29 - Probabilidade e Análise Prediti...
Escola de Dados Preditiva
4,154 views
Live #73 - Análise de Dados para Logística
1:38:40
Live #73 - Análise de Dados para Logística
Escola de Dados Preditiva
3,019 views
Como fazer uma ANÁLISE PREDITIVA completa
1:09:18
Como fazer uma ANÁLISE PREDITIVA completa
BIX Tecnologia
11,400 views
Analista de Dados ou Cientista de Dados: qual caminho escolher?
22:41
Analista de Dados ou Cientista de Dados: q...
Comunidade DS
62,457 views
🔴🎥PAI. ACERTO DE CONTAS. PAGOU PRA MATAR O ASSASSINO DO FILHO.
32:38
🔴🎥PAI. ACERTO DE CONTAS. PAGOU PRA MATAR...
TRIBUNAL DO JÚRI: O VEREDITO FINAL
2,155,237 views
Live #61 - Análise de Dados de A a Z: Entenda a sopa de letrinhas da área de Dados
1:51:37
Live #61 - Análise de Dados de A a Z: Ente...
Escola de Dados Preditiva
2,156 views
Estudo de Caso: Perfil dos clientes - Parte 3: Análise das Variáveis Individualmente (continuação)
21:10
Estudo de Caso: Perfil dos clientes - Part...
Escola de Dados Preditiva
1,056 views
BREAKING: King of Jordan tells Trump he will take in thousands of kids from Gaza
19:55
BREAKING: King of Jordan tells Trump he wi...
Fox News
448,985 views
Cientista de Dados do ZERO ao AVANÇADO em UMA hora! (Projeto completo)
1:04:05
Cientista de Dados do ZERO ao AVANÇADO em ...
Didática Tech
13,556 views
Live #72 - Como prestar consultoria em análise de dados?
2:06:03
Live #72 - Como prestar consultoria em aná...
Escola de Dados Preditiva
2,483 views
Live #17 - Como criar um portfólio de dados realmente eficaz?
1:57:20
Live #17 - Como criar um portfólio de dado...
Escola de Dados Preditiva
4,991 views
FULL REMARKS: JD Vance Puts European Leaders On Notice About Trying To Regulate U.S. Tech Giants
15:50
FULL REMARKS: JD Vance Puts European Leade...
Forbes Breaking News
678,731 views
COMO FAZER UMA ANALISE EXPLORATÓRIA DE QUALIDADE
28:13
COMO FAZER UMA ANALISE EXPLORATÓRIA DE QUA...
Nerd dos Dados
3,989 views
Live #63 - SQL para Análise de Dados: Tudo o que precisa aprender para voar nas análises!
2:20:33
Live #63 - SQL para Análise de Dados: Tudo...
Escola de Dados Preditiva
4,174 views
Live #006 - Análise Exploratória de Dados - Geração de Insights
2:17:58
Live #006 - Análise Exploratória de Dados ...
Comunidade DS
5,737 views
Excel para Análise de Dados: Aula 30 - Gráficos: Dispersão(ou Scatter plot)
13:00
Excel para Análise de Dados: Aula 30 - Grá...
Escola de Dados Preditiva
2,725 views
How I became a Data Analyst (No CS Degree nor Exp) | How Data Analytics changed my life
13:48
How I became a Data Analyst (No CS Degree ...
HouseCalledDewberryII
37,353 views
Copyright © 2025. Made with ♥ in London by YTScribe.com