e para impressionar dores tudo bem hoje eu vim aqui para responder uma dúvida que muita gente pergunta aqui no YouTube no Instagram nos nossos fóruns Então qual é a diferença entre análise e a ciência de dados a gente vai ver tudo aqui nesse vídeo só que eu disse a gente começa aproveita para já deixar sua curtida a seguir a gente aqui no YouTube e também para baixar esse material que tá aqui no descrição Então bora lá [Música] salada diferença entre os dois a gente faz final do que é igual basicamente ambos vão trabalhar com dados
e não tentar fazer melhores escolhas para a empresa então eles querem gerar diferenciais para os negócios baseado em dados Então as duas vão fazer exatamente isso e agora quando a gente fala de análise de dados quando a gente está dentro da ciência de dados a gente faz uma análise exploratória Então já existe essa análise os cientistas de dados paz essa análise só que muitas vezes não é tão aprofunda o ponto o analista de dados vai fazer e assim muito longe de existir e sistemas analista cientistas de dados as pessoas já trabalhavam com dado Então esse
temos foram sendo criados Vou Deixar claro o que cada um iria fazer mas muitas vezes a gente ver vaga de emprego de descrições de vagas falando de coisas que um analista de dados deveria fazer dentro da vaga do cientista ou contrário Então muitas vezes isso não fica tão claro na cabeça das pessoas e a minha intenção aqui é exatamente explicar isso para vocês basicamente vamos começar ali pelo conceito o quê que é a análise de dados e o quê que é a ciência de dados a ciência me diz que existe um método científico e lá
envolver hipótese teste validação e monitoramento já análise ele vai basicamente explorar a base de dados para conseguir responder perguntas então hora já a primeira diferença na ciência Eu estou criando hipóteses então eu começo a fazer minhas próprias perguntas e não as hipóteses vem de alguém então eu quero responder perguntas existe Então essa diferença muito clara é como se mais ou menos análise fosse um pouco reativa por que a pergunta veio eu tento responder baseado nos dados enquanto a ciência é uma coisa um pouco mais proativa a eu quero perguntar eu quero gerar questionamento que vão
alister diferenciais dentro da minha empresa e quando a gente fala de dados análise de dados vai lidar com bases muito menores e muito mais específicas em geral ela não vai lidar com mais de um sistema ou se for com dois três no máximo já a ciência de dados eu tenho uma quantidade muito maior de idade e por isso eu preciso também ter uma quantidade muito mais rápida de processamento então enquanto no primeiro na análise eu tô falando de bases menores específicas na ciência de dados que eu saio de base mais abrangente mas muito maiores e
um rápido processamento e por isso quando eu falo de ciência eu a forte base de programação para conseguir trabalhar todos esses dados além de Claro um grande conhecimento estatístico e de negócios Olha que como a gente tá falando em ciência três pilares que extremamente importantes que é programação ou seja tecnologia estatística e negócio já para analista de dados e isso não é tão esperado o mais formalista de dados que entenda do negócio entenda de estatística isso não deve ser exigido dele e sim que ele tem um mais conhecimento conforme de ferramentas como Hobby ai SQL
SAS e outras ferramentas de análise de dados então é um background técnico muito menor que o analista de dados vai precisar ter em relação ao cientista de dados hoje você pode notar mais Lucas os cientistas de dados ele consegue fazer análise das ele consegue analisar uma base consegue muitas vezes ele tem esse conhecimento principalmente conhecimento de SQL que é fundamental também presença de dados ele vai ter e vai conseguir analisar só que não deveria ser a ocupação de um cientista de dados fazendo análise o que ele deveria muito mais focar em modelo só cair futuro
enquanto analista de dados foca muito mais ali no dia a dia são escopos diferentes tão funções diferentes e duas funções extremamente importância que se você encontra a qual delas é mais importante as duas porque eu empresa precisa ele tem um analista de dados precisa ter cientistas de dados cada um desempenhando sua função mas é isso que acontece no dia a dia não Eu por exemplo quando eu entrei em uma empresa para fazer se esses dados eu fiquei durante uns 2 meses fazendo análise de dar porque não tinha outra na lista e o senhor chegava e
pedir perguntado a qual foi o resultado como foi a venda como foi tal coisa eu tinha que analisar e eu analisava sem problema nenhum só que para a empresa ela não tava gerando tanto valor que um cientista de dados Poderia gerar o que eu poderia estar fazendo modelos poderia estar fazendo outras coisas e um cientista de dados deveria fazer mas assim as duas cargos os dois carros são extremamente importante nos três um toque desempenho papéis e funções muito diferentes como eu tô mostrando aqui e aí quando a gente fala diz ide objetivo mesmo de que
do que se espera ali dá resultado de cada uma das áreas a ciência de dados ela vai procurar padrões que elas não são tão facilmente perceptíveis então eu vou procurar padrões e não estão Claros ali nos meus dados e também buscar fazer previsões do Futuro buscar criar modelos então A ciência é como se estivesse olhando para frente porque tá acontecendo E aí para isso ela precisa ter um forte viés estatístico e matemático já na análise em vez de olhar para frente eu vou olhar um pouco mais para baixo vou aprofundar nos meus dados então eu
vou ali procurar o que qual foi o resultado como tá acontecendo E aí também procura por padrões e tendências só que muito mais perspectivas eu não vou tentar procurar padrões não tão imperceptíveis aos olhos humanos eu quero apresentar com o meu padrão de venda como a tendência de venda me atender é sobre a tendência de queda baseado nos últimos resultados então eu vou de forma muito mais direta procurar essas informações e também trazer um site que não ser significativos para o negócio e aqui a gente pode falar daquela questão de Ah o que eu sei
que eu sei o que eu sei que eu não sei o que eu não sei que eu não sei não sei se vocês já conhecem essas essas definições mas a basicamente análise de dados ela vai lidar com que eu sei que eu sei então eu sei que as minhas vendas estão indo bem sei que as minhas lindas estão indo mal sei que a minha vida Caiu só que eu quero quantificar isso por exemplo ou que eu sei que eu não sei então eu já tenho umas perguntas eu já sei o que perguntar e análise de
dados vai me responder isso então por exemplo Ah eu não sei se a minha venda do produto x foi boa mas eu sei que eu quero analisar as vendas do produto X então eu sei que eu não sei alguma coisa então parte do conhecimento do negócio o negócio já tem conhecimento daqui e quer saber qual foi o resultado já ciência ela vai muito mais do que lado não sei que eu não sei quê que eu não sei sobre a minha empresa o que provavelmente a empresa pode ter um problema pode ter alguma oportunidade mas eu
não sei ainda exatamente isso que a ciência de dados vai fazer porque ela vai buscar para doença em um são imperceptíveis e por exemplo Ah eu não sabia que dias de chuvas e tavam muito minha venda então eu não sabia disso a ciência de dados traz isso é a partir do momento que a ciência de dados trouxe isso a minha análise de dados pode começar acompanhar Então as duas vão andar de forma muito juntas tô aqui com objetivos diferentes como eu já tinha falado e quando a gente fala em questão de entregáveis O que que
a gente vai entregar ali o nosso cliente encontra na análise de dados a gente fala muito mais de entrega por exemplo de painéis de relatórios divisões gráficas até e dashboards indicadores na ciência de dados eu preciso que eu me entrega muito mais complexa O que exatamente a entregar coisas que eu não sei sobre a minha empresa sobre coisas que não são senso comum preservar qual fazenda Qual foi o estoque E aí trazer um novo indicador uma nova informação eu preciso contar toda a história daquele dado preciso contar como eu cheguei ali preciso explicar o modelo
que eu fiz e eu preciso conseguir tanto explicar o modelo para os meus pares porque toda vez que eu falo de ciência eu falo de modelo replicável que outras pessoas consigam fazer consigam auditar consigam entender o que está acontecendo como também explicar toda essa trajetória de dados que eu fiz até chegar no resultado para o meu chefe para o chefe do meu chefe por diretor da empresa Então eu tenho um trabalho de storytelling com dados é muito mais complexo que conseguirem caudado e criar uma história com ele e os dois vão focar muito na beleza
na forma que o dados apresentados em gráficos bonitos sim os dois vão fazer isso só que na análise geralmente são gráficos muito mais pontuais pois gráficos e já que o estoque gráficos resultado e é isso já não storytelling que a gente vai fazer dentro da ciência de dados a gente tem que falar a aconteceu isso por isso gerou uma outra coisa e essa outra coisa gerou isso E aí então a gente tem esse resultado final Então a gente tem que conseguir explicar toda essa trajetória que os nossos dados passaram e como a gente chegou ali
naquele site tão importante para a empresa e por que a empresa deve adotar o que a gente tá falando para ela adotar E aí a própria questão de negócio diz respeito sobre isso porque no na ciência de dados eu vou focar na visão estratégica e de futuro da empresa então eu quero trazer otimização Quero trazer vantagem competitiva enquanto na análise a gente trabalha muito mais com dia a dia do negócio o que está acontecendo ali o que tá vendo tá sendo o bolso e não tá sendo como tá sendo o resultado E a gente quer
responder essas perguntas e também acompanhar resultados Então olha como existe uma diferença muito grande entre os dois o meu tô lidando com dado um pouco mais estático ali a cidade eu vou analisar o outro todo Mirando com previsões E aí o dado vai faltar o meu modelo vou gerar uma nova previsão então aqui enquanto eu pego uma base analiso ela e vou trabalhando vão me aprofundando na outra não modelo que a gente queria de ciência de dados a gente criou um algoritmo para sempre está ali retroalimentando a gente tá monitorando então é uma coisa muito
mais dinâmica uma coisa muito mais contínua e aí também é uma grande diferença entre análise e ciência de dados porque na ciência de dados para conseguir fazer isso a gente precisa de um merece muito mais tecnológico E aí relação a esse viés tecnológico na ciência de dados a gente fala de modelos complexos modelos Inteligência Artificial modelos de Mach Lane Deep Lane então é uma complexidade muito maior a gente fala de subida para produção monitoramento melhoria contínua o que não é exigido por uma análise o que que em geral essas análises são muito mais rápidas muito
mais pontuais a gente fez a este o resultado as para a próxima análise e assim vai seguindo então e não precisa dar uma continuidade para análise e até se a gente for analisar vai ser uma próxima base diferente por mais que a gente usa os mesmos conceitos tão informações diferentes que a gente vai ver as informações diferentes a gente vai analisar naquela nova base e aí por causa disso por causa de toda essa questão tecnológica de especificidade de continuidade em geral nas análises a gente trabalha com dados muito mais agregados informações gerais então eu quero
análise de venda análise o resultado dessa linha de produto eu não consigo por exemplo analisar todas as minhas produtos vamos supor que a minha empresa venda 2 mil produtos diferentes eu não posso ter analisando o produto por produto nós saber qual foi o resultado Qual foi o produto que levou outro produto a compra se eu for fazer uma análise vai ser muito mais específica e a gente agrega informações então a gente não vai analisar nível loja nível cliente nível consumidor até porque a gente não trabalha com tanta processamento assim por exemplo a gente vai trabalhar
com esse Kelly fazer Excel e o processo Olá seja um pouco mais demorado do que quando a gente trabalha com python já na ciência de dados a gente consegue o resultado muito mais granular muito mais específico e a gente chega até a nível indivíduo por exemplo a esse indivíduo eu vou escolher o que que eu vou apresentar no feed para ele ou qual é o cluster desse cliente é para eu poder colocar uma propaganda não vamos supor a gente tem uma empresa e aí se a gente que analisar o resultado dessa empresa e só nós
de dados como que foi que foi bem se foi mal qual o produto vendeu mais isso tudo a gente consegue fazer análise de dados mas eu quero lá pensar qual o produto eu vou indicar preço e cliente no momento que ele tá na minha loja olha como é uma coisa muito mais dinâmica uma coisa que eu tenho que retroalimentar o meu modelo que eu tenho que gerar novas informações eu tenho que perceber o que ele tá comprando isso é Ciência Então tá ficando muito mais claro na cabeça de vocês exatamente essa diferença entre esses dois
conceitos que é exatamente essa a minha intenção aqui e aí não exemplo que a A análise consciência de dados vamos supor que o chefe de vocês chegou e falou nossa a gente tá perdendo muito cliente no mês passado a gente perdeu 200 mil clientes e aí vocês vão fazer uma análise desses clientes vocês podem por exemplo agregar o cliente por estado o cliente por idade por grupo tudo isso vocês podem fazer só que vocês vão tá analisando vocês vão estar criando clusterizado de clientes olhando forma agregado o número do cliente a quantidade tudo mais quando
você começa a e colocar isso no modelo para buscar padrões Então você começa a entender Qual foi o relacionamento entre essas variáveis então a cliente jipe 16 a 18 anos que mora no estado tal e que fazem isso fazer isso é uma probabilidade maior de sair e você começa a calcular essa probabilidade Então você tá fazendo uma inferência estatística tá fazendo projeção isso é Ciência então na mesma base dá para você fazer tanto análise com os dados só que com objetivos muito diferentes e os dois objetivos são muito importantes para a empresa que por exemplo
se você faz uma análise e percebe que no estado de Minas você tá perdendo muito cliente é pode focar nisso a força de venda só que você não vai conseguir te falar se aquele cliente específico crente O Lucas vai sair ou não porque com a análise você não tem essa capacidade de fazer isso capacidade de processamento de resultado já na ciência você consegue assim que aquele cliente o Lucas ligou para você e fala Eu quero sair você consegue falar a probabilidade de trem sair é muito alta então eu vou seleção produto melhor para ele olha
como os dois vieram diferenciais no muito legais para empresa só ficou objetivo diferente eu encontro o primeiro eu vou ter um objetivo de avô atuar melhor no mercado de Minas o segundo eu consigo ser específico direto no cliente falar esse cliente é o propriedade alta de sair então eu vou oferecer um produto novo para ele e aí na análise eu posso ver por exemplo que são e foi quase nenhum cliente mas quando tiver um segundo o cliente por exemplo o cliente é x de São Paulo e esse cliente tem uma probabilidade muito grande de sair
o mais que na Análise São Paulo não seja o estado crítico o meu modelo vai dizer que por outros fatores e talvez eu não vou conseguir ver de forma ali humana análise humana esse cliente é uma propriedade alça de sair então entendi essa diferença do que que é análise do que que é Ciência a ciência eu vou trabalhar muito mais com essa perspectiva de futuro projeção qual vai ser o resultado e análise eu vou aprofundar ali o que a gente tá olhando nas informações de dados que a gente tá vendo e aí quando a gente
fala de dados exatamente o dado o que que a gente vê como eu tô trabalhando dados muito a tecnologia tudo mais na ciência de dados eu consigo inclusive trabalhar com dados desestruturados por exemplo a eu consigo pegar um post de mídia social consigo analisar se o que a pessoa escreveu é uma coisa positiva ou não Por isso a gente tem várias bibliotecas já tem várias coisas prontas que ajudam muito a gente e é isso já nariz eu preciso que esses dados chegam pra gente um pouco mais estruturados mas organizados em geral gente trabalha muito com
banco de dados que é um conteúdo que é fundamental para as duas só que na verdade um análise das a gente foca só lhe mais Kelly enquanto na ciência de dados a gente vai precisar trabalhar esses dados tratar dados diferentes pega a bancos desestruturadas às vezes não é um banco que a gente está acostumado a trabalhar tudo isso na ciência de dados e quando a gente fala dessa questão é de como vem as informações a gente já recebe os dados tratados e organizados na análise de dados enquanto na ciência a gente precisa se preocupar com
disponibilidade qualidade tratamento de dados então a gente não tá falando aqui de engenharia de dados é diferente deixar isso bem claro mas às vezes o veio a coluna vazia uma coluna com por exemplo lá altura das pessoas em valor zero tudo isso a gente vai precisar tratar e só para definir também em relação ao tudo isso e o tempo de um projeto de ciência de dados o tempo de uma análise de dados em geral as análises têm o menor duração podemos ir até poucos diz 12 35 dias e são para necessidades mais urgentes tipo ah
por que que essa menina foi mal Como tá aí na venda também para fazer monitor alteração a como tá sendo a venda que eu tô vendendo bem eu não tô vendendo já a ciência os projetos com maior tempo de duração em etapas muito específicas tem entregas específicos porque eu vou tentar prever alguma coisa vou tentar buscar alguma coisa eu nem sei que eu não sei então por isso eu preciso de um tempo maior para analisar para encontrar aquilo para validar se aquela pergunta que eu tô fazendo Realmente são verdadeiras e a gente eu vou encontrar
um comportamento e vai ser daquele conjunto de dados quando eu trago novos dados aquele comportamento não acontece eu tenho que ficar sempre validando isso e validando sempre com novos dados que como eu tô prevendo coisas eu tô criando modelos e criando informações e vamos ser recorrentes eu preciso garantir aquela eu falei para qualquer dado e depois que ela tá introdução preciso continuar monitorando análise não analisou fiz análise para aquela base específica análise de funciona para aquela base para aquela base aquele conjunto de informações verdadeiras e quando eu receber uma nova base seja de a base
de um mês base de outro mês tá da gente vai ter a sua análise e vai ter as suas conclusões específicas Então não preciso que há algo ali eu vou ficar sempre alimentando o sempre monitorando não tem essa diferença bem grande e para finalizar a gente pegando um pouquinho do que que a gente vai fazer em cada um basicamente na ciência de dados a gente vai usar a tecnologia para poder gerar diferenciais estratégicos para o negócio através de modelos estatísticos a página prevê comportamentos que antes eram imperceptíveis Então seja ali um comportamento de qual o
kit eu vou colocar no Instagram da pessoa qual filme eu vou indicar para ela a probabilidade daquele daquele daquela transação tem uma fraude a probabilidade daquele cliente sair tão todos eles com e antes de eu não sabia eu começo a saber consciência de dados e deixando bem claro os três pilares muito fundamentais que a tecnologia negócio e estatística Então não é exigido de um analista de dados ele tem um conhecimento tão grande negócio nenhuma base tão forte estatística e nem que ele faça tão os programas Não precisa não é geralmente né não é exigido que
ele consiga por lá em Python nem nada disso e de um frente e para um cientista de dados isso é fundamental já um analista ele vai buscar responder perguntas do negócio de forma a auxiliar na gestão ali e criarem sites capaz de gerar valor na empresa Então essa definição aqui final é basicamente para deixar muito claro o que cada uma das cada uma das áreas cada um dos profissionais vai fazer então encontro um eu tenho previsão tenho modelos futuros no outro eu vou responder perguntas vou me aprofundar na base e vou conseguir também Gerais significativos
para o negócio Essas são só algumas diferenças para os termos acaba em algumas pessoas também tem outras definições eu só tentei trazer aqui para vocês alguns conselhos que para mim são muito importante vocês entenderem conseguirem diferenciar quando você tiver em fazer um trabalho de cientista ou de analista de dados e comenta aqui embaixo também se vocês acham que faltou alguma coisa você acha que tem algum outro outro conceito que é muito importante a gente considerar que tem isso ajuda muito a gente a trabalhar junto aqui com uma comunidade de programadores efeito pessoal então era isso
eu espero muito que esse vídeo tenha ficado claro que vocês tenham gostado desse conteúdo vou deixar aqui na tela outros vídeos sobre datas sais e também vou deixar aqui na descrição o mini curso de análise de dados em paz beleza vai