Como Eu Aprenderia Ciência de Dados se Fosse Começar de Novo

54.29k views2983 WordsCopy TextShare
Jerry Strazzeri
🎯 Venha aprender Data Science comigo: https://www.datatechflorida.com/lista Agora, você pode se ma...
Video Transcript:
Quem me conhece aqui sabe que eu trabalho há mais de 10 anos como cientista de dados tendo passado por empresas como o Google o Facebook o meta atual meta o tiktok e a Disney trabalhando como cientista de dados nessas empresas mas se eu fosse começar hoje aprender ciências de dados e eu quisesse ter a progressão mais rápida com o melhor retorno possível eu faria um caminho bastante diferente hoje do que era feito na época que eu comecei a estudar ciências de dados não somente isso eu faria um caminho completamente diferente do que se convencionou entender
como estudo de ciências de dados hoje principalmente em países como o Brasil pouca gente sabe mas ciência de dados é um campo extremamente vasto uma pessoa que trabalha como cientista de dados para uma Indústria Farmacêutica muitas vezes pode fazer um trabalho completamente diferente de um cientista de dados trabalhando por exemplo para indústria de TEC ao ponto de que um não conseguiria fazer o trabalho do outro por maior que fosse a capacidade técnica eu entend de ciências de dados dessas pessoas Mas independente do campo de ciências de dados que a pessoa decid seguir existe um ponto
em comum em todos eles que são os fundamentos de ciências de dados fundamentos esse que quase ninguém ou nenhum curso ensina Mas eles são primordiais paraa garantia de uma longa vida do cientista de dados no mercado de trabalho e dessa forma se hoje eu fosse estudar ciências de dados vamos dizer que eu sou alguém que nunca trabalhou nessa área mas tem bastante interesse em me tornar um cientista de dados o que que o eu faria e o primeiro ponto é justamente esse eu daria muito menos ênfase à programação e muito mais ênfase aos fundamentos como
a gente viu essa semana o próprio Google acabou de demitir um time inteiro de Python do Google como é que o Google uma empresa de tecnologia demite um time inteiro de Python nessa época em que muitas pessoas acreditam que o programador teria uma vida longa na verdade com o advento da Inteligência Artificial o programador Tem se tornado menos necessário mas espera aí eu vou explicar para você não quer dizer que o programador vai acabar quer dizer que a necessidade do programador se tornou menor tanto é que a gente vê a matéria aqui ó Google demite
e continua demitindo o time de Python Por que que eles estão fazendo isso não é que eles não precisam mais de um programador Python dentro do Google é que eles precisam de menos programadores Python E aí quando a gente vai lendo as outras matérias ao respeito por exemplo aqui fala que o Google demitiu o time de Python eles poucos dias antes da conferência para desenvolvedores do próprio Google e quando a gente entende as matérias essa matéria explica algo fundamental que vale para quem quer aprender ciências de dados fala aqui que o Google não demitiu O
time inteiro de Python porque eles não vão precisar mais de desenvolvedores Python Mas é porque como eles precisam menos eles estão transferindo esse trabalho pro Google de Monique na Alemanha onde a mão de obra é mais barata isso dá um sinal Claro para para quem quer entrar não somente em cências de dados mas na área de TEC a partir de agora o sinal é o seguinte quem focar em programação vai se tornar cada vez menos relevante e vai ver os seus salários diminuindo ao longo do tempo quem focar nos fundamentos de ciências de dados vai
começar a ver uma progressão salarial e uma progressão de carreira muito grande porque aí que tá a maior necessidade pras empresas de um cientista de dados então o primeiro ponto seria esse eu começaria pelos fundamentos e depois eu prosseguiria para outras áreas das ciências de dados para me aprimorar mas eu vou explicar como fazer isso E para isso você vai ter que estudar propriedade dos dados fundamentos de mensuração classificação e regressão probabilidade e estatística estatística descritiva correlation analyses como explorar e limpar os dados eda que é exploratory data analysis trabalhar com scores e rankings análise
estatística estatística basana o ecossistema de data Science e Analytics segmentação pesquisas e metodologias científicas Business intelligence visualização de dados e principalmente esse ponto eu deixei pro final porque é o principal desenvolver o pensamento analítico sem ele você não consegue fazer absolutamente nada de valor em ciências de dados Então comece pelos fundamentos eles vão te dar 70 75% de toda a base que você precisa para poder trabalhar como cientista de dados e para desenvolver uma carreira de longo prazo nessa área porque as linguagens as tecnologias o software as ferramentas todos eles vão acabar se tornando obsoletos
uma hora mas os fundamentos de ciências de dados não e isso nos leva ao segundo ponto que é não comece focando em programação deixa eu te mostrar um exemplo o Bureau of Labor statistics é um órgão Americano que cuida do que a projeção do que que vai acontecer na economia e no mercado de curto médio longo longo prazo e a projeção do Bureau of Labor statistics é que de 2022 a 2032 a gente vai ver um aumento de 35% na demanda por quem por cientistas de dados então a gente vê aqui porcentagem de mudança e
empregabilidade de 2022 a 2032 35% todos os dados mostram isso aqui a gente vê o crescimento de ocupações projetadas de 2021 nesse caso a 2031 e a gente vê aqui a mesma coisa entre todas as ocupações que a gente tem na lista das com maiores crescimento cientista de dados passando dos 35% mas olha que interessante quando a gente olha para programador ela tem uma retração O que é esperado é que de 2022 a 2032 o mercado precise cada vez menos de programadores e essa estimativa foi feita antes do surgimento da da Inteligência Artificial generativa como
gemin ou Open a por exemplo chat DPT a tendência é que a necessidade seja cada vez menor e a gente já vê as grandes empresas caminhando nessa direção como eu mostrei para vocês no vídeo anterior quando eu trabalhava no meta até pouco tempo atrás até 2022 toda vez que eu precisava acessar um banco de dados criar uma tabela acessar dados para algum projeto específico ou conectar com o banco eu precisava fazer isso através da linguagem SQL numa plataforma interna que a gente usa no meta chamada die query que era uma Plata forma onde ficariam hospedadas
todas as databases e os datasets da empresa e aí tendo as permissões específicas eu posso acessar os dados E aí escrevo o meu código SQL e acesso os dados crio a tabela e trabalho no meu projeto mudando pro tiktok isso já mudou completamente ao invés de usar o di query eu uso ferramentas como essa em que preciso de pouquíssima programação SQL ou seja não quer dizer que eu não preciso saber SQL mas eu preciso usar SQL muito menos às vezes até 90% menos do que eu usava no meta e essa é a tendência que a
gente vê por exemplo nessa plataforma que era muito parecida com a plataforma que a gente utilizava lá você pode conectar com seu dataset SQL em minutos você pode criar os seus apps no top do MySQL que você tem ali ou do código SQL que você tem e você tem mais de 50 Drag and Drop components que você simplesmente arrasta e solta e ele cria a tabela para você o que que a gente vê com isso uma necessidade cada vez menor da programação então se eu fosse começar em ciências de dados e análise de dados hoje
o meu foco estaria muito menos em programação estaria muito mais focado nos conceitos e fundamentos de ciências de dados aqui eu tenho uma plataforma utilizando o looker que é uma plataforma do Google e eu tenho um dashboard esse dashboards eu tenho dados estruturados de uma planta que eles são carregados no Google Cloud e eles são analisados e apresentados aqui eles podem identificar algumas das plantas que estão com alguns problemas plantas de energia elétrica que estão com problemas imediatamente você acessando aqui você consegue entender o que tá acontecendo por exemplo a taxa de transferência está abaixo
do normal aqui às 14 horas você pode explorar mas olha que interessante hoje eu posso ir no jamni e começar a conversar com ele perguntar por que que a taxa de transferência caiu Depois das 14 horas e ele imediatamente sem precisar de um analista sem precisar de um cientista de dados ele consegue me dar Insight sobre o que acontecer eu e aí a partir da resposta eu posso entender Quais são os problemas que estão acontecendo e tudo isso sem utilizar um cientista de dados um analista de dados O gmni do Google fez isso para mim
automaticamente por exemplo eu posso ir pro bigquery Studio e trabalhar com o Gemini dentro do Big Studio inclusive usando Python Então primeiramente eu vou determinar Quais são os dados que existem existem dois conjuntos de dados aqui no Google Cloud que tão dentro da nuvem E aí eu noto uma tabela de de rendimento que pode ser algo que eu posso estar utilizando mas olha interessante eu vejo aqui os dados eu abro a tabela e eu uso uma ferramenta de data profile e ele automaticamente realiza algumas idas que são as análises de dados exploratórias para mim e
me dá a resposta automaticamente inclusive clicando em insights no Google Cloud eu já tenho os insights automáticos e ele não só faz isso ele não somente sugere mas escreve todo o código SQL para mim sem eu precisar digitar uma linha de SQL para me gerar e me transferir com todos os dados que eu preciso para essa análise que eu tiver fazendo o que que eu quero dizer com isso percebeu que tudo aquilo que eu precisava antes de um programador de alguém que sabia aquelas receitas de bolos de Python sabia alguns códigos de machine learning esse
cara se tornou irrelevante ele não tem mais espaço no futuro das ciências de dados agora é importante saber programar ação é importante saber SQL inclusive muitas entrevistas de emprego Você tem uma prova de SQL Mas isso não é mais hoje o fundamental eu mesmo já contratei pro meu time cientistas de dados que não eram especialistas em Python e tinham um conhecimento bastante básico de SQL Mas eles eram extremamente avançados nos fundamentos de ciências de dados e aí a gente vai pro nosso próximo ponto depois de estudar os fundamentos depois de ter o básico de programação
mas entender que eu não vou focar nisso eu vou para um dos pontos principais Se eu quisesse aprender cientistas ciências de dados hoje que é estudar o contexto no qual eu quero trabalhar hoje a gente usa ciências de dados nas mais diversas áreas você tem ciências de dados para e-commerce paraa Indústria Farmacêutica paraa indústria do mercado imobiliário indústria de viagens Retail comércio Supermercados todas as áreas hoje que possuem uma quantidade significativa de dados tão utilizando ciências de dados só que se lembra que eu falei para você no começo que o ci csta de dados da
Indústria Farmacêutica muitas vezes ele vai fazer um trabalho completamente diferente do cientista de dados do marketing e aí entra o ponto principal você vai ter que escolher Que tipo de cientista de dados você quer ser e você vai ter que se especializar nessa área a minha dica para você é vá pra área onde há maior quantidade de dados porque justamente são as áreas que tem a maior necessidade de cientistas de dados são elas Marketing e-commerce e Finanças Essas são as três Áreas que mais geram dados mas mais que isso que mais gera um retorno através
do trabalho de um excelente cientista de dados E por que que isso é importante porque se elas geram retorno elas sempre vão valorizar o trabalho do cientista de dados Porque pensa só você trabalha numa área que o cientista de dados O Retorno que ele dá é Ah é Ok qual que é a dificuldade dessa empresa daqui um tempo se precisar cortar funcionários cortar justamente o cientista de dados agora quando você vai para e-commerce você vai para Retail você vai para digital marketing você vai para Finanças você vai paraa área que tem uma alta necessidade de
ciências de dados e principalmente o trabalho do cientista de dados tem um impacto significativo na receita da empresa são justamente as áreas onde o cientista de dados é mais valorizado E aí você vai ter que se especializar nessas áreas primeiro você vai ter que ter os fundamentos de ciências de dados para trabalhar com ciências de dados entender estratégias de mensuração metodologias de mensuração estudo científico pensamento analítico e depois você vai aplicar isso no no contexto você ter uma ideia toda vez que o Max verstappen tá correndo ali de Fórmula 1 longe das Pistas no escritório
da Red Bull tem mais de 100 analistas e cientistas de dados durante a corrida em tempo real capturando os dados e passando informações para que eles obtenham melhor desempenho e ganhem a corrida Esse é o cientista de dados que gera valor E aí que você tem que se focar E aí as habilidades e os conhecimentos que você precisa ter inclusive de programação vão variar muito de acordo com a posição que você escolher então se eu voltasse hoje a estudar ciências de dados e quisesse entrar rapidamente no mercado com bons salários já como pleno obtendo os
melhores resultados eu estudaria não somente os fundamentos de ciências de dados passaria também por programação mas eu focaria bastante no contexto e estudar as ciências de dados naquele contexto que eu quiser aplicar e por último eu me adaptaria à Nova realidade da Inteligência Artificial que é o futuro curo da área de ciências e análises de dados como a gente viu a inteligência artificial generativa veio para ficar e já mudou muito rápido o mercado de tecnologia no geral e ciências de dados não é diferente Antigamente você tinha o 10 times engineer que era um cara dentro
do Google quando você falava mais na parte de engenharia de software que ele era 10 vezes melhor e mais rápido do que os outros Engenheiros era o caso de um em 1000 mas aparecia esse cara ali hoje tá começando a ser cobrado que todo cientista de dados todo engenheiro de dados todo engenheiro de software ele seja 10 times engineer por quê Porque com o auxílio da Inteligência Artificial um trabalho que muitas vezes você levava um dia inteiro para fazer você consegue fazer em 30 minutos 40 minutos 1 hora você consegue ser muito mais eficiente utilizando
a inteligência artificial ao seu favor Eu por exemplo no meu trabalho eu uso Hoje o tempo todo a gente tem tanto ferramentas internas como ferramentas internas de Inteligência Artificial que facilitam o meu trabalho e isso Acabou tornando o meu trabalho 50 60 70% mais eficiente e é isso que a empresa quer ver vou te dar um exemplo no campo científico a gente tem diversos estudos acontecendo o tempo todo e muitas pessoas utilizam esses estudos para conferência ou para meta-análise só que esses estudos eles são atualizados a todo momento e vamos dizer que você precise que
alguém vá lá no seu banco de dados de estudos que você utiliza e fale assim me relacione todos os estudos relevantes novos que saíram que são relevantes para aquele trabalho que a gente tá tá fazendo que a gente vai est utilizando manualmente isso é praticamente impossível porque são mais de 200.000 novos estudos gerados o tempo todo mas com o gni Isso já é possível primeiro a gente precisa filtrar os artigos científicos e a gente escreve um comando dizendo pro gni exatamente aquilo que ele deve procurar com recursos avançados e ele é capaz de distinguir quais
artigos eram relevantes pro estudo automaticamente com a relevância de quase 100% E aí a gente pode pedir pro gemin extrair esses dados pra gente automaticamente e ele faz isso exatamente no local onde tá o artigo E acredite ou não em meia hora o jni fez isso para mais de 200.000 artigos científicos entendeu a importância de você saber utilizar a inteligência artificial ao seu favor para facilitar o teu trabalho e é isso que nos próximos anos vai diferenciar um excelente de um regular ou fraco cientista de dados nos anos 90 a maior rede de entretenimento no
mundo acabou falindo porque ela não se adaptar a novo nos anos 90 também a Kodak a empresa Pioneira e maior empresa do mundo no ramo de da fotografia acabou falindo porque não quis se adaptar a novo que que você acha que vai acontecer com cientista de dados o analista de dados ou qualquer outro profissional de TEC que não se adaptar a essas mudanças no mercado então se eu fosse estudar ciências de dados hoje esse é o caminho que eu tomaria porque isso me garantiria uma vida muito longa e com os melhores salários nessa área legal
gente Muito obrigado quem participou do vídeo de hoje não deixem de comentar aqui colocar seu comentário eu vou estar respondendo para você fico muito feliz com as mensagens e não deixem de se inscrever no canal me ajudem a chegar a 60.000 inscritos Porque quanto mais inscritos eu tiver no canal mais conteúdo relevante eu vou ter para trazer para vocês mais tempo eu vou poder dedicar a trazer esse conteúdo legal para vocês tá bom Um abraço e até a próxima
Related Videos
Analisando Vagas de Ciência de Dados e Mudanças do Mercado em 2024
24:45
Analisando Vagas de Ciência de Dados e Mud...
Jerry Strazzeri
10,204 views
As 10 Carreiras em Dados mais em Demanda para 2024
19:40
As 10 Carreiras em Dados mais em Demanda p...
Jerry Strazzeri
26,131 views
Revolutionizing Data: Fireside Chat on CSV Imports & AI with OneSchema's CEO
27:06
Revolutionizing Data: Fireside Chat on CSV...
Product School
7 views
É o fim do Power BI? Criando Dashboard com Python em 15 minutos
17:46
É o fim do Power BI? Criando Dashboard com...
Asimov Academy
335,641 views
Ainda vale a pena migrar pra área de dados? [2024]
13:26
Ainda vale a pena migrar pra área de dados...
Isla Marques
17,692 views
Analista de Dados por onde começar?
10:47
Analista de Dados por onde começar?
Lilian Pires
2,900 views
Como criar um PLANO DE ESTUDOS para se tornar um CIENTISTA DE DADOS? (Roadmap Ciência de Dados)
21:29
Como criar um PLANO DE ESTUDOS para se tor...
Programação Dinâmica
119,706 views
Torne-se um Analista de Dados com ChatGPT (GUIA COMPLETO)
25:59
Torne-se um Analista de Dados com ChatGPT ...
Tiago Lemos
72,709 views
O mercado de tecnologia esta mudando? Melhores Insights Stack Overflow Survey 2024
26:43
O mercado de tecnologia esta mudando? Melh...
Attekita Dev
27,850 views
Como Eu Aprenderia a PROGRAMAR (Se eu pudesse começar de novo)
12:41
Como Eu Aprenderia a PROGRAMAR (Se eu pude...
Jerry Strazzeri
348,026 views
Porque Você NÃO deve se Tornar um Cientista de Dados
10:25
Porque Você NÃO deve se Tornar um Cientist...
Jerry Strazzeri
45,200 views
Novo Curso de Data Science e Inteligência Artificial
3:30:05
Novo Curso de Data Science e Inteligência ...
Jerry Strazzeri
14,907 views
[ANÁLISE COMPLETA] Qual o MELHOR curso pra um analista de dados INICIANTE? IBM vs GOOGLE
14:36
[ANÁLISE COMPLETA] Qual o MELHOR curso pra...
Isla Marques
26,386 views
A Melhor Forma de se Tornar um Cientista de Dados em 2024
36:35
A Melhor Forma de se Tornar um Cientista d...
Hashtag Programação
12,029 views
CIÊNCIA DE DADOS: O QUE EU FARIA, SE TIVESSE QUE COMEÇAR DATA SCIENCE HOJE.
31:18
CIÊNCIA DE DADOS: O QUE EU FARIA, SE TIVES...
Comunidade DS
511,954 views
7 Coisas que Você Não Sabe Sobre o ANALISTA DE DADOS
13:48
7 Coisas que Você Não Sabe Sobre o ANALIST...
Comunidade DS
8,934 views
Primeiro passo para ser um cientista de dados melhor
17:49
Primeiro passo para ser um cientista de da...
Isla Marques
3,961 views
Curso Completo de Ciências de Dados – Prof. Erick Muzart
4:07:51
Curso Completo de Ciências de Dados – Prof...
Estratégia Concursos
39,338 views
Uma AULA sobre DATA SCIENCE
14:42
Uma AULA sobre DATA SCIENCE
Cortes do Ciência Sem Fim [OFICIAL]
116,992 views
Como Aprenderia Engenharia de Dados Começando do Zero em 2024
15:32
Como Aprenderia Engenharia de Dados Começa...
Henrique Treve
1,480 views
Copyright © 2024. Made with ♥ in London by YTScribe.com