Os 5 Tipos de Projetos OBRIGATÓRIOS para o Portfólio de Data Science!

48k views3844 WordsCopy TextShare
Comunidade DS
Nesse vídeo, eu vou mostrar os 5 tipos de projetos que você deveria ter no seu portfólio, para demon...
Video Transcript:
e muitas pessoas têm me procurado no linkedin e no instagram perguntando quais são os projetos que eles deveriam colocar no portfólio de projetos para poder mostrar para os recrutadores que eles têm as habilidades necessárias para se tornar um líder a sites e também para impressionar os recrutadores durante o processo seletivo posso você quiser saber quais são esses projetos seja muito bem vindo ao canal seja um de ir a sites meu nome é negro e o objetivo desse canal é trazer conteúdo que ajude a conseguir o seu primeiro emprego como dedera sites ou fazer uma migração
para essa área eu vou trazer aqui tanto conteúdos da parte técnica de mach lane da irá science em modelagem quanto da parte de preparação também então o que você deve estudar o road map de estudos empresas que você deve procurar entrevistas que você vai enfrentar com essas perguntas que as pessoas vão fazer enfim tudo que te ajude a conseguir o seu primeiro emprego ou fazer uma migração de carreira tá bom bom nesse hoje eu quero falar com você sobre os projetos que você deveria colocar um portfólio de projetos para poder demonstrar que você é capaz
de resolver problemas complexos nas empresas bom e para isso eu vou mostrar para você qual foi o raciocínio e que eu utilizei para poder chegar nesses projetos e aí eu quero que você escreva aqui nos comentários se você concorda discorda se você tem alguma coisa adicionar com esse raciocínio tá bom bom o objetivo de um portfólio de projetos é que a gente tenha projetos que demonstrem que nós somos tão capazes de resolver problemas complexos quanto os negros site se nas empresas certo bom e para isso a gente precisa entender como que um cientista de dados
ele resolve os problemas complexos nas empresas e criam os projetos inovadores então o primeiro passo é a gente entender o trabalho de um deles sites e aí a gente pode olhar todas as etapas de resolução de um projeto complexo de interação e se esse nós fizemos o que demonstrem todas essas etapas nós podemos concluir que nós também somos capazes de resolver problemas complexos igual as letras sites que já estão nas empresas certo voltou trouxe aqui as etapas de um projeto dedera sais que é baseado na minha experiência pessoal tá então me baseei muito dos projetos
que eu já realizei pelas empresas que eu passei para poder criar esse road map aqui esse rolo de map ele muda um pouquinho dependendo da natureza do projeto mas de uma forma geral as etapas são as mesmas tá então a primeira etapa é a questão de negócio nessa etapa alguém faz uma requisição para você de algum projeto para solucionar alguma dor ou para fazer algum tipo de inovação tá e aí na segunda etapa você não sai correndo fazendo que a pessoa te pediu você dá um passo para o lado e tenta entender qual que é
a causa raiz aquele problema porque geralmente as pessoas elas não chegam para você com o problema real elas chegam para você com uma solução o baixão que resolvem o problema delas e ainda maioria das vezes as pessoas elas não são os melhores pessoas para indicar soluções para os próprios problemas então é sempre legal você dá um passo para o lado entender a causa raiz para que você realmente construa uma solução que resolva aquele aquela dor que a pessoa tem certo depois que você entende a causa raiz do problema você coleta os dados e aí você
me faz uma limpeza dos dados porque os lados eles não vem sempre bonitinho para você então aqui tem que se preocupar com dados me sim tem que se preocupar com a qualidade do seu deita 7 depois que você faz essa limpeza dos dados você faz uma análise exploratória dos dados para ganhar um pouco mais de conhecimento em relação ao problema que você está enfrentando também para gerar insights do negócio e para escolher quais algoritmos de mach lane você vai aplicar tá a uma grande parte dos projetos de dna sai eles estão resolvidos com a exploração
de dados é importante que você saiba fazer uma boa análise exploratória de dados tá bom bom depois da nós pela autora de dados você tem a etapa de modelagem dos dados então você precisa preparar os dados para que os algoritmos de mach lane possam ser aplicados então por exemplo se você tem dados categóricos você precisa transformar eles em numéricos e não últimos alguns algoritmos não entendem aquilo tá então tem uma modelagem de dados antes de você aplicar os algoritmos de machine learning em cima desses dados tá bom bom depois que você aplica os algoritmos de
mach lane você precisa metrificar performance desses algoritmos entender se eles estão por formando bem por formando mal se eles estão realmente aprendendo algum comportamento dos dados ou se eles estão apenas entendendo que aquele ao ruído e depois disso você coloca esse modelo em produção e faz com que o resultado desse modelo seja acessado por diversas pessoas para que elas incluam essas respostas dentro da sua estratégia o presidente da empresa a crescer a trazer mais resultados a tornar mais eficiente o dia a dia das pessoas tá bom então é isso aqui são todos os etapas de
um projeto de ideias em si cada uma dessas etapas aqui tem bastante coisa envolvida são vários algoritmos várias formas de fazer uma análise exploratória de dados mas se a gente conseguir construir projetos que cubram algumas etapas desse desse ciclo todo aqui de resolução de projeto inteira sai se a gente consegue provar para as pessoas que a gente também consegue resolver o problema certo faz sentido se não fizer escreve aí nos comentários se quiser também escreva nos comentários quero saber sua opinião sobre esse road map dedeiras site tá bom bom baseado nisso então eu quero fazer
agora é o seguinte eu quero pegar partes dessas etapas aqui eu quero construir projetos para demonstrar que a gente é capaz de executar essas etapas e gerar valor para o negócio tá bom então baseado nisso a gente volta para definição de um portfólio de o que é demonstrar que a gente sabe resolver problemas reais de interações esta definição não vai ser importante para a gente também excluir projetos que não são projetos de portfólio tá às vezes são projetos de estudo onde você utiliza apenas para entender a teoria protestar alguns algoritmos mas eles são tão simples
que você não pode dizer que você é um dele a sites apenas resolvemos esse tipo de problema tá bom então com isso eu criei 5 tipos de projetos que eu acho que você deveria ter no seu portfólio de projetos o primeiro tipo é um projeto de insights então tudo bem a sites ele precisa ser um bombeira é neles e uma grande maioria dos projetos dos problemas que as empresas enfrentam elas são solucionadas com uma boa análise exploratória de dados então se você tiver projetos do tipo insight o seu portfólio você consegue demonstrar para os recrutadores
que você consegue resolver problemas simples nascem é necessariamente precisar de machine learning tá bom porque mach lane ele apenas uma ferramenta dedera sai está eu não sei aquela pessoa extremamente apaixonada por mach lane mas seja apaixonado por resolver problemas tá bom bom quais são as etapas que um projeto de insights ele cobre então ele cobra a parte da questão de negócio entendimento do negócio coleta de dados limpeza de dados e análise exploratória de dados então como que você resolve um problema de um projeto de insights estamos e simula um problema de negócio então imagina que
você é dono de uma empresa e você começa a pensar em quais problemas aquela empresa pode ter depois você identifica a causa raiz esse problema depois você pode procurar por deita 7 por conjunto de dados que resolvam isso tá aqui pode ser até uma ordem contrária você vai na internet em conta deita 7 públicos e aí entendi da onde foi gerado daqueles dados qual que é o tipo de negócio que gerou aqueles dados e aí você começa a pensar para esse tipo de negócio por quais são os problemas que essa empresa enfrenta e aí entendi
qualquer causa raiz que causa esses problemas e aí com os dados você vai gerar insights para explicar essa causa ou em gerar soluções para isso tá sugestões de soluções para isso tá bom então depois você trata os dados que nem sempre os dados vão vir bonitinho para você já poder resolver diretamente levante hipóteses sobre o comportamento do negócio então esse aqui é uma parte super importante de um projeto de insight está se você não tiver as hipóteses que você quer comprovar com os dados você vai ficar perdido na na exploratória de dados porque análise exploratória
de dados ela pode ser tão grande quanto você quiser tá eu tô falando isso por experiência pessoal tá então sempre chega na análise para troca de dados com algumas hipóteses que você quer validar e aí você utiliza esses dados para poder validar suas hipóteses então você vai ter uma análise muito mais guiada muito mais e a o objetivo final tá bom então cristo as hipóteses sobre o fenômeno você tá modelando a então eu acho que a causa disso é isso válida condado ah mas eu acho que pode ser aquilo válida com o dado então o
seu papel nesse projeto aqui é validar ou rejeitar as hipóteses que você levantou durante a análise exploratória de dados tá bom e aí depois que vocês validar suas hipóteses você compila os seus resultados confirmam os achados que você obteve nos dados e faz a sua sugestão de como você como a pessoa deveria resolver aquele problema tá bom então esse é um tipo de projeto insights é um projeto muito legal você pode observar que não envolvem machine learn porque mais uma vez nem todo o problema é resolvido com machine learn então é legal você mostrar para
executar dores que você também um bom analista de dados e isso te faz ser um bonder a site está bom bom outro tipo de projeto aqui é o tipo de projeto de dente engineering deus o miramar totalmente diferente dele as saias são professores separadas mas é sempre legal você saber um pouquinho sobre pipeline de dados para que você também consiga lidar com situações do tipo você entra na empresa e não tem os dados organizados eu não tenho nenhum daí tem de ir e você se vê sozinho precisando coletar dados de fonte de dados completamente diferentes
então é legal você tem que usa aqui de fazer requisições e apis de fazer com ela em banco de dados de unir todas essas coisas armazenar em algum lugar criar um pai pe line para poder realimentar o seu modelo então essa é uma outra parte dele açais que é uma parte mais de engenharia de software você criar pai pilar n de dados tá bom então é legal você tem projeto de dei tem dinheiro seu portfólio para mostrar que você andei da sites independente se tiver daí tem dinheiro não ou se eu tiver dados estruturados ou
não você é capaz de resolver problemas mesmo assim tá bom bom quais são as etapas que cobre in the date and new coleta de dados limpeza de dados e exploração de dados então para executar o projeto de lei tem de ninho e você vai coletar dados de fontes externas então um grande exemplo que ia fazer webscreping tá tem alguns sites que já são específicos para fazer webscrap e você pode treinar o a bicicleta e neles então você aprende a extrair dados da web organizar esse banco de dados e criar um paripe line que seja robusto
que seja contra falhas tá então você salva esses dados em um banco que você aprende criar tabelas crianças relações das tabelas atualiza esse dados com frequência então você vai precisar criar um pai pe line que ele tem uma orquestração dos das tarefas entre si e que rode todo dia e que se algum desses jovens falhar como que você faz para que o pai pilar em todo não fale então vai te ajudar a criar muita noção de desenvolvimento de software tá que é muito importante para criar os seus pais lines inteiras faz depois você limpa os
dados explore oi e aí você traz alguns insights também para poder treinar essa parte tá mas projeto de lei tem de ir só focados para que você aprenda a construir pipe line de dados tá e coletar dados de fonte diferente então fazer requisições em iapi fazer qual é o em banco de dados fazer webscrap tudo isso faz parte de um projeto de deita engineer beleza bom outro tipo de projetos os projetos de machine learning que eu acho que é o que todo mundo faz aqui né todo mundo que entra nessa área dedeira as áreas primeira
coisa que faz é aprender algoritmos de mach lane né e você precisa também ter projeto de machine learning dentro do seu portfólio quais são as etapas que um projeto de machine learning cobre coleta de dados limpeza de dados exploração de dados modelagem de dados e algoritmos de machine learning e avaliar os algoritmos de machine learning usando as métricas apropriadas tá e como que você desenvolve um projeto de marche milane primeiro você então escolhe os dados eles que você próximos do real é uma característica importante então adianta você pegar dados muito simples que tem um milhão
de resolução aí pela internet e dizer que você é o cientista de dados só fazendo isso tá então você precisa pegar dados próximo do real porque lembre se que a gente precisa de projetos que mostre que nós somos tão capazes de resolver problemas complexos quantos de sites que estão nas empresas então você precisa escolher deitar certos reais tá pega uma ótima fonte para você encontrar desafios reais dedera sai sou mais próximo possível deles tá bom então você escolhe o seu deita 7 faz a limpeza faz a exploração modelos dados aplica algoritmos de mach lane avalia
o desempenho dos modelos usando as métricas corretas aqui é legal que nesse projeto é muito bom para você aprender como converter a performance de um modelo de mach lane em performance de negócio então por exemplo no dia a dia o seu chefe vai falar assim negro quanto que é e esse modelo aqueles e desenvolveu aí de previsão de vendas por exemplo aí você falou assim cara tá e noventa porcento aí assim tá mas quanto de dinheiro isso vai trazer a mais no final do mês então qual que é a relação de uma conhece de noventa
porcento em termos financeiros que é o termo que o negócio entende então a tradução de performance de modelos de mach lane pela performance do negócio super importante você saber porque é isso que você faz a conexão dedera science machine com o negócio porque se você não fizer essa conexão mach lane é simplesmente uma hora de pesquisa por isso não tem uma conexão com o negócio não consegue gerar valor com isso então essas coisas esses tipos de projeto aqui the machine learning é muito bom para você exercitar isso tá bom depois de um outro tipo é
um tipo porque eu chamo de projetos em the two and esse projeto aqui ele começa com a coleta de dados limpeza de dados exploração dos dados modelagem dos dados e algoritmos de mach lane avaliação do algoritmo de mach lane e o a produção então o que você vai praticar formas de você colocar o seu modelo em produção expor uma pe uma tabela que você vai escrever os seus resultados para que outras pessoas consigam consumir os resultados gerados pelo seu modelo tá bom quais são as etapas você criar um projeto em the two and você precisa
coletar a limpar explorar o conjunto de dados que seja próximo do real tá nunca se esqueça disso depois você modela aplica avalia performance dos algoritmos de mach lane com as métricas específicas e aí você publica o modelo em produção você pode usar frameworks que são open-source igual ml-flow você pode fazer apenas usando o flask você pode utilizar também ferramentas que são pagas igual google cláudia ws então se você treinar a forma diferente de expor o seu modelo para que as pessoas elas consigam os aos resultados que ele provei tá bom bom e por último são
os projetos dedera sai é só os projetos mais completos tá então quais são as etapas que o projeto dedera science ele cobre você tem a questão do negócio então você já começa pelo problema seu entendimento do negócio a coleta de dados limpeza de dados por ação dos dados a modelagem dos dados somente uma the machine learn avaliação do algoritmo e os modelos em produção então projeto dedera sais realmente você inicia com a questão de negócio então você inicia com alguém te fazendo uma pergunta então você parte de um problema e você faz todo esse processo
aqui até você chegar em um modelo que você coloca em produção para que as pessoas utilizem esse resultado dentro da estratégia deles tá bom então realmente um projeto completo cada etapa desse projeto aqui pode ser do tamanho que você queira porque sempre existem muitas formas de fazer a mesma coisa mas sempre procure sempre de preferência para fazer o mais simples o mais rápido possível tá então procure trabalhar em um projeto dedera saiyajin forma cíclica e começa com mais simples e aí você vai entrando mas se aprofundando até você conseguir entender como que os algoritmos de
mach lane funcionam do ponto de vista da matemática e da álgebra linear tá bom mas sempre procure começar com mais simples e em tornando isso cada vez mais complexo tá bom bom então esses são os tipos de projetos que eu acredito que você deveria ter dentro do seu portfólio de projetos e é legal falar também dos projetos que eu acho que você não deveria ter no seu portfólio que são aqueles projetos que eu vejo muita gente fazer muita gente falando que é dele a site está apenas por fazer esses projetos na verdade são projetos muito
longe de problemas reais que as empresas enfrentam tá bom agora exemplo probabilidade sobreviveram ao titanic cada vez por dia do titanic ele é muito bom para você estudar então são projetos de estudo para você entender teoria para você aplicar algoritmos ver como que se não mente não se comportam quando você muda os parâmetros e os projetos que te ajudam a entender a teoria mas não são projetos que provam que você andei na sites porque são projetos muito simples são projetos que tem um milhão de resoluções aí na internet então não coloque esses tipos de projetos
no seu portfólio outro exemplo e flowers carência 97 super batido que todo mundo que aprendi classificação conhece esse deita 7 aqui novamente é um conjunto de dados para você treinar os conceitos e não e não representa a sua capacidade de resolver problemas complexos então não resolvam eles flower e fale que você odeia sites porque você ainda não é tá bom depois ver mais terminais em um conjunto de dados que são imagens que representam números de 0 a 9 escritos à mão e todo mundo que aprendi deep lane pela primeira vez para fazer reconhecimento de imagem
classificação de mais utilizo iluminaste cara também um projeto super batido o curso de dados super batido tem um milhão de resoluções e na internet é legal para você treinar os conceitos mas ele não reflete o seu real a sua real capacidade de dizer problemas complexos da empresa tá bom bom então esse que eu queria falar para você então vamos só recado lá rapidinho aqui quais são os tipos de projetos que você deveria ter no seu portfólio bom esse é o portfólio de projeto que eu acho matador que é impossível cara não falar que você odeia
site se você tiver esses projetos dentro do seu portfólio você precisa ter três projetos do tipo insights então os objetos que você faz uma boa análise pela tela de dados e tirem site dos dados mostrando que você é um ótimo dela é análise antes mesmo de serão dele a scientist se você tiver um projeto de deita engineering mostrando que você sabe lidar com a extração de dados direto da fonte é legal mostra também que você sabe criar pai pilar me de dados você tiver três projetos the machine bom então realmente são projetos que você aplica
algoritmos de mach lane e mede a performance de cada um deles mostrando como que tá a performance e mostra a performance de cada um deles se você tiver dois projetos gentilmente onde você coloca esses modelos em produção para que as pessoas consigam acessar os resultados desse modelo que você criou e um projeto dedera size por ele ser mais três mas que também envolve você partir de uma questão de um problema aberto e você criar todo o projeto e no final você tem um modelo rodando em produção que resolve aquele problema ou dá dicas que as
pessoas resolver aquele problema tá bom por na minha opinião então esse aqui é o portfólio matador se você tiver você pode claro tem um projeto de cada tipo não tem problema depois você vai aumentando você tiver um projeto dedicado ativo que no seu portfólio eu tenho certeza que os recrutadores vão te olhar de maneira diferente bom esse mesmo assim ainda você tá em dúvida sobre que tipo de pro e ele ia fazer em cada uma dessas categorias aqui eu escrevi um post lá no blog sejam dele a sites.com onde eu mostro para você um projeto
que eu acho legal você tem dentro de cada uma dessas categorias de projetos tá então mostra onde está o deita 7 onde você consegue ele que você deveria fazer e como que você deveria colocar esse por ele dentro do seu portfólio para realmente mostrar que você conseguiu resolver o problema complexo dedera size beleza bom então é isso que eu queria compartilhar com você nesse vídeo eu espero que você tenha gostado muito obrigado pelo seu tempo e não se esqueça de me seguir lá no instagram é arroba meio no ponto dele açais se você tem o
linkedin não esquece de conectar comigo lá também se você não tem ainda cara faz isso logo porque a por lá que as empresas vão conectar com você tá bom bom muito obrigado então pelo seu tempo vejo vocês no próximo vídeo até mais
Related Videos
Qual Profissão de Dados, Eu DEVO SEGUIR?
27:27
Qual Profissão de Dados, Eu DEVO SEGUIR?
Comunidade DS
51,807 views
COMO ESTUDAR CIÊNCIA DE DADOS - SIGA ESSE MAPA!
25:42
COMO ESTUDAR CIÊNCIA DE DADOS - SIGA ESSE ...
Comunidade DS
73,604 views
Episódio 1 - Cientista de Dados, Por Onde Começar?
32:14
Episódio 1 - Cientista de Dados, Por Onde ...
Data Science Academy
132,051 views
5 Impactful Data Science Projects For Your Portfolio
7:28
5 Impactful Data Science Projects For Your...
Ken Jee
104,329 views
5 Essential Data Science Projects for Your Portfolio
6:54
5 Essential Data Science Projects for Your...
Ken Jee
75,298 views
5 Dicas para Conseguir um Emprego com Data Scientist!!
28:55
5 Dicas para Conseguir um Emprego com Data...
Comunidade DS
4,470 views
Pandas for Data Science in 20 Minutes | Python Crash Course
23:06
Pandas for Data Science in 20 Minutes | Py...
Nicholas Renotte
134,084 views
Os 7 Mitos da Ciência de Dados que Você Precisa Saber!
33:29
Os 7 Mitos da Ciência de Dados que Você Pr...
Comunidade DS
18,476 views
How I'd Learn AI (If I Had to Start Over)
15:04
How I'd Learn AI (If I Had to Start Over)
Thu Vu data analytics
851,449 views
Como ingressar no MERCADO de DATA SCIENCE | Bit de Prosa #8 (Especial Alura)
29:30
Como ingressar no MERCADO de DATA SCIENCE ...
Peixe Babel
34,519 views
Qual A Diferença Entre o Data Analyst e o Data Scientist??
23:01
Qual A Diferença Entre o Data Analyst e o ...
Comunidade DS
64,514 views
What is Data Science? | Introduction to Data Science | Data Science for Beginners | Simplilearn
49:49
What is Data Science? | Introduction to Da...
Simplilearn
531,251 views
O QUE É CIÊNCIA DE DADOS? E COMO APRENDER?
24:45
O QUE É CIÊNCIA DE DADOS? E COMO APRENDER?
Comunidade DS
24,237 views
How to turn data into stories
50:43
How to turn data into stories
storytelling with data
261,679 views
MELHOR FORMA DE APRENDER PYTHON (Google Colab Notebook)
30:39
MELHOR FORMA DE APRENDER PYTHON (Google Co...
Filipe Deschamps
867,422 views
É Assim que Eu Aprendo Machine Learning Todos os Dias na Prática!! A Técnica de Elon Musk.
28:34
É Assim que Eu Aprendo Machine Learning To...
Comunidade DS
13,712 views
Here are the Top AI Tools for Research Data Analysis
15:40
Here are the Top AI Tools for Research Dat...
Andy Stapleton
28,452 views
CIÊNCIA DE DADOS: O QUE EU FARIA, SE TIVESSE QUE COMEÇAR DATA SCIENCE HOJE.
31:18
CIÊNCIA DE DADOS: O QUE EU FARIA, SE TIVES...
Comunidade DS
512,371 views
How to Improve LLMs with RAG (Overview + Python Code)
21:41
How to Improve LLMs with RAG (Overview + P...
Shaw Talebi
71,332 views
Os 3 NÍVEIS de um DATA SCIENTIST.
31:58
Os 3 NÍVEIS de um DATA SCIENTIST.
Comunidade DS
13,451 views
Copyright © 2025. Made with ♥ in London by YTScribe.com