quando eu posso considerar que eu tô pronto para aplicar para uma vaga de cientista de dados bom e para quem não me conhece eu sou o André kochi sou cientista de dados e esse aqui é o meu canal onde eu falo sobre Ciência de dados sobre transição de carreira e tudo que tá relacionado a essa área e para quem tiver Interessado em fazer uma transição de carreira pra área de dados eu vou dar um workshop no dia 24 de Fevereiro agora de 2024 E lá eu vou abordar tema sobre como eu fiz essa minha transição
os cursos que eu fiz o que que eu recomendo você fazer Qual o roadmap para você se tornar um cientista de dados e também tirar as principais dúvidas que os participantes vão ter fora isso você vai poder também participar do nosso grupo de WhatsApp onde a gente criou um networking lá legal onde a gente troca ideias sobre trânsito de carreira sobre dúvida de dados e tudo mais tá então quem tiver interessado O link tá aqui no primeiro comentário fixado beleza agora sim vamos lá pro vídeo bom se sentir preparado para aplicar para uma vaga é
uma expressão muito forte Eu mesmo não me considero preparado para muitas vagas que eu tô aplicando e eu acho que isso é muito normal a gente ter tá esse sentimento mas é importante a gente conseguir reverter a gente conseguir racionalizar esse pensamento pra gente sim decidir se a gente tá mesmo preparado ou se a gente não tá preparado essa é uma dúvida que muita gente me manda e já me mandou aqui lá no Instagram também então quem não me segue segue lá para mandar perguntas por lá também eu acho super normal ter esse tipo de
dúvida porque eu tinha essa dúvida também quando eu tava entrando na área e às vezes eu também não me sinto 100% preparado para aplicar para uma vaga mas nessa hora a gente tem que parar e pensar racionalmente se isso faz sentido a gente pensar ou não E se faz sentido a gente aplicar ou não para aquela vaga e para ajudar a gente a entender melhor quando a gente tá preparado para aplicar paraa nossa primeira vaga para cientista de dados Eu dividi aqui em quatro etapas principais para aí sim se a gente conseguir responder a maior
parte delas ou todas elas positivamente a aí eu acho que você vai poder sim se considerar preparado para aplicar pra sua primeira vaga como cientista de dados Tá então vamos lá para essas essas etapas aqui a primeira etapa que eu considero interessante e que eu acho interessante você já ter feito é criado o seu portfólio para quando você for sim aplicar pra sua vaga de cientia de dados tá eu acho que criar um portfólio é interessante para duas coisas tá bom então o primeiro ponto interessante do portfólio é para você mostrar realmente para quem quer
te contratar que você sabe fazer o que você tá falando que você sabe fazer outra coisa interessante do portfólio é para você realmente aprender quando você cria de fato um projeto quando você utiliza os conceitos de ciência de dados em algum projeto Desde que seja real ou aqueles ficticios mesmo lá que a gente encontra no kegle por exemplo a gente tá fixando cada vez melhor as ideias né os conceitos das de ciência de dados de estatística de análise de dados e de modelagem mesmo né de criação de modelos de de machine learning a gente acaba
fixando esses todos esses conceitos muito melhor na nossa mente e também a gente vai se sentir muito mais confortável e confiantes quando a gente for participar de uma entrevista para cientista de dados tá então eu acho que a criação de portfólio é muito interessante para tudo isso tá bom primeiro tópico então é essa da criação de portfólio o segundo tópico Que Eu Acho interessante a gente ter também tem a ver com o portfólio mas é um passo além tá então é criação de projetos em todas as áreas pais né da ciência de dados ou seja
quando você for criar os seus projetos pro seu portfólio eu acho interessante que você tenha em mente que é interessante você ter projetos que vão desde a análise de dados até a criação de modelos passando por todas as etapas daí tá então tenha no seu portfólio um projeto só para análise de dados tá então criação de insights poderosos e de conclusões através somente da análise mesmo de dados tem um um outro projeto sobre eh visualização de dados então cria uma um aplicativo mesmo que gere visualizações interessantes pode até est junto com a análise de dados
acho que é interessante que esteja mesmo mas pode ser dois projetos ou um projeto maior que tem análise e eh criação de visualizações interessantes e partindo para machine learning Eu Acho interessante a gente ter um projeto sobre regressão um sobre classificação um sobre claster iação um para séries temporais outro para sistemas de recomendação e um usando um modelo de Deep learning tá então eu acho interessante que a gente tenha projetos englobando todas essas áreas porque uma que você vai mostrar um poder maior de conhecimento sobre Ciência de dados e outra que às vezes você vai
prestar para uma área por exemplo de fraudes que vai usar mais classificação porque são modelos de classificação de para encontrar anomalias Mas vamos supor que você só tenha criado projetos no seu portfólio sobre sobre regressão modelos de regressão E aí não vai funcionar muito bem tá porque se você só tem experiência com regressão E você tá prestando para uma área que vai usar essencialmente classificação aí as coisas não vão se encaixar então por isso que eu acho que é melhor você ter pelo menos um projeto em cada área porque vai ser bom para você e
também vai te dar mais confiança na hora de você participar de uma entrevista ou de uma resolução de um Case bom o terceiro ponto que eu acho interessante a gente ter em mente é o seguinte você consegue resolver um Case explicar cada etapa desse processo Porque uma coisa é a gente resolver um case e chegar numa resposta final outra coisa é a gente saber e explicar todas as etapas que e que a gente teve que fazer para resolver esse case e o que que isso quer dizer porque assim resolver um Case às vezes é é
mais simples você pode resolver um case de forma simples Tá então você coleta os dados lá que eles te deram E cria um modelo e e chega num resultado lá no modelo preditivo outra coisa é você fazer um Case completo e saber explicar todas a as etapas e também todas as decisões que você tomou dentro desse Case ou seja por que que você usou e um input com mediana e não com média algumas coisas simples dessa forma tá desse jeito porque que você usou o mínimo máximo scaler e não o Standard scaler por exemplo ou
por que que você usou os parâmetros x y e z e não o a o b e o c e por que que você usou modelos Tais e não out outros modelos enfim daí por diante eu acho interessante você saber pelo menos explicar ter uma justificativa porque você tomou essas decisões dentro do seu Case tá e o último ponto que eu acho muito interessante a gente tem em mente pra gente saber se a gente tá apto ou não para participar de um de um processo seletivo para cientistas de dados é o seguinte você sabe responder
as principais perguntas de uma entrevista de para um cientista de dados ou seja você sabe os principais conceitos envolvidos na ciência de dados e em machine learning eu levantei algumas perguntas aqui que eu acho interessante que vocês saibam responder devem ter outras que são importantes também que eu não levantei aqui mas eu achei essas aqui já de bom tamanho tá então vou falar aqui para vocês primeiro quais são os passos de um projeto de machine learning de ciência de dados eh qual a diferença entre um modelo supervisionado e não supervisionado dê exemplos de modelos supervisionados
quais modelos de classificação Você conhece S Como funciona uma árvore de decisão O que são ensembles dê exemplos de algum de alguns ensembles Quais as métricas principais para avaliar um modelo de classificação Qual a diferença entre Recall e Precision e quando você usa um e quando você usa o outro Quais as métricas principais para avaliação de modelos de regressão o que que é um MSE dê exemplos de modelos de clusterização como funcionam kins como você identifica se a sua clusterização tá boa ou não o o que que é overfitting quais os métodos para evitar um
overfitting o que que é regularização Qual a diferença entre L1 e L2 e como lidar com classes muito desbalanceadas bom e Resumindo aqui se você respondeu sim para todas essas perguntas aqui se você soube responder pelo menos a maioria dessas últimas perguntas que eu fiz você tá sim preparado para aplicar para uma vaga de cientista de dados Então vai fundo eu tenho fé em você e saiba que é normal a gente nunca se sentir preparado mas vai fundo que uma hora vai dar certo então até a próxima e tchau