Formação Profissional em Computação - Ciência de Dados

14.17k views2651 WordsCopy TextShare
UNIVESP
univesp.br Eixo de Computação - COM200 Univesp - Universidade Virtual do Estado de São Paulo Profes...
Video Transcript:
E aí [Música] o Olá pessoal sejam bem vindos a semana sete da disciplina a formação profissional em computação vamos a nossa primeira aula então na aula de hoje nós vamos falar sobre Ciência de dados ciência de dados ou data Science é o estudo disciplinado dos dados e informações que estão aí em diferentes tipos de negócio né the bizness e todas as visões que podem existir há cerca de um determinado assunto é uma ciência que busca estudar informações o processo de captura a transformação a geração e análise dos dados a ciência de dados ela envolve diferentes
disciplinas né mas principalmente as áreas de Ciências da Computação estatística matemática e conhecimentos de negócios administração engenharia de computação podemos afirmar que o grande volume de dados disponíveis atualmente Esse é o que está mudando o mundo né e a ciência de dados aí tem ajudado bastante nessa questão de transformação de acordo com uma previsão internacional aí do International data Corporation o intestino estima-se que para mais de a gente estima que a gente vai ter mais de 103 de trabalho de novos dados até 2023 então para você ter uma ideia aí da dimensão né O que
é um cê tablet né Quanto é quanto representa né hum cê tá byte é uma unidade de informação ou memória que corresponde aí é um sextilhão né então esse número imenso aí que vocês estão vendo O que é data Science né a data Analytics Big deita é são áreas aí de conhecimento que muitas vezes são confundidos né porque trabalham com o mesmo objeto né todas elas trabalham com os dados mas cada uma tem a sua especificidade quando a gente entra aí nos métodos nos trabalhos aí dos profissionais no dia a dia a uma gigantesca é
uma gigantesca transformação né na forma como as decisões são tomadas mas para isso é preciso saber coletar e extrair analisar classificar examinar comparar todos os dados que estiverem à disposição né E isso não é uma tarefa nada simples como vocês podem imaginar para saber qual destas Vertentes é melhor né qual dessas áreas é melhor é preciso aí conhecer um pouco da diferença entre as áreas bom para trabalhar em uma das três áreas é precisa ir ter habilidade com matemática em estatística apesar de lidar com o mesmo tipo de objeto né com dados cada uma das
áreas enxerga e trata os dados de uma maneira específica é porém ao senso comum de que as três áreas né data Science data analytic Big deita né Elas examinam conjunto de dados brutos né o objetivo aí de extrair informações que tem o valor né mas esse conhecimento vai ser aplicado de diferentes formas porque enquanto um analista de dados é indispensável a ideia dele trabalhar com estatística descritiva as inferências né para o analista de bi deita é preciso que eles estejam aí por dentro do que a gente chama de corte numérico né ou seja saber processar
os da o ericos em grande escala o cientista de dados ele lida com análise e métodos aí dos mais complexos por isso que é imprescindível né que ele conheça linguagens de programação né já para o quem trabalha comigo e deitar tudo isso aí acaba sendo um amplificado devido aí a grande quantidade de dados que precisamos ser tratados os conhecimentos aplicados em necessários para os cientistas de dados são mais específicos e técnicos né como por exemplo a importância de conhecer linguagens como o pai tão R Java por você ser mais mais né além das plataformas adulto
e SQL e resumo o cientista de idade é quem define o algoritmo que vai entregar a resposta aí da sua pesquisa no Google em uma fração de segundo e o alcance aí dos anúncios de sites e redes sociais ele e auxilia na experiência do usuário na hora de encontrar alguma coisa aí um serviço algum produto que ele busca aí nesse mundo de ofertas que a gente encontra Esses são só alguns desses exemplos possíveis aí para aplicar da data Science no dia a dia de uma empresa ou de algum negócio a definição simples para data Analytics
pode ser respondida como uma ciência para examinada brutos com o objetivo de responder aí distrair conclusões informações de valores daquele Dalla os cientistas e pesquisadores por exemplos utilizam data Analytics é para verificar ou desacreditar modelos e algumas hipóteses já as empresas utilizam data analytic para validar suas tomadas de decisões o analista de dados ele pode utilizar e como R para extrair dados e procurar informações aí de valor mas assim não é alguma coisa ele manda tória no dia a dia desse profissional o trabalho dele envolve aí Responder questões de rotina Geralmente as questões aí que
a empresa determina Resumindo né É para na lista de dados habilidade de conseguir transformar os dados em algo que possa se facilmente visualizado ou comunicasse adequadamente as informações importantes faz toda a diferença no momento aí de apresentar os resultados por isso é fundamental né Por um analista de dados que ele não seja só focado na parte de exatas né que ele tem a questão do Business da gerência né mas também a questão de criatividade a principal diferença que a gente pode encontrar entre Big deitar hidratação Esse é o volume de dados né Como o próprio
nome sugere né o Big E aí é uma ideia de volumoso né Sendo assim você não consegue utilizar as mesmas ferramentas e modelos estatísticos né que conseguiria utilizar e volumes menores de dados como é impossível processar todos esses dados usando a memória de um único computador usar os dados brutos podem ser estruturados ou não estruturados né no dia a dia de uma empresa o Big Data pode se tornar aí uma grande inundação se ela não for a tratada é de maneira adequada né e existem aí as questões dos três vezes né que trabalham em Bic
deita que é volume e velocidade variedade né a quantidade de dados é grande chegasse ao em altíssima velocidade com uma grande variedade de informação que precisa ser selecionada por isso ser um Oi Sara exige aí habilidades necessárias para qualquer um que queira se envolver com dados né e o diferencial é a capacidade analítica para conseguir determinar quais dados desse grande volume são os dados que vão ser relevantes né ou sim é preciso aí ter uma visão de que ter uma visão aí de quais negócios é uma visão de negócio está por dentro dos objetivos que
estão sendo traçados pela empresa e tentar entender aí os processos que buscam normalmente crescimento e aumento de lucro Hoje em dia a ideia do Big date é usada para auxiliar a definição de estratégias e tomadas de decisões nas empresas e atualmente tem sido aí fundamental para a tentativa das empresas sempre diminuir gastos e aumentar lucros né é data science é do aí o campo mais popular em um dos Campos mais populares hoje em dia e é um campo né uma carreira que decorre de múltiplas interações de disciplina né os dados são uma necessidade da indústria
e portanto a hidratação esse possui um monte de aplicações né E aí eu trouxe algumas nessas figuras né Por exemplo data Science na questão de Bank né é uma das maiores aplicações de hidratação esse e de brigadeiro né porque elas permitem que os bancos aí é acompanhar concorrência né com data Science os bancos podem gerenciar recursos de forma eficiente além de poder tomar decisões mais inteligentes aí em termos de detecção de fraude e gerenciamento de dados modelagem de risco análise preditiva em tempo real né Outra área bastante comum né para adaptarem-se é a área de
finanças e a data Science desempenha um papel aí fundamental na automação de várias tarefas financeiras né Assim como os bancos automatizam análise de riscos as indústrias financeira também usar as ciências de dados nesta tarefa os setores financeiros eles precisam automatizar análise de risco para realizar decisões estratégicas para as empresas né usando aí outras áreas como aprendizado de máquina eles identificam e monitora e conseguem aí priorizar Alguns riscos né esses algoritmos de aprendizado de máquina aumentam aí a eficiência de custo EA sustentabilidade aí dos modelos por meio do treinamento do dado de dados usando da idade
de clientes que estão disponibilizados É na mesma forma as instituições financeiras usam aprendizado de máquina a fazer aí análise preditiva ele permite que as empresas prevejam o valor vitalícios do cliente e seus movimentos aí no mercado de ação por exemplo Outra área de uso de data Science é a questão de manufatura no século 21 os cientistas de dados são os novos aí Trabalhadores de fábrica né hoje Fábio Isso significa que o cientista de dados adquirir uma posição-chave na indústria né a ciência de dados está sendo amplamente utilizada na indústria de manufatura pensando aí na utilização
de produção redução de custos aumento de lucro né Além disso com a gestão de tecnologias como riot que a gente falou em aulas passadas a ciência de dados permitiu aí para as empresas prevê potenciais problemas monitorar sistema e analisar fluxo de dados e em relação ao transporte é transporte é uma outra aplicação de hidratações importante né no setor aí de transporte a data Science está ativamente deixando aí marca na ideia de criação de ambientes de direção mais segura para motorista né Além disso ela também desempenha um papel fundamental na otimização aí dos veículos na adição
de autonomia para os motoristas né no setor de transporte adaptação esse aumentou ativamente seu múltiplos Aí com a introdução de carros autônomos né tem muitos valores é outra área também que tem aplicação de hidratações e bastante comum é a questão da área de saúde né os cuidados de saúde a ciência de dados Tem trabalhado dados grandes saltos nessa área né Principalmente quando se trata de análise de imagens médicas gene o Genoma descoberta de drogas modelagem e aí preditiva de Diagnóstico até os botes aí de saúde ou esses assistentes virtuais que foram bastante comentados em época
de pandemia Outra área de aplicação de hidratação Esse é o comércio eletrônico né o setor de comércio eletrônico e varejo Foram enormemente alavancadas pela pela ciência de dados né algumas das maneiras pelas quais a cesta de dar o transformou a indústria do Comércio né do em comer se foi identificar uma base de clientes em potencial para os produtos né E aí ela tá sendo amplamente utilizada com esse objetivo outra uso de análise preditiva para prever mercadoria e serviço né a ser oferecido comprando e a ciência de dado também é usada para definir estilos né estilo
de produtos que podem ser popular escrever tendo e a enfim consciências de dados as empresas estão otimizando suas estruturas né de preços e oferecendo aí é serviços mais adequados para os seus consumidores a quem nessa figura vocês vão ver uma na verdade é uma tabela onde você vai pensar que trabalha aí sexta de dado é legal né porque tem vantagens mas também tem algumas desvantagens né então é bom a gente falar um pouquinho das duas coisas esse artigo que está referenciada no slide né o artigo do Gol é um artigo aí White US data Science
foi o carrinho você vai escolher por quê que você vai escolher né datasight como carreira né ele cita aí vantagens e desvantagens né da ciência de dados como vantagem ele coloca aqui é uma área que está em demanda né aceita de dados tem uma grande demanda os candidatos a e eles têm inúmeras oportunidades de emprego que mais cresceu se vocês olharem a plataforma do LinkedIn né foi data-size e prevê-se que crie mais aí 11,5 milhões de empregos até 2026 Outra vantagem da área de da testar seu ciência de dados é abundância aí de posições né
de cargos que existem né existem poucas pessoas que possuem um conjunto aí de habilidades necessárias pressa área né isso torna a área menos saturada em comparação com outras áreas no setor de ti é uma terceira vantagem é que é uma carreira bem paga né data Science é um dos empregos Empregos hoje em dia mais bem pagos né o cientista de data Science ele foi classificado como um trabalho número um lá no site da Glass door né e o salário médio de um cientista de dados Estados Unidos né é 120 mil dólares né e ciência de
dados também como vantagem ela é uma ciência bastante versátil né existem inúmeras aplicações de ciências de dados e é amplamente utilizado em diferentes setores como citados aí saúde banco consultoria comércio eletrônico né Isso mostra aí a ver se a versatilidade dessa área é Outra vantagem é a ciência de dados ela torna os resultados né os valores os dados melhores as empresas exigem este a todos os cientistas que sejam qualificados né para processar analisar os dados que ela é tem né eles não apenas analisam os dados mas também a ideia né é que é o trabalho
melhora a qualidade né a ciência de dados torna os produtos mais qualificados né mas inteligentes EA ciência de dados acaba envolvendo com isso outras áreas por exemplo como aprendizado de máquina que permitiu a em indústria criar produtos adaptados a experiência sair dos clientes e embora datasciense seja uma opção de carreira muito lucrativa também algumas desvantagens aí nesse campo né E aí agora legal a gente vê também as desvantagens né sem ser de dados é ainda o termo o Goku obscuro E é porque não é ciência de dados ela é um tema Ainda bem geral não
tem uma definição exata Embora tenha se tornado uma palavra da moda é muito difícil aí pensar e escrever o significado exato de um cientista de dados do me na ciência de dados é praticamente impossível né os ser uma mistura aí de diferentes áreas né mexendo com estatística computação matemática né É e uma área de longe de ser Possivelmente dominar cada Campo igualmente aí por cada um dos especialistas dominar ciência de dados então é uma coisa bastante difícil né você Essa questão aí de mistura uma outra desvantagem que é uma grande quantidade de conhecimento né envolvido
né como vem devasta diversas áreas né além das conhecimentos aí é de computação estatística você muitas vezes pra o filme conhecimento aí de negócio né Outra desvantagem é o fato de trabalhar com dados arbitrários né E aí pode ser gerar resultados inesperados né o cientista de dados ele Analisa os dados faz previsões cuidadosos para facilitar o processo de tomada de decisão Muitas vezes os dados fornecidos são arbitrários né e não produzem aí resultados esperados isso também Pode falhar devido aí é o gerenciamento fraco uma má utilização dos recursos né isso normalmente leva a falha dos
resultados né E aí você não consegue tirar o valor da informação como pretendia é E aí por último né citado no artigo uma desvantagem de data sais é a questão de privacidade dos dados né Para muitos setores os dados são combustível não é o cientista de dados ajudam as empresas a tomar decisões baseadas em dados no entanto os dados utilizados no processo podem violar a privacidade de clientes né E aí os dados dos clientes são visíveis para a empresa e podem muitas vezes causar vazamentos devido a falhas de segurança as questões éticas relacionadas à preservação
entre a privacidade de dados e o seu uso tem sido aí uma preocupação e uma inclusive uma barreira para o avanço dessa água então era isso o pessoal queria conversar com você sobre Ciência de dados e espero que vocês tenham gostado até a próxima aula 1 E aí [Música]
Copyright © 2024. Made with ♥ in London by YTScribe.com