Introdução à Ciência de Dados - Introdução à Ciência de Dados

49.5k views3597 WordsCopy TextShare
UNIVESP
univesp.br Ciência de Dados - COM350 Univesp - Universidade Virtual do Estado de São Paulo Profess...
Video Transcript:
E aí [Música] o Olá seja bem-vindo à disciplina de introdução à Ciência de dados aqui nossa primeira aula nem vai fazer uma abordagem introdutória mesmo a sinceridade na verdade que eu acho muito importante para que você conheça os meandros da ciência de dados para que você não seja simplesmente um programador né trabalhar consciência de dados é muito mais do que programar e conhecer um contexto entregar resultados importantes no contexto de dado informação conhecimento bom primeira coisa que eu queria mostrar para vocês né é essa citação Aqui é do Albert Einstein que eu acho muito importante
né que eu e fala que uma das coisas mais importantes que você tem é que a gente nunca pode parar de se questionar a gente deve ser curioso o tempo todo essência de dados tem tudo a ver com isso essa de dados é exatamente 100 cidades é para quem é curioso para quem quer mergulhar nos dados para descobrir coisas bom então a gente não sabia mergulhar no dado nos dados para descobrir padrões mergulhar nos dados para fazer predições a gente vai fazer durante a disciplina bom a primeira coisa pessoal lá falar para vocês é sobre
a expressão data-size né essa expressão tem origem lá nos anos 1960 né mas a ciência de dados que a gente lida atualmente que a gente conhece atualmente é algo bem novo ou seja é algo que ainda está em transformação e que muitas vezes é controversa nesse cenário né é importante a gente compreender a diferença entre senso comum e ciência é importante saber que só que é Ciência de idade por isso é importante saber a diferença entre senso comum e ciência que que é o senso comum né o seja aquele conhecimento primário o senso comum pessoal
conhecimento do dia a dia né aquele conhecimento primário do cotidiano aquele conhecimento o hiato o que vem dos nossos sentidos das tradições de um modo geral o nosso contato diário com ambiente Ou seja quando a gente olha para o céu aí ver o sol nascendo né E por e hino do do Nascente ao poente e quando a gente começa a ver isso todo gente aprende isso se faz parte do nosso conhecimento primário do nosso senso comum né então o senso comum responde a grande parte das questões corriqueiras aquelas questões frequentes e diárias do dia a
dia você vê uma coisa observa E aí passa a fazer parte do seu conhecimento agora o conhecimento aprofundado que a gente chama de conhecimento secundário é aquele conhecimento que vem além das Sensações ele demanda uma observação sistemática ou seja aquela observação mais detalhada com mais dimensões que quer dizer mais dimensões com mais informações a respeito né a gente busca por quê e incomuns Esse é o conhecimento secundário ele não precisa ser definitivo isso é muito importante que vocês saibam a gente deve sempre questioná-lo ou seja buscar evolução buscar aprimoramento não é porque se viu uma
coisa que aquilo é a grande verdade não a ideia do conhecimento aprofundado é que a gente sempre busque mais conhecimento para compreender melhor esse processo o conhecimento exige provas deve gerar argumentos e coloca questões ele busca negar o que era certo e comprovar o que não era aceito é uma eterna busca isso é o conhecimento quando a gente começa a trabalhar consciência de dados é muito importante que a gente pensa a respeito disso mas é muito importante que a gente compreenda né que é uma eterna busca por informações novas por hipóteses novas por tentar descobrir
coisas novas é bom E aí também a gente parte do conhecimento do senso comum aí depois a gente passa pelo conhecimento aprofundado e a gente chega na ciência O que é a ciência efetivamente né a palavra ciência vem do latim né vendo ciência que significa conhecimento ou seja ciência refere-se a qualquer conhecimento ou prática sistemáticos em sentido estrito né ciência refere-se ao sistema de adquirir conhecimento baseado no método científico bem como ao corpo organizado de conhecimento conseguido através de Tais pesquisas e aí quando eu falo para vocês de método científico né E a minha experiência
como pesquisador como professor universitário a minha experiência do negócio de negócios também diz que no contexto de data-size isso tá tudo misturado né É muito importante que a gente compreenda o método científico que é feito nas E por quê Porque data-size também é Ciência e é por isso que eu trago para vocês para ter essa compreensão para que quando você tiver buscando resultados entregando resultados no dia a dia do que trabalhando consciência de dados você passa essa leitura e consegue consigo entregar bons resultados bom a ciência pessoal é aquele tipo de conhecimento que busca compreender
verdades ou leis naturais para explicar o funcionamento das coisas e do universo do modo geral que a gente estuda né a gente faz uso o método científico para estudar para compreender as coisas tão nosso redor como o universo funciona É por isso né que os cientistas fazem observações e verificações medições análises e classificações procurando entender os fatos e traduzidos para uma linguagem estatística Se você pegar essa frase e falar que isso é essência de dados e isso é ciência de dados ou seja a ciência de dados é uma parte né que estuda dado dentro do
contexto de ciência por isso que eu tô falando sobre isso para vocês por isso é importante que vocês saibam isso porque às vezes o olhar né é muito superficial sobre o problema de dados às vezes um olhar e não consegue experimentar todo o processo que é necessário num projeto de ciência de dados E aí então que vai entrar o método científico olha só que legal quando este olha para o método científico né o método científico é basicamente um conjunto de regras para gente realizar uma experiência com o objetivo de produzir um novo conhecimento além de
corrigir conhecimentos pré-existentes quando a gente fala de de conhecimento de métodos científicos está falando do que tá rolando uma receitinha de boa a ciência se constrói quando ela se constrói quando a gente consegue girar o conhecimento a partir do método científico Ou seja você organiza né um os passos para que você consiga atingir o conhecimento por quê que é mais importante em tudo isso é mais importante que haja a reprodutibilidade Ou seja quando você fez um experimento definir o seu método sente que chegou no resultado qualquer outra pessoa que faça o mesmo experimento vai chegar
no mesmo O resultado é assim que se faz ciência ou seja eu testei alguma algumas coisas né Fiz uma observação montei questões gerei hipóteses experimentei coisas criei análise e cheguei numa conclusão quando eu defino como que eu fiz tudo isso dentro de um conjunto de análises cheguei no resultado Eu tô construindo ciência se você baseado no que eu fiz consegue fazer reproduzir exatamente igual legal Está chegando o mesmo resultado pela mente já chegar no mesmo resultado isso é Ciência essas regras são necessárias justamente a proibição objetividade para gente direcionar né a pesquisa para produção de
conhecimentos válidos ou seja conhecimento científico é assim que se faz ciências e gente está falando de ciência de dados a gente vai ter que usar esse tipo de procedimento né E lembre-se sempre disso observação questões hipóteses experimento análise e conclusão só que isso baseado em dados quando a gente consegue fazer isso chegar em resultados a gente tá fazendo ciência de dados bom eu queria contar para vocês uma coisa interessante que a questão das revoluções científicas né as revoluções científicas são mudanças de paradigmas que alteram o modelo de fazer ciência né Thomas carne publicou em nossa
72 a estrutura das revoluções científicas que é um texto bem científico né é ir lá ele diz o seguinte Olha só quando um número suficiente de anomalia significativas se acumula contra um Pará Olá pessoal a disciplina científica é lançada em um estado de crise durante a crise novas ideias talvez anteriormente descartadas são experimentados o que que ele disse que a gente faz ciência de uma maneira e de repente você começa a perceber que aquilo não tá tendo mais resultado ou então que aquilo né o paradigma atual né é lançado no estado de crise porque você
percebe que talvez você tem aqui para uma novidade fazer coisas diferentes e é então aí que se Começam a surgir novas ideias de como fazer ciência e revolução científica alguns exemplos São Thomé meu lá na muito tempo atrás né É É defendia o gel centrismo ou seja apoiado pela igreja e dizia né que a a o senso comum é de que a terra tá parado e tudo girava em torno dela E aí Copérnico já vai nascer em nosso 1433 né as mais perto do ano 1500 ali ele trouxe aí o velho centrismo ou seja que
o sol é o centro de tudo e apresentou essa hipótese quando ele fala sobre isso quando Copérnico fala sobre o sol seu centro de tudo gerou se várias contexto sair né de dizer será que é isso mesmo será que está acontecendo que teve problemas com a igreja teve problemas em vários contextos E aí a ideia dele era baseado em pó tela baseada em estudos então isso só pode ser confirmado com galinha bem aí exatamente 50 anos depois de Copérnico foi ele que com o telescópio conseguiu provar né a partir de observação de que realmente né
o sol era o centro e não a terra e aí pessoal Galileu Galilei foi condenado pela Santa Inquisição suas descobertas né apresentar uma grande revolução mas ele sofreu né até comprovar que isso realmente era verdade e algumas teorias de Newton nasceram a partir O Galileu Galilei Então é eu vou falar isso para você porque eu tô falando tudo isso para vocês que é importante você saber que vocês vão muitas vezes vão escutar dizer o seguinte estudar dados é uma grande besteira ou seja mais tarde estamos passando por uma nova revolução científica Será que a gente
está mudando a maneira de fazer ciências baseado em evidência de dados essa é uma pergunta mas será que nós estamos realmente transformando a maneira de fazer ciência maneira de enxergar é o contexto dos dados e usando ele para tomar decisões bom jingwei né um cientista da Computação defendia a teoria de que a ciência vive seu quarto paradigma ou seja tem o primeiro paradigma lá na ciência empírica que era baseada praticamente observação depois ela teve a ciência teórica baseada em teorias matemáticas modelos de estudo matemático habilite com esse tipo de coisa depois a gente teve a
parte da seis computacional que era baseada em simulações computacionais Ou seja a partir do momento que os modelos matemáticos como é difícil de serem é testado que os da ciência computacional ou seja a pessoa testar isso e agora a gente vive with Science que que é o is Science é a ciência baseada em dados baseado em evidências então está passando por uma transformação está entrando num mundo novo que é baseado na ciência que estuda dados ela isso que ela Analisa para poder gerar resultados e o que é Ciência de dados né O que que a
gente vai estudar aqui é uma porção de definições necessidades amar é interdisciplinar voltada para o estudo e análise de dados que Visa a extração de conhecimento detecção de padrões e obtenção de insights para possíveis tomadas de decisão Ou seja a gente vai extrair dados de várias fontes de várias bases rodar processos né você detectar padrões é obter insights para poder tomar decisão agência de está de dados a idade da produção quando ele é feito né até o momento que é descartado e a partir daí extrair informação extrai conhecimento bom a gente pode pensar também pessoal
sobre a ciência de dados né a gente parte do princípio que a ciência de dados é uma ciência né Sai se data-size a ideia que você Gere hipóteses A partir de uma observação E então utilize os dados para compreender-se a hipótese confirmará ou não o utilizamos de forma estratégica posteriormente pensa no seguinte ciência de dados que eu tenho um conjunto de dados que eu tenho uma hipótese Será que tá acontecendo essa minha hipótese né aí olhando para essa hipótese eu vou experimentar vou testar por criar modelos matemáticos vou aplicar esses processos nos dados que eu
vou ter respostas essa hipótese se confirmou esta hipótese não se confirmou e se ela se confirmou não eu vou ter respostas para que para poder tomar decisões e assim que a gente pode pá a incidência de dados E aí sempre pensa em tomada de decisão orientada a dados A ideia é que a gente cria um processo de tomada de decisão baseado no que a gente está observando nos dados sobre a ciência de dados ainda pessoal é ela também é chamada de nada atrás né daqui para frente vai usar Principalmente nos slides né as letras de
S quando os vai me referindo a data Science para fazer referência ao tema então Tecnicamente DS né é uma exceção se dá para fazer uma inserção que ocorre entre habilidades de programação e de uso de ferramentas tecnológicas e muito conhecimento de estatística e matemática análise de modelos compreensão de técnicas só que vai passar mas eu tenho que ser um matemático para estudar tá senão a gente tem que conhecer técnicas tem coisa técnicas de estatística e a gente vai ver isso por meio de modelos que a gente vai aplicar principalmente lá na frente na parte do
machine learning né para poder gerar os resultados há pessoas que entendem de programação e pessoas que entende de matemática estatística enfim mas dentro de um contexto de compreender como que acontece o processo eu quero mostrar para vocês é bom a gente vai passar também de competência significativa em uma área do conhecimento com capacidade de analisar informação e resolver problema isso é o mais importante é eu sempre digo que para você fazer uma boa analisar sem saber exatamente Que tipo de dado está tratando o que representa aqueles dados é que tipo de informação tem ali se
você não conhece nada dali É muito difícil que você conseguiu fazer uma análise e chegar no resultado porque porque a sua o seu conhecimento sobre o tema vai te limitar né a experimentar algumas coisas que uma pessoa que conhece o tema conseguiria fazer isso é muito importante que você conheça a área que Você estude sobre o tema o domínio que você vai aplicar a ciência de dados bom cá entre nós é é de profissionais que saibam lidar com dados em suas mais variadas Vertentes pessoal muito importante isso é muito importante que você abstraia é muito
importante que você olha para o problema é muito importante que você olha para qual empresa está aplicando na rede Ah tá qual conjunto de dados para qual setor da empresa que tipo de restaurante gostaria de buscar Que tipo de usar de gostaria de entregar isso é muito importante é muito mais importante do que simplesmente programar Então você precisa conhecer programação você precisa conhecer matemática estatística no contexto sem ser de dados você precisa conhecer muito bem a área que vai trabalhar e também você precisa abstrair né Consegui é compreender todo o processo esse processo que a
gente tá aprendendo agora e não tem como negar é datasciense é estatística moderna né entretanto com todas as diferenças como do proporcionou quais diferenças o mundo de tecnologia Mas tem uma tecnologia está completamente diferente então a data sais É com certeza a estatística moderna por que que eu estudo data-size né Porque aumentou demais pessoal a geração EA produção de dados curso de qualquer lugar com sensor com internet com dispositivo a gente gera dados o tempo todo o que você faz um pagamento com cartão de crédito né e ali dados a respeito de onde você tá
resultados no seu celular de Lu dados é de qual Bandeiras tá usando de que está comprando aonde você tá comprando é muito dado que é gerado a cada ação a cada fato que acontece o Big deitar uma realidade tão isso impor direto no estudo de tanta sais né dê a gente tem muito um contexto de direita em todos os processos que a gente faz o custo baixo ainda alto tá mas é muito mais baixo do que alguns anos atrás de armazenar dados o aumento da nossa capacidade de processamento gente vo Wilton que o bonita computacional
tive um e os estudos para poder fazer por exemplo orçamento atribuído esse tipo de coisa a evolução da tecnologia né de um de um modo geral e pela certeza que análise de dados é capaz de gerar conhecimento e vantagens em tomadas de decisões das mais variadas áreas cada vez mais a gente tem mais certeza de que análise de dados gera resultados que impactam diretamente no resultado das empresas e eu vou mostrar para vocês é é Oi Cleide Rubi falou algum tempo atrás é que os dados são novo petróleo mas se você olhar para essa gotinha
preta que tem na tela e lá dentro eu ia falar assim que esse petróleo precisa ser extraído para ser trabalhado será transformado em plástico ou seja fala assim que simplesmente os dados não gera o resultado a gente precisa estudar muito gerar né preparar ou seja trabalhar esses dados para que a gente possa ter os resultados Então isso é muito importante e se você for analisar né Google Facebook Instagram Microsoft Apple já sabem disso faz algum tempo ou seja eles tem como principal ativo o negócio o negócio deles é baseado em casa e já nasceram assim
essas empresas estão grandes empresas tomam todos os seus as suas decisões baseadas em dados nos nossos dados inclusive então é esse é o primeiro exemplo né de que realmente essas impressões melhores do mundo hoje em dia né se baseia em dados para poder tomar suas bom então Além de estudar pessoal né É É descobrir conhecimento em conjunto de dados não é uma tarefa de programador né eu vou falar muito disso né então é não é simplesmente só programar é conhecer contexto entender compreensão da análise é isso que faz a diferença e você ser alguém que
desenvolve projeto de data size é necessário um conjunto de habilidades né mas principalmente é necessária abre a mente para compreender os benefícios e as possibilidades que os dados podem nos oferecer a gente precisa abrir a cabeça perceber as coisas olhar ao redor quando você vai é comer em algum lugar quando você entra no ônibus quando você vai fazer uma viagem Observe como os dados estão começando a fazer parte do nosso mundo como os dados podem impactar as decisões é importante que você intercale estudos né com outros materiais mas que possa também estimular o cérebro para
ser um bom analista de dados algumas recomendações para você um é esses conteúdos aqui são muito legais né são alguns vídeos alguns filmes né que eu sugiro que vocês assistam tem na Netflix tem na internet enfim é que vale a pena porque é para criar mesmo a ideia de como que os dados podem modificar a vida das pessoas na vida real gente tem vários outros exemplos é eu tenho exemplo do Liverpool por exemplo que foi campeão de futebol time de futebol que foi campeão de tudo em 2019 eles contrataram Doutor em física teórica esses eram
muitos estudos né de data Science né estudos baseados no conceito de domínio de campo e eles contrataram o jogador contratar um técnico para poder fazer esse processo baseado análise de dados e finalmente foram campeão de tudo em 2019 baseado nesses estudos análise é muito história é muito legal a história do livro A gente outras empresas do Fiori ele tem vários exemplos aí de empresas que estão usando data-size bom só para finalizar né então data-size é sobre você descobrir conhecimento a partir dos dados e vai ser uma ciência e lembre-se sempre disso em seus projetos não
é sua programar a pessoa é contexto lembra sempre né é pensar a respeito gerar hipóteses a fazer análise será conclusão todo um processo parecido com o método científico os dados são novo petróleo gente vai falar um pouco mais sobre isso nem todo esse a gente programador inclusive em Python e r enfim é um bom analista de dados eu vou sempre falar disso para vocês né essa teoria toda que eu tô falando até agora é importante é muito importante é isso que vai transformar você num bom a lista de idade uma um bom profissional de datas
ais eu sei que vocês querem programar tão desesperados para programar a gente vai chegar nessa tem muita prática nessa sempre na primeira ajuda a compreender o processo é estudar data-size tem muito a ver com a sua capacidade de abstração É sobre o conjunto de dados qualquer é preciso ampliar o olhar é preciso que a gente Abra a mente o poder fazer projetos de data size você precisar compreendendo do processo eu tenho certeza que vai entregar resultados muito melhores para a gente se ver na próxima aula 1 [Música] E aí E aí [Música]
Copyright © 2024. Made with ♥ in London by YTScribe.com