boa noite pessoal pra quem estava aqui ontem com a gente a abertura já me conheceu eu sou ricardo captura ea gente fala um pouquinho ontem vocês devem ter visto sobre o domo devem ter visto sobre os dados dentro das redes a gente vai falar um pouquinho disso aqui também tá nem aí é só pra vocês agora em nossa conversa aqui vai ser sobre como decodificar na verdade o agente decodificou o perfil do profissional de ciências dados tá o que a gente vai falar nesses próximos 45 minutos aqui com vocês que eu vou trazer para vocês
45 minutos sobre quais são as características perfil que tipo de trabalho como funciona a vida de um cientista já no dia a dia o que ele produz o que não produz está então até para entender dentro dessa conversa com manuela conversa muito segmentada com um público bem específico eu queria entender de vocês assim quem de vocês é um cientista jade levanta a mão com 13 pessoas quatro pessoas doação do meu time então vamos considerar tá além das duas hoje outra pergunta quantos de vocês são da área de tecnologia agora não estão mais em casa quantos
de vocês são na área de ciência deixou caracteres na ciência matemática estatística e física bacana enquanto vocês são da área de negócio é só para direcionar nossa conversa bacana então a gente tem aqui 100% com alguma relação direta com tecnologia eo restante dos blocos que a gente vai acabar falando aqui tá bom como eu comentei meu nome é ricardo capa do meu dia a dia tá eu libero a a apresentações eo instituto de pesquisas e já dá cá para o que a gente faz no dia a dia é construir metodologia para a ciência de dados
e para a cultura analítica está nos nossos laboratórios a gente tem os pesquisadores os times de desenvolvimento de métodos para que as empresas possam acelerar o processo de uso de dados dentro da empresa e isso tem um pedaço que é cultura e se tem um pedaço que a ciência está em pedaços e analíticas ea gente vai misturar um pouco disso hoje tá só para vocês entenderem as metodologias que a gente desenvolve os a os algoritmos que a gente ajuda as empresas a a utilizar tá são usados por companhias de todo mundo tá então as companhias
que usam esses produtos hoje companhias que estão ligadas conosco são empresas de todos os tamanhos a maioria empresas grandes que estão implementando uma cultura analítica ou possui uma cultura analítica estão acelerando isso então os métodos e tudo que a gente está estudando estava embasado numa boa carga de informação aqui tá como é que vocês é importante colocar que a gente está preocupado lá com três blocos tá a primeira é de pesquisa e desenvolvimento de metodologia o segundo sobre projetos de construção de ciência de dados com alta complexidade e o terceiro é a educação os projetos
de educação e que fazem a gente vir até aqui e cultura construir junto com vocês o domo aqui que eu vou mostrar um pouquinho de isso aqui tá então é o que faz a gente dá espaço aqui eu perguntei pra vocês sobre as áreas de atuação exatamente porque sempre que a gente entra no negócio tão envolvido sempre três áreas na área de negócio uma área mais analítica e uma área mais de tecnologia tá o papel que a gente tenha sempre trazer metodologia para isso acontecer então nosso papel é meio que traduzir a com uma metodologia
mais simples para que as áreas de negócio tecnologia a ciência e técnica acelera isso de uma forma mais rápida e lenta do negócio tá tá fazendo uma breve introdução por que vocês vão fazer essas perguntas durante a nossa conversa quando a gente entra numa companhia usa e um cientista de dados começa a entrar dentro de uma companhia como aconteceu o processo de evolução da taxa do iva que é isso uma mentalidade de uso de dados mais própria ea gente tem lá uma curva de maturidade da equipe adriano que mostra como é que as pessoas crescem
e evoluem com o uso de dados o que a gente gostaria que a gente imagina é que com essa evolução o que a gente vai ter ali na frente são componentes muito mais analíticas o que hoje estão o futuro vai ser muito mais analítico do que é hoje a gente gosta até do lema de carregar o mantra de que sempre que a gente torturada dados de uma forma bacana eles vão acabar confessando alguma coisa importante pra gente tá então a gente acredita que torturados é uma forma de extrair valor e coisas importantes dentro dele tá
bom o que a gente está falando de cientistas jogos esse ano a gente publicou uma pesquisa uma importante pesquisa importante estudo lá nos estados unidos e explicou que o brasil tá que fala de sunset coisas importantes que vão acontecer em 2009 sobre dados tá e se deita tim que é uma forma de explorar isso traz sete pontos como comentei a gente fala de fosse queijo a gente fala de privacidade a gente fala de algoritmos errantes vou mandar pra no final aqui vai ter um link para vocês poderem baixar essa pesquisa completa mas a nossa conversa
aqui é sobre uma coisa que está acontecendo que é uma bolha de cientistas dados o que a gente está vendo aqui cientistas dados virou uma grande febre tá todo mundo falando disso todo mundo quer ser cientista de dados todo mundo tá trazendo isso como um tema relevante para discussão tá o que a gente acabou percebendo é que as tarefas está de programação estatística negócio a gente está tentando reduzir a luz dentro de um profissional que resolva todos os problemas então quando a gente vê uma vaga de cientistas já dentro da internet por exemplo tem lá
e tem que saber programar eu tenho que saber estatística tem que saber matemática e à nossa pergunta o que a gente está provocando aqui nas conversas o que a gente estudou e trouxe pra vocês mas isso cabe dentro de um profissional só estou falando isso no ano seguinte está pensei que antes da gente falar dos cientistas dados a gente entra a gente tínhamos três outros profissionais envolvidos nisso está um deles eram os estatísticos os programadores técnicos e os analistas de mídias internas são três profissionais que agora a gente tem uma curva docentes dados crescente tá
seja esses dados ele foi o o time de ou as pessoas de estatística tiveram nos últimos anos a um crescimento dentro da atuação deles eles começaram a ser procurados pelos negócios às empresas pois assim eu preciso estar em risco essa curva com os programadores está sendo diferente já aumentou o número de procura por estatística e diminui o número de procura por tecnólogos específico pra dados está obviamente que a tecnologia revolução digital transmissão digital ta acelerando e todas as pessoas conheçam a tecnologia do negócio estamos pensando aqui em dados e o terceiro bloco que é o
business intelligence o pisa analytics a pessoas de negócio que sabe analisar dados tá ela teve também uma queda nos últimos anos até aqui até 2018 está ea curva que cresceu absurdamente foi a de cientistas dados então a gente pensa assim uma profissão que não existia até poucos anos atrás hoje tem uma curva de crescimento absurda ea questão é o que esse cara faz qual é o trabalho desse cara que vem substituiu outras profissões de uma forma tão ampla e entrega uma coisa desse tipo na então esse estudo está completo para lá dentro de campo o
porto eo instituto barra 2009 vocês acharem tá mas eu queria que a gente se concentrar se sobre as características e trilhas de conhecimento dos cientistas de dados hoje eu vou mostrar pra vocês caminhos pra se tornar os cientistas dados completo tá o único óleo docentes os dados tá aí a gente vai ver todos os caminhos possíveis para isso tá bom o essa história começa obviamente eu não vou me cedência é um pedaço que eu vou passar muito rápido na história de big data quem não está sabendo direito que é isso ainda tem que se acelerar
porque obviamente isso já tá na mão de todo mundo tá a história de muitos dados crescendo fazendo com que a gente até 2025 tenha zettabytes de dados na onde a gente vai ter uma capacidade uma quantidade de informação que a gente vai conseguir analisar todas 25 só 3% de toda a informação que a gente tem disponível no mundo somente 3 por cento até 2025 essa quantidade de informação que a gente consegue analisar tá isso obviamente já era um conceito por trás que o conceito de big data que a história da velocidade e volume e variedade
de dados que está à disposição de todo mundo tá possa tomar teria lesão já mostrei isso muitas vezes por aqui então estou só na televisão pra gente achar na conversa isso tudo com tanta informação disponível gerou um problema pra gente nesse momento que a gente está em forth ficado a gente está intoxicado por uma quantidade absurda que a gente tem de dados para consumir ea gente não tá mais consumindo conseguindo dar conta de consumir toda essa informação a gente já não tem mais habilidade de separar o que é relevante o que não é relevante de
dizer que não quer mais receber determinada informação já que a gente tem tantos grupos informação enviando informação pra gente e isso virou uma coisa que a gente já não tem mais controle sobre isso tá têm doenças atrelados a isso como síndrome de pânico como a stress e todas outras relacionadas lá dentro do estudo a gente fala especificamente também porque se queixam procurei a palhaça que a gente pensa no passado aqui a gente falou muito em força e queijo mas o que eu estou preocupado hoje trazer para vocês é que aqui surge uma nova uma nova
área aqui no meio dessa intoxicação por consumo excessivo de informação surge uma área que precisa organizar todo esses dados e essa informação está disponível e aqui entra aquela mistura que a gente falou nessa área de ciência de dados mistura então negócio ciência e tecnologia dentro do único bloco o esse bloco é tão importante que ele tem que pegar todos os dados que estão disponíveis não importa se é um dado da empresa dado social um dado pessoal transformar numa camada de informação para ajudar as empresas a gerar insights melhorar a performance de negócio e gerar inovação
então o papel desse negócio juntar três disciplinas que andavam sempre andaram separados por muito tempo agora pense que para resolver esse problema surge uma profissão então aqui nasceu uma profissão tá pra resolver e juntar todo esse problema e obviamente que ele está falando os cientistas de dados a chamada curva do google trends que eu puxei aqui de 2004 para cá vocês podem ver que até 2004 e 12 ali né treze alinhar a 0 não existia nenhuma busca pela por cientistas de dados ea partir daí a gente tem um pico de crescimento até o dia de
hoje com um determinado pico ali em 2018 está e haja curva crescente taxa teve um pico mas ela continua crescente então imaginei que um cargo que não haja uma função não é o próprio google caracterizou como um cargo tá é que não existia tem esse número de buscas hoje tá se a gente olhar as principais informações americanas com a profissão mais sexy mais desejada nem 2018 sentir seus dados foi a profissão que estava no topo do ranking está a gente vai bem segundo os desenvolvedores engenheiros gerentes de marketing e outros profissionais dentro dessa linha está
então a gente começa a ver que ele está em ascensão em todo mundo se a gente olhar para 2019 está de novo se repetiu o líder do ranking continua sendo sensualidade com uma produção mais sexy logo depois veio a enfermeira que antes não era tá então não estou fazendo uma correlação entre as informações mas romário é uma informação nova que surgiu aqui tá depois o gerente de marketing e assim por diante enquanto essa curva estava sofrendo esse tipo de ação tá enquanto isso aconteceu com os cientistas dados uma outra curva se modificou muito eu peguei
o mesmo período de 2004 pra catar e comparei os cientistas de dados que é uma curva quase inexistente lá embaixo azulzinha com os programadores repare que a curva dos programadores de lá pra cá e quando os cientistas de dados começa a crescer lá na ponta tá então a gente tem uma curva de profissões em queda enquanto a gente tem a curva de ciência de dados crescendo quando um contratante fala sempre a gente cá para a gente precisa contratar os cientistas de dados o que ele começa falando pra gente está na cabeça do contratante quando ele
fala sobre os incentivos dados a pessoas de negócio formando uma área desses dados ele tem muitas coisas a cabeça dele está lá vou resolver muitos problemas nosso problema é que a gente não pensa na politica mente a gente não tem modelo de decisão eficiente a gente é muito empírico a gente é muito a tomar decisão muito olhando pra gente não para os dados tão surge toda essa informação mas a cabeça do contratante ele acha ou ele acredita que ele vai botar uma camada de ciência dentro do negócio dele é um conceito que raiva em outras
universidades americanas já votaram muito tempo - mensais que é uma ciência aplicada efetivamente a área de negócio quando a pergunta pra eles o corpo a gente conversa com ele sobre o que é um cientista os dados eles dizem uma coisa muito interessante está a sexualidade é um profissional que tem habilidade de contar a história através de dados ele consegue pegar dados e transformar uma história mais fácil de ser consumida além disso ele também consegue extrair insights importantes de dados que outras pessoas não conseguem ver ele também consegue produzir análises sofisticadas que no dia a dia
a gente não consegue produzir isso a expectativa do contratante dos cientistas dados ele consegue misturar conhecimentos de matemática tecnologia e negócios em último e talvez chame mais atenção está o cientista ajudado está é um cara que faz análises e vive na califórnia ou seja tem um mito e volta do vale do silício a nossa história silicon valley é que faz com que o cara pensa que o cientista cidade que está lá é mais 77 no sentido de obviamente atraente do que os cientistas dados local o papel dos cientistas dados realmente tá é pegar essa história
de big data e reduzir para ser menos informação papel do cientista é transformar o bing em esmalte ele deveria estar fazendo esse processo de transformação a evolução de big data é muito legal que ela cria uma camada sempre que a gente tem uma dúvida e precisa tomar uma decisão a camada de dados nos dá suporte para isso nós já que a gente está falando é que essa camada de ciência tá entre a decisão eo big data precisa ser pilotada por alguém e é aqui que a gente está falando que entra o papel do cientista de
dados não é simplesmente trabalhar aqui dentro dos bancos da uma coisa do tipo ele precisa seu tradutor o cara que conecta os dados ou área de tecnologia os dados não acha que hoje com o negócio tá outra coisa que o contratante dos rios quando a gente chega lá e pergunta tá mais pra quem precisa de um cientista de dados eles jogam nos respondem é porque a gente precisa até algoritmos inteligência artificial dentro do negócio essa é a primeira resposta que a gente sempre escuta tá e aí vai a gente sempre questiona ele está mas sabe
que tem um processo de construção para isso né qatada chegar até algoritmos inteligência artificial que precisa olhar para os relatórios fazem análises monitorar a informação em tempo real criar novos indicadores e aí foi começar a ensinar regras com os algoritmos inteligência artificial a não mais os cientistas vai fazer tudo isso não gente não vai agentes a construir essa nossa barra escura de conhecimento para poder chegar lá em cima no algoritmo mais inteligente não algoritmo vai falhar o que faz com que o lixo fale menos é que a gente cria modelos matemáticos estatísticos e analíticos que
aperfeiçoem o processo de decisão tomou já está falando de matemática estatística criando modelos preditivos que a tecnologia num acelerado rodar no dia a dia na cabeça dos cientistas dados o problema é pior ainda porque por enquanto ele estava na cabeça do cara de negócio que está contratando na cabeça dos cientistas dado aparece aquele frame do que o que faz sentido os dados e aí o cientista de dados é um cara que tem que fazer todas as modelagens matemáticas e estatísticas é o cara tem que saber programar fazer é o caso de ele saber programa ainda
tá bc fazer errado por fazer código ele é um cara que também precisa ter domínio específico de negócio e também precisa saber comunicar tudo que ele faz porque se não conseguir traduzir os dados de uma forma simples e não consegue traduzir isso quando a gente foi mapear e fez pesquisas pra isso tudo isso aqui apareceu como características dos cientistas dados tá então cada item aqui seja estado precisa fazer programação de sistemas administração de banco de dados da administração de nuvem saber lidar com dados estruturado dados estruturado governança e conformidade gestão de projetos quando a gente
pegou e juntou toda essa informação o que a gente acabou descobrindo é que na verdade na cabeça dessas pessoas do próprio cientes dos dados que ele é somente 20% business depois 40% matemática 40% tecnologia na hora que ele fala disso eles e para cada ferramenta cada um recurso cada coisa que ele usa no dia a dia dele aparece um milhão de ferramentas lá a gente pegou esse ainda me ajudar mas o que conhece muito e o que conhece pouco também foi lá investigou os cientistas dados e descobriu que eles dizem que sabe lidar com dados
estruturados gestão de projetos matemática mas quando fala de linguagem natural de máquinas principalmente linguagem outras máquinas eles ainda não estão preparados isso aqui é muito contra 17 do pedal quando a gente compara isso com algoritmos que se o cara produz algoritmos em conhecer isso aqui significa que o algoritmo vai falhar então a gente tem coisas muito estou antes dentro da nossa conversa dentro do negócio tá quando a pergunta de negócio surge da área de informação é preciso tomar uma decisão precisa de uma informação ele pede isso pra área de ciência ea área de analytics constrói
e tecnologia automatiza a gente tem um processo contínuo esse bloco aqui é papel dos cientistas dados e onde a gente está enxergando hoje que os cientistas da área está mais envolvido é aqui dentro desse pedaço que os cientistas dados é mais importante quando a gente pergunta para ricardo eu estou acompanhando a conversa mas se perguntou se eu era sentir sua idade no começo eu não era então estou acompanhando são baixos mas não para aí o que faz sentir seus dados vou pegar um dado e transformar uma visualização para vocês consumirem comigo aqui essa informação aqui
eu vou mostrá la viva só de jogar o status do que a gente tem aqui é pessoas isso aqui é o deslocamento de americanos pessoas em deslocar em todos os estados unidos quando elas estão trabalhando trabalhando em casa na área de lazer deles comendo dormindo e agora vou negar que esse sensor às dez e meia da manhã e vocês estão vendo as pessoas se deslocando no dia a dia tá isso aqui que vocês vão ver é comportamento humano sendo analisado em tempo real tá a gente tá vendo como é que o ser humano se comporta
no dia a dia tá vai chegar meio dia vou acelerar esse relógio pra gente ver como é que funciona a essas pessoas no dia a dia então olha lá vou dar uma acelerada e vocês vão ver as pessoas no dia a dia delas o que acontece então vocês vão ver por exemplo a olha lá é uma equipe uma 15 da tarde tem 4% das pessoas nos estados unidos estão dormindo tá aí a gente vai ver que tem 31% trabalhando em casa no trabalho hoje por cento em casa só tem 4% das pessoas comendo vai chegar
no final do dia nos estados unidos tá vai aumentando o número de pessoas que vai lá se alimentar como bbb tá só 10 9 10% e logo depois está a gente consegue ver um movimento pra esporte estão só dois por cento dos americanos estão praticando esportes do final do dia na 14% se ele é tranquilo e aí a gente começa a ver uma debandada para a galera e dormir já a nós transformar pontinhos amarelas e vou dormir lá o que vocês estão vendo aqui é uma análise de dados e estatística transformada em vida como assim
aqui eu tenho dados estatísticos as pessoas preencheram relatório um questionário e entregar essa informação que horas elas faziam que cada coisa do dia e aqui a gente está vendo agora que a meia noite lá na hora tem 91% 92% das pessoas dormindo e aqui a galera da campos trabalhando 2 1% da galera campos trabalhando o resto tá lá em casa dormindo tá lá na casa deles dormindo então isso aqui está mostrando um comportamento o papel dos cientistas dados vai pegar esse dado bruto e transformar numa visão mais amigável vocês estão vendo pela primeira vez nessa
informação e vocês conseguem traduzir ela tá simples de ser consumida amiga a única coisa que ela tá visual e transformada numa análise para ajudar vocês a tomar uma decisão imagina que você seja um dono de um restaurante e tenho essa informação o que vocês têm um aplicativo de pedir comida em casa dele onde comida a essa informação ajuda ou seja alguma forma o que tem aqui só tem um dado qualificado organizado visual está a gente poderia fazer isso com vários dados comportamentais faz a gente poderia pegar entendeu os motivos dos divórcios por ocupação tal relacionar
divórcio com ocupação e trabalho das pessoas tá então a gente vai ver aqui ó aqui tem a média de divórcio em rosa tá então as pessoas que mais se divorciam pra cima e as que menos se você ou para baixo vocês podem ver que as pessoas de matemática e computação são as que menos se divorciam e já lá os mesmos batendo são as pessoas que mais se divorciam junto com os gestores de games tá quando eu passo isso aqui eu fico navegando e começa a ver as outras pessoas que estão dentro disso tá mas já
consigo fazer uma análise mais simples eu consigo fazer uma correlação de coisas que normalmente a gente não relaciona eu poderia cruzar isso aqui com remuneração também na seguinte não pára aí as pessoas que o médio salário menor se divorciam mais do que as pessoas com média de salário maior só que está muito claro não consigo ver esse gráfico que as pessoas com mais médicos salarial se esforçou muito menos do que as pessoas há aqui com menos salário tá aqui batendo está lá alguém o gestor de games a ea gente consegue ver isso fisicamente aqui a
gente está organizando informação e deixando ela mais simples o papel dos cientistas dados a meio que simplificar e traduzir essa informação se vocês votarem nossos clientes que vocês vão ver são essas informações que estavam dentro de bar banco de dados dormindo vamos usar esse termo ea gente acordou ela sem dentro de 10% de sistemas de informação e sistemas tomaram a decisão da rede globo lá tá lá na frente dessas telas só que foi criado por cientistas de dados lá na frente dessas telas têm vários tomadores de decisão sentado acelerando o processo decisório deles esses cientistas
de dados ficam organizando toda essa informação para poder fazer o processo decisório acelerar é óbvio tal gente que por trás disso tem um trabalho rádio que a então eu tenho que fazer um bom visual da informação e era isso se eu for um bom designer é um bom sentir seus dados não pára aí por trás disso para criar uma modelagem para criar um modelo de tomada de decisão eu tenho muita matemática por trás por exemplo aqui eu tenho um processo chamado gestão uma jornada do consumidor a gente precisa mapear todos os pontos de dados levar
para dentro de modelos analíticos estatísticos e fazer cruzamentos para descobrir padrões quando começa a descobrir os clãs e já começa a ver os padrões de comportamento dentro desses crianças pra só depois disso virá um plano de tomar a decisão então eu preciso fazer um modelo matemático para poder servir a uma informação para ser mais amigável então o papel dos cientistas dados não é ficar fazendo rebote esse é o papel da pessoa bebidas em casa da pessoa de biaggi que a gente já conhece já estariam nos negócios ele faça análise ele cruza dados isso é muito
importante por negócio a essa área responde muito mais por performance do que a ciência de dados o papel da ciência de dados é fazer o que é futuro e cruzamentos não tradicionais do negócio o resto tem que trazer várias performances que performance é preciso movimentar muito rápido os cientistas devem fazer uma descoberta que ainda não foi feita eu tenho que fazer algo que ainda não existe e praia amplificar isso tá eu peguei um caso que a gente construiu aqui dentro para poder trazer para vocês dentro do conceito do que significa o novo a gente produziu
pra cá uma coisa chamada data sky há dois anos atrás a gente teve aqui e colocou um painel de 17 metros de comprimento que as pessoas puxavam as linhas deixaram as opiniões dela e ficou um grande mapa diária de opinião das pessoas dentro daquilo esse ano a gente trouxe para dentro de um sistema então quando vocês olham vocês vão chegar lá michael barratt uma rede com as informações de vocês que vocês inserem dentro de um sistema dizendo com quem você se conectam e quais as conexões de conteúdo se você tem com outras pessoas isso é
um sistema que a gente criou aqui então ele mostra correlações entre todos os campuseiros esse é o modelo que foi criado pra cá como é que a gente criou esse negócio bom ele é uma listinha tá que o que a gente precisa fazer para criar isso pessoal da campos me ligou e me passou uma especificação da capa a gente organizar isso e aí foi que eu fiz ó organizamos o escopo do que deveria ser feito e aí o meu time nosso time começou a trabalhar tá o chico está aqui eu já vi o chico ali
o filme está por aqui também são pessoas que ajudaram a construir isso tá dia do dia 21 de janeiro mas menos pra cá eles fizeram o seguinte roteiro tá eles criaram situações da tabela de integração de uma definição de plataforma importação de dados de importação das reais simulação de erros e correções até que nasciam data vez com dados reais cada atividade dessas teve um envolvimento grande de horas tal obviamente a gente tem aqui de aplicação final está umas duzentas e oitenta linhas de código de aplicação que saíram de todo esse trabalho depois ele tem mais
umas 300 horas data vez de código tá sem contar as áreas de análise e informação e as escolas são códigos mas não tão complexos quanto à linguagem e 50 o que precisa ser feito tem aí uma 260 horas de trabalho envolvida nisso eu vou mostrar pra vocês uma linha de produção tá lá na nossa linha de produção lá dentro da ferramenta que a gente usa para gerenciar isso a gente começou a conversa no dia 21 de janeiro tá eu vou mostrar pra vocês como é que correu essa conversa de lá pra cá quatro pessoas falando
sobre o projeto isso tudo aconteceu de conversa de lá pra cá para produzir uma visualização de informação que dá dentro de um espaço aqui tá obviamente que tudo isso que vocês estão vendo toda essa informação no final do dia o qual foi a última mensagem que apareceu pra gente eu deixei de propósito aqui porque para você sentir um pouquinho que é o papel dos cientistas dados uma mensagem de erro que o sistema estava dando pau que a gente tentava corrigir ea gente discutindo e agora o que foi isso que estou a vida do cientista de
dados é isso tem mais erros do que sucesso a gente erra porque a gente está criando uma coisa que não foi criada ainda a gente está criando uma pegando uma hipótese e transformando em uma visualização aqui nesse caso uma visualização de dados para que as pessoas possam consumir de uma forma mais simples tá é óbvio que quando a gente olha cuidado sky que não teve lá dentro do domo ainda tá é muito legal ver isso produzido na que quando a gente olha isso tá como o sistema como lógica o que a gente fez uma coisa
incrível ele tem um um mapa estelar com todas as pessoas da campos conectada em se matar e lá nesse mapa de informação tá lá dentro desse espaço está vendo cada conexão de cada pessoa o do que vocês gostam com que vocês colectam quais as preferências que vocês têm então isso tudo está lá dentro do do mutá essa informação aqui quando a gente olha o resultado final é muito legal é muito legal ver uma rede de vocês dentro de um espaço criado não há uma linha do tempo dos últimos dez dias 15 dias para fazer com
que essa outras pessoas pudessem olhar os dados e analisar dados esse é o papel isso é que nunca foi criado o papel de entidade é criar algo novo traduzir essas coisas está o que a gente está analisando e pra quem quiser ver isso tudo tá a gente consegue analisar isso que a gente coletor de dados dos perfis as preferências gostos as conexões que vocês têm com outras pessoas pelas preferências vocês está quais os clusters de interesse que existem aqui dentro tudo isso a gente consegue análise ah tá a gente consegue ver o funcionamento da rede
viva na a gente consegue vê-la se comportando a essa pessoa que é conectada com aquela outra pessoa que mudou gosto dela durante a campus e se transformou durante tá tá muito bacana ver isso tá pra produzir esse negócio aqui está dentro de si tomo é uma coisa simples ele tem alguns skills necessários já a gente computou e sentou com vários filmes recentes dados para computar todos os skills que os cientistas dados precisa ter e a gente descobriu 206 skills tá então os cientistas dados para seus sentidos dados muito incrível precisa ter 206 skills plenamente desenvolvidos
tá o que a gente fez transformar isso num mapa tá esses 200 skills eles partem desde o momento de uma cultura analítica de conhecer o que significa dados o que é um data a lei que o que significa uma governança de dados o que significa automatizar o processo e aí depois a gente pode começar com as coisas mais básicas o que significa uma visão olap o que significa e tl o que é o de john o que quer o sql então a gente foi mapeando cada uma das coisas a estatística o que está dentro da
estatística histogramas os teoremas o que a gente tem todos os modelos estatísticos a dentro de código todas as formas de codificar a gente vai mapeando cada uma das funcionalidades e nível de desenvolvimento e isso aqui tal passando assim você já vai entender porque tá ele virou um mapa está na verdade tão completo e com essas 200 skills aqui tá que mapeou todas as possibilidades que um sente saudade que eles se conheceram poder trabalhar tá lá no final isso virou um negócio desse tamanho aqui isso aqui se vocês querem seus cientistas dados unicórnio você tem que
conhecer todas essas 200 duzentas e seis bolinhas plenamente tá quanto mais vocês conhecerem as 206 bolinhas mas vocês vão ser considerados como os cientistas dados único no catar algumas dessas bolinhas e aí eu vou dar uma dica dentro disso algumas dessas bolinhas são relacionadas com cultura tá outras são relacionadas com o negócio outras consciência outras com tecnologia se a gente olhar cada uma delas isoladamente está com cultura visualização e cultura com o negócio mais perguntas de negócio um pouquinho de estatística na um pouquinho de código um pouco de lata vez de outras estatísticas ciência na
física o que eu preciso conhecer e dentro de tecnologia quais são os outros blocos mas olhem a complexidade desse sistema para a gente se considerar os cientistas dados os cientistas de idade ele não vai ser 100% em todas as 200 esquecer isso que os disponíveis gente a gente precisa escolher um caminho então saiam do centro serão cientistas dados unicórnio quando vocês podem ver por esse mapa dos kills que está crescendo a todo dia com novas ferramentas novos recursos se torna cada dia mais complexo então vocês precisam caminho pra vocês vão estar mais à matemática na
estatística mas a tecnologia ou mais na área de negócio quando vocês escolherem esse caminho escolas skills dentro disso que vocês preenchem e aí se aprofundem dentro disso o virem genéricos quer uma opção cara vira um genérico para uma janela que faz o quê pois é não sei então a gente escolheu um caminho tá eu sou mais vincular a tecnologia ager é mais claro estatística acha mais vinculada negócio o o oxi é mais vinculado à tecnologia engenharia então cada um que tem no time nosso time é composto por isso a gente vai disponibilizar depois vou deixar
o nosso a gecas ponto science tá mas vou deixar depois foi usado para vocês pensarem as bolinhas você alguém completar 100% minha vida tá manda pra gente lá no meio de volta que a gente tem interesse em receber esse alguém seja 100% dos 206 skills a outra coisa que ele vai disponibilizar também tá é escolher um caminho um lado pra vocês ficarem tá néa radial que já se incapaz ou mais eu conheço mais nessa área que o conheci mas nessa área ou da outra área thackeray vocês dizem onde vocês são mais fortes então é um
jeito de a gente se enxergar o que eu queria comentar eu comecei falando da pesquisa tá aqui tá é que na verdade o que a gente pensa sobre a ciência de dados sobre os cientistas dados daqui pra frente está é uma coisa não tem mágica tá o que eu gostei pra vocês aqui no início da conversa tá sobre os perfis ele tem um desdobramento que a gente está estudando pra frente que a gente acredita que vai acontecer é o seguinte está os estatísticos pela característica de científica de estatística o matemático físico eles vão continuar crescendo
daqui pra frente lá em 2022 eles vão continuar crescendo porque o que está fazendo a diferença nas ciências dadas taag é a estatística a estatística matemática física tudo que é mais exato já a tecnologia e os programadores eles são muito importantes nesse processo tão obviamente que ele tem que dar a vida para aquele modelagem que vem da matemática estatística nós quem estava desaparecido no processo não era valorizado era área de matemática estatística seja dentro de negócio na academia a gente sabe da importância valor do acerto de negócio e começou a ganhar importância tá a tecnologia
está a gente está vendo o seguinte a gente teve agora um crescimento de tecnologia junto com as ciências dados e o que acaba acontecendo aqui daqui pra frente muitas das ferramentas de análise da adi não ser automatizadas então cuidado para não se amarrar uma profissão de análise progama código de data visa fazer dashboard é uma profissão que eu estou motivado a gente há almas a eu vou produzir códigos para as entidades cuidado com essa área a uma sem dinheiro claro que tem tem profissão por 15 anos pra frente tem mas muitos dos processos vai ser
automatizado por código gente tá então porque quando as modelagens tiverem mais firmes isso aqui vai derrubar um pouco mais a parte de código que ele na verdade não sei mais modelagens sendo replicadas por códigos já pronto está a terceira profissão e o terceiro é coisa que a gente colocou aqui que são as pessoas de negócio vão crescer porque é hoje um dos maiores problemas dentro do processo de ciências dados e ciência dentro do negócio é fazer as perguntas certas e as áreas de business intelligence bi a analista de dados elas foram caindo por causa da
onda dos cientistas dados agora que as empresas estão começando os atos decisórios não descobrimos que eles não pára aí só que não vai resolver todos os problemas eu preciso melhorar minha pergunta de negócio e s grande boom de ciência de dados dos cientistas de dados como recurso vai cair o cientista de dados como profissional que a gente está vendo nomeado ele vai cair umas que são muito simples enquanto cientistas vocês conhecem na vida de vocês é preciso uma longa jornada de estudo que pesquisa e muitas vezes que demora muito tempo para dar resultado muitos cientistas
existem cientistas porque não acha nada no caminho dele e ele vai buscar outro caminho de negócio é muito rádio esse caminho tá então a gente vai ter como em todas as áreas de negócio tá qualquer área de ciência que vocês pensarem com cara de negócio não só de tecnologia qualquer negócio tem menos cientista do que pessoas de negócio está em todas as áreas de negócio e na área de ciências dados vai ser da mesma forma a gente vai ter menos sente seus dados para que programadores pessoas obesas sedentárias business analytics e hitachi que os matemáticos
tá então o meu recado pra vocês a não entrarem numa onda de ciências dados tá que fala que isso é sexy é bacana e que tem muitas pessoas procuram estes já estão fazendo um pedido errado porque na verdade a cidade é muito mais ampla isso vai começar de street já com o tempo vocês estão vendo aqui outras profissões importantes que não tinham valor matemática estatística vão crescer e os cientistas vai parar onde ele tem que parar que é um papel síndico 70% de pesquisa tá 10% desenvolvimento porque tem que achar que esse relevante para produzir
a e 20% de aplicação tahereh um papel e isso é a vida de um cientista já estava só pra gente tirar um pouco não tira o glamour é legal sentir essa incrível né só que o mercado disso não é do tamanho dessa bolha que está se falando hoje meu recado vocês era esse tá arrecada um pouquinho mais diferença já veio com uma mensagem muito a vamos lá galera vamos abraçar não já a produção desses vai diminuir tá esse bumbum vai diminuir daqui pra frente ea gente tem outras oportunidades importantes no meio disso a gente meu
recado é esse o material que eu comentei atuando em casa a ponte saiu se vocês acham os links as informações disponíveis e sai lá tá tudo disponível a gente vai disponibilizar esse mapa para vocês pintar esse alguém fechar 100 por cento de volta pra gente por e mail por favor ele vai adorar falar com você está estiver fechado 100% das 206 skills está a adorar falar com vocês e eu fechei agora consigo nos prazos se alguém tiver uma pergunta alguma coisa que qualquer forma a gente obrigado por estarem aqui acompanhando está com a gente tá
alguém tem alguma pergunta tem um microfone aqui vamos lá falou boa noite oi eu sou milton cara minha pergunta vai em geral as empresas têm um pensamento muito de curto prazo certo e acho que a área de ciência de dados tenha 11 uma característica mais de longo prazo como se administra a chance essa ansiedade de seus clientes assim como se gerencia isso é eu acho que é uma ótima pergunta porque é uma pergunta que deveria ser feito por mais pessoas de negócio o que a gente mostra e administra dentro de um processo de implantação de
cultura analítica como a gente chama é que o desenvolvimento analítico é mais importante do que o científico para o negócio vai ter é importante ter ciência de negócio no brasil a gente tem muito pouca pesquisa desenvolvimento do negócio a nos estados unidos as empresas de tecnologia têm cerca de 18% de investimento em pesquisa e desenvolvimento no brasil essa curva é ridícula tá então assim acho que deveria ter mais ciências negócios mas se a gente não tem ou não tem essa a gente deveria ter mais analítico então a gente deve traduzir o que é se esses
dados para desenvolvimento analítico que deve estar em toda a organização sem restrição todas as pessoas deveriam ter uma mentalidade um desenvolvimento analítico eu acho que a gente tem que dividir essas coisas em dois blocos o que é desenvolvimento analítico e o que é desenvolvimento científico o científico vai ter uma verba menor do que o analítico canales que deveria receber muito aporte da empresa não só de dinheiro falando de recurso tempo a atenção do que propriamente científico à capital diminuindo a ciência não não eu sei o tamanho que a ciência tem no resto do mundo e
ela nunca vai ser maior do que a importância da política então a gente precisa aumentar então a para balancear é acelerar o desenvolvimento analítico e mantém a ciência em crescimento mas não que seja maior que seja o analista antônia vai dar suporte porque tarde o que está desenvolvendo dentro da ciência então acho que há a principal a abertura de cabeça desenvolvimento analítico menos do que o desenvolvimento científico acho que esse é o mote tinha mais uma pergunta ao ver que aquele bom a minha pergunta é basicamente sobre o futuro é boa assim a profissão de
cientistas dados já uma profissão recente atual e e pelo que você demonstrou ela não tem mais perspectiva de ter um crescimento tanto no futuro não têm suas tentações tentação então assim como outras profissões elas estão sendo substituídas automatizado ano qual sua perspectiva para os próximos anos e se unem os cientistas dados podem cair como profissão quais podem crescer no lugar dela assim como ele estava crescendo no lugar do programador do matemático assim por diante eu acho que a última slide ale responde às ordens de um pouco disso tá aquelas três profissões individuais têm a consciência
dentro de estatística matemática é tecnologia dentro de código bota bc tal ibiza analytics dentro de uma forma de análise de dados maior são as que vão crescer enquanto a ciência de dados vai ter uma queda dentro de seus próprios cenários até porque o que falou tenho até dentro do buc ele está aqui eu sugiro que vocês baixem que a gente acredita que 40 por cento do trabalho decente esses dados num prazo muito curto de tempo vai ser automatizado de cara tá alguém vai criar um código e vai substituir 1% e do outro o outro e
aí a gente vai ter 40% além de caras então isso jamais jogou boa parte dos cientistas dados que fica fazendo o trabalho braçal de uma modelagem que ele leva dois juízes e um time de 15 pessoas para ficar fazendo o modelo estatístico que daqui a pouco uma máquina pode começar a gerar ensaio de uma forma melhor então esse é uma das coisas a então eu acho que são essas três profissões que crescem e as entidades da uma retraída ela continua muito importante tá se alguém tem esse sonho de ser um cientista não desistia a gente
faz é se a treinar sente ta ta e não uma um analista uma coisa porque são professores perante san pedro malan mais uma pergunta vamos lá obrigado geralmente os exemplos que você usa são implementados dentro de alguma empresa ou instituição para los angeles aqueles dados ram tem um bom exemplo desse tipo de trabalho sendo a mais - voltado para o conhecimento do mundo da humanidade assim os dados que estão sendo gerados todos os dias desde o início o poder de dar várias respostas por aí está uma delas é o domo a gente está aprendendo sobre
o comportamento de vocês como sociedade trazendo para uma visualização a gente tá aprendendo muito sobre comportamento ale eu entendo a pergunta obviamente vou estender a ela mas é só para dizer que pode estar em qualquer pode estar em qualquer coisa tá mais especificamente sobre a tal pergunta aqui dentro da campos está fazendo um hackathon por exemplo junto com a unicef este ano sobre educação no ano passado está replicando agora aqui dentro para resolver problemas a partir de dados abertos de entender e identificar problemas dentro da sala dentro da da educação que podem ser aceleradas através
de dados tá então a gente já fez isso com educação já fez isso com saúde e têm muitos dados públicos pra gente usar pra fazer isso tá então acho que tem muita aplicação para a sociedade porque quando a gente fala m são lá do instituto a gente tá pensando no desenvolvimento analítico de sociedade eu de organizações e sociedade tá então isso é muito mais iniciativas de educação cultura obviamente está mais dentro de aplicações específicas gente pensa mais em atacar todos para que as pessoas possam replicar isso levará mais gente né então é um jeito de
pessoas apliquem no dia a dia delas a pergunta é legal porque ela conecta um ponto que a gente acredita muito que daqui pra frente todo mundo vai fazer analistas dados todo mundo vai precisar analisar dados a gente está carregando o nosso bolso uma quantidade de dados absurda na sobre a gente mesmo se tornou analisar estados quem vai analisar se há pouco assim o agente acabou dizer que vamos conseguir analisar 3% dos dados de todo mundo acha que vão analisar os seus dados então a gente vai ter que criar nossas próprias análises e ver o que
é importante analisar então acho que mais importante do que criar projetos acho que é super importante criar projetos para a sociedade mas talvez em poderá a sociedade para poder criar seus próprios projetos seja mais importante disse que eu acredito pelo menos lá porque a gente criou o instituto exatamente com essa pessoa pergunta superlegal fechou meu tempo mais uma mais uma aqui tem uma alma sobre a questão da profissão docente de dados já que vê que ela vai faleceu vai te oferecer ativamente a chumbar a opa o pum vai reduzir a aaa esse book está de
falar sobre essa profissão não sei lá e reduzir esse crescimento a china vai ser incorporada pela academia por empresas de consultoria que vão multiplicar que em atendimento de clientes eu gostaria de responder essa pergunta no que eu acredito que as empresas deveriam investir em pesquisa e desenvolvimento dentro delas meses criar seu próprio laboratório de ciência dentro de meu próprio negócio e operar um pedaço disso que seja com uma duas três pessoas numa operação pequena de ciências dados dentro do próprio negócio tá mas eu acredito que a cadeia na realidade é bom ser contratados mais academia
do que hoje se contrata para exatamente esse tipo de aplicação já a gente sabe que a academia para a aplicação do negócio tem um time bem diferente há há há então leva um time de peso para aplicar então eu acho que sim tá é é as consultorias têm um espaço para isso nós eu acho que a consultoria deveria estar mais centrada em ajudar a ajudar no desenvolvimento analítico do que o científico deixe esse pedaço para a academia ou empresas muito especializadas em ciência tá ou que a própria empresa construa sua área de ciências é uma
empresa de tecnologia que utiliza de dados de uma forma muito maior do que outras empresas mas acho que as consome e as empresas de serviço e as grandes empresas de consultoria tá é todas elas só não vou citar nomes para evitar problemas já estão criando grandes times de operações analíticas para dar suporte para os clientes tá eu acho que a oportunidade de negócio para empresas em voltas dadas em cima da camada analítica e não dá científica então tal por trás do negócio eu colocarei minhas fichas em analytics e não em c em essência que é
esse lote é maior tá aí você está mais cara prato é uma verdade esses dados se gente lembra que a sua empresa desse tamanho escolheu se pequena para trabalhar com projetos grandes não sou eu não sou uma só o boot que eu não sou uma empresa se vocês quiserem uma empresa grande vão pra analytics não paciência que a ciência é muito restrita é claro é sexo é legal trabalho e com isso quem quiser busca isso tá não eu não quero diminuir a importância disso mas o mercado é analíticas e não ciência gente muito obrigado uma
boa noite aproveite jogos