Boa tarde a todos e a todas que nos acompanham no nosso webinar sobre ferramentas de visualização de dados r e powerb esse webinar é fruto da parceria entre a bu da UDESC o centro de informática e automação do Estado de Santa Catarina o sias e o programa de extensão Hub bíblio do curso de biblioteconomia da UDESC fiquem à vontade para se apresentarem pelo chat informando De onde vocês são o link para o certificado será encaminhado via chat durante a apresentação as perguntas também poderão ser realizadas pelo chat e serão respondidas ao final da apresentação do
nosso convidado ou então ao longo da apresentação então eu gostaria de agradecer imensamente ao nosso convidado José da Silva Júnior do sias que é engenheiro de dados na plataforma uma boa vista o ambiente de Big Data do centro de informática e automação do Estado de Santa Catarina o siasp José eu passo a palavra para ti Muito obrigado professora Vanessa mais uma vez aqui de est participando dessa rodada aqui de capacitação da biblioteca Universitária aesc eu agradeço aqui o suporte de todas as colegas que estão aqui dando eh sustentação para esse espaço aqui digital colega Eliane
a Karen aqui a professora também Vanessa mais uma vez né professora por essa chamada aqui para participar de mais uma um evento aqui de extensão do HUB bíblio o programa que a professora faz de extensão e claro eu tô aqui interagindo com os colegas que estão aqui tanto ao vivo né que vão estar aqui trazendo perguntas dúvidas mas eu sei que também que essa apresentação essa gravação vai ficar disponível depois na na página no canal do YouTube da biblioteca Universitária UDESC lá na aba lives né fica gravado e quem for depois de algum modo interagir
de forma assíncrona com esse com esse evento aqui com essa apresentação também já de pronto agradeço fica à disposição vai ter contato aqui depois aqui nas lâminas vou divulgar aqui material para ser acessado tudo vamos então agora a gente entrar nesse domínio nesse mundo aqui das Ferramentas de visualização de dados eu vou aqui passar pra aba da apresentação onde vai estar aqui disponível aqui no link embaixo Aqui ó eh bit.li bar capacitação under Buu under UDK todas essas lâminas aqui todos esses slides vão est aqui à disposição para ser acessados tá ele já tá numa
configuração do Google slide para que todos que tenham esse link possam acessar todas as referências que vão ser utilizadas aqui material que vai ser utilizado pras práticas aqui com R e com Power bi também estão todos aqui à disposição nesse material então eu também claro um QR code e aqui Claro pelo link para acessar direto pelo desktop a professora já apresentou aqui a minha origem né a empresa da qual eu faço parte e eu faço questão aqui de falar um pouquinho só do que que é essa plataforma Boa Vista que é uma uma divisão interna
dessa empresa onde eu trabalho que é o sias que é o centro de informática e automação do Estado de Santa Catarina que atua em diversas que a gente chama diversas frentes diversas verticais de tecnologia tanto da parte mais fundamental que parte de telecomunicações de uma rede que se estende por todo o Estado de Santa Catarina uma outra divisão também que trabalha com tecnologias de armazenamento data center né segurança da informação uma outra vertical que trabalha com software e a parte de inteligência que daí se gera aquela agregação do dado para gerar informação e também conhe
muito claro completando qu verticais que o ciasc atua né então nessa divisão aqui de inteligência de dados que é onde esse projeto Boa Vista eh eh se insere E aí aqui só para falar um pouquinho o que que é o BO vista é uma plataforma de interoperabilidade ou de integração de Agentes de serviço público né fazer com que os serviços consigam se estender para além do domínio específico de cada um deles então botei aqui vários agentes aqui vários atuantes desse universo não só da parte executiva de estado das pastas executivas né de saúde de Segurança
Pública educação mas também setor jurídica do estado legislativo então a plataforma Boa Vista dá oportunidade para essa integração desses serviços eu botei aqui embaixo Também quem tiver depois eh oportunidade de conhecer um pouquinho mais o projeto boav Vista tem aqui o link para um artigo que foi publicado que explica um pouquinho mais sobre o assunto obrigado então pela por essa oportunidade professora mais uma vez Vamos então começar a falar dessas dessas duas eh soluções poderosíssimas importantíssimas para pro mundo hoje digital pra sociedade da informação vamos dizer assim essa primeira ferramenta que nós vamos falar na
primeira parte da atividade que é o r é uma ferramenta já bem consolidada madura vamos dizer assim no domínio da tecnologia ela é uma linguagem muito completa de um propósito geral mas que acabou com o tempo se tornando muito muito especialista em estatística mas sem dúvida nenhuma R tem capacidade de propósitos diversos Mas acabou sendo conhecido vamos dizer assim pela comunidade como uma ferramenta eh especializada em estatística mas só como destaque aqui que claro R faz muito mais do que só estatística tá mas aqui paraa nossa utilidade na nossa nosso binário a parte de visualização
de dados r sim tá muito íntimo tá muito relacionado com esse domínio com essa interface estatística que a ferramenta apresenta e aqui eu trouxe só uma maneira de medir a importância que até hoje desde 1993 até hoje a ferramenta tem que é no levantamento que foi feito esse ano ó a plataforma stack overflow que todo ano faz o levantamento de uso de tecnologias aqui na nesse link que eu cliquei aqui você vai poder clicar se quiser conhecer um pouquinho mais sobre esse levantamento anual e o bom de conhecer é que existem aqui setores que são
entrevistados são feito levantamento para conhecer o perfil de quem utiliza código Quem produz soluções artefatos digitais né que existe aqui um setor que para além daqueles profissionais que trabalham no nicho específico da indústria de Tecnologia de software também da parte acadêmica que trabalha com software também existe um outro setor que eles chamam que é de outros codificadores ou outros coders Como eles chamam aqui que aí é onde se estende pra comunidade de jornalistas pesquisadores todo tipo de de profissional que desenvolve documentos técnicos que através da ferramenta de de software consegue gerar mais produtividade ou gerar
visualização como é o caso aqui para o uso do r e nesse conjunto nesse setor tá lá o r ó 10% dos entrevistados utilizam o r então aqui de algum modo eh comunica né a relevância da linguagem nesse domínio o outro a outra parte aqui do webinário que a gente vai falar hoje é com uma ferramenta que é poderosíssima também que é o Power bi essa uma ferramenta bem mais atual bem mais presente no no contexto que hoje a gente se encontra do contexto de diligência de negócios né então repar que é há uma diferença
ali de 25 anos nós vamos dizer entre o r e o Power bi né de lá para cá toda a transformação que a internet realizou né tal faz com que o o Power bi seja uma ferramenta diferente do R quando a gente trabalha com r a gente vamos dizer suja as mãos com código já Power Bi é uma ferramenta como se diz de alto nível você trabalha mais com objetos já bem construídos e aqueles objetos como se fossem módulos que você coloca ali dentro da sua do ambiente que você vai criar a sua visualização de
modo que você não precisa lidar com tantos eh características de código como é no caso do r e sim mais com configurações com setar valores como é o caso ver aqui na atividade que vai fazer e também eu trouxe uma maneira de medir a importância aqui do Power bi através de um de um de um medidor que é utilizado por uma empresa que é importantíssima no no setor de de de consultorias e orientações sobre Negócios em tecnologia que é o gartner e ele tem essa essa Esse instrumento aqui chamado de quadrante mág do gartner nesse
nesse instrumento para diversos setores para diversos produtos de tecnologia entre eles os produtos que são para inteligência de negócio eles têm esses eixos aqui ó que medem a a importância né dessas soluções como é o caso aqui no eixo X aqui tá em inglês mas aqui tá como a completeza da Visão da solução que é uma maneira que a empresa eh classifica consegue valorizar avaliar esses essas soluções e o outro eixo Y aqui que é a habilidade para executar ou seja eventualmente possa ter um um um um Business um produto que é realmente muito boa
mas a execução a realização daquela ideia consegue me ouvi tá E será que eu vamos lá consegue me ouvir vamos lá posso continuar aqui então ok então eu tava falando aqui da maneira de medir a importância do de F muito bem vamos lá então aqui eu vou retomar no tema que eu tava falando da maneira de avaliar o Power bi Power Como eu disse dentro dessa desse instrumento que é criado pelo gner ele fica com uma ferramenta de maior valor vamos dizer nesse modo de medir importância dessas soluções inteligência de dados então aando aqui fera
que é o r que é uma ferramenta muito consolidada e e uma outra ferramenta que é poderosíssima do ponto de vista de valor frente ao mundo dos negócios né hoje na sociedade da informação nós vamos fazer atividades com dois com essas duas linguagens hoje aqui tá a gente quando for falar em R A gente vai falar dentro de um paradigma que é chamado de programação literária onde os códigos que vão estar sendo utilizados ali eles vão estar rodando dentro de uma forma que é muito mais confortável pra leitura do que aquele simples código que é
mais duro quando a gente trabalha com desenvolvimento de software tá nesse paradigma que é o RL que em inglês Quer dizer read evaluate print loop os textos que são construídos ali para mostrar as soluções de no caso aqui de trabalhar com visualização de dados Eles foram criados a maneiraa como como esse paradigma desenvolvido ele é criado para que ele seja lido eh como se fosse um documento de not ou literatura vocês vão ver na sequência até deixei aqui também nessa parte aqui de programação literária um link pro outro evento que a gente fez aqui no
ano passado deixei aqui pausado aqui que foi sobre inteligência de dados Python e também foi falado bastante sobre esse tipo de paradigma aqui naquela ocasião tá Deixei também aqui a oportunidade aqui pra gente depois caso queiram ver existem diversas soluç hoje à disposição são eh soluções que podem ser acessados eh de forma livre tá assim como é o caso aqui do do Google cab como é o caso do Anaconda o Júpiter notebook são soluções desse paradigma aqui de de produção de programação literária mas aqui hoje como é o caso do R nós vamos trabalhar com
a solução que o r hoje coloca dentro da da instituição que foi criada no passado eh junto com a fundação do R Studio que é o posit e é essa solução que nós vamos usar hoje aqui na atividade de visualização de dados com R tá só coloca esse esse contexto de que a gente vai ver na sequência ali e aqui então nessa primeira parte da atividade com o r nós vamos est eh lidando com um conceito que foi implementado a partir de uma ideia que foi publicada em 1999 por um psicólogo estadunidense chamado lyand wilkinson
no livro que foi publicado em 1999 e até conta a história tem entrevista com ele no YouTube ele é uma ele é uma figura que acabou sendo influente no no universo de visualização de dados ele comenta que ele foi obrigado a escrever esse livro porque ele na época ele trabalhava na spss que era uma empresa de software também poderosíssima e ele tentava implementar essa ideia de de gramática dos gráficos e ele não conseguia ele falou que fi obrigado a escrever o livro paraa comunidade científica reconhecer que aquilo ali tinha valor E aí sim de algum
modo na indústria onde ele tava poder ter aquilo implementado mas a solução que melhor foi implementada dessa ideia da gramática dos gráficos foi implementada em R dentro do pacote que ficou conhecido como GG plot que o GG aqui vem do gramática dos gráficos e o GG plot ele é um pacote que ele faz parte de um conjunto maior de outros pacotes de outras capacidades que o r realiza que é o Tid diverse Esse pacote Tid diverse aqui ele é um pacote que ele é recomendado para todosos que trabalham com organização preparação limpeza estruturação dos dados
Então dentro desse desse pacotão que é o Tid ver que é o o Tide aqui do inglês Quer dizer organizado né seja é o universo das da organização dos dados e tem diversas capacidades aqui diversos instrumentos vamos dizer assim para fazer com que os dados passem de um estado às vezes mais bruto menos eh estruturado menos organizado para daí sim fazerem parte às vezes de um processo onde vai demandar esse tipo de organização Então deixe aqui também a referência quem quiser conhecer um pouquinho mais sobre T diverse mas claro o centro aqui da ideia pra
gente trabalhar com visualização de dados em R é essa ideia de gramática dos gráficos nós vamos falar aqui de como ela funciona que da ideia a partir desse do psicólogo aqui que é o Lyan wilkinson ele eh propôs que os gráficos pudessem ser eh separados em camadas para que eles fossem construídos a partir de camadas aqui nessa figura aqui mostro e também tem uma referência vocês podem ver depois o artigo do Livro onde faz parte aqui eh a primeira camada a camada mais básica né os dados brutos depois vem uma parte do mapeamento desses dados
que na gramática dos gráficos acabou sendo chamado de a estética do gráfico que é como você cruza um um domínio com o outro tem uma parte de transformação desses dados aqui a parte ó que é muito importante que a gente vai ver aqui que vai influenciar todo esse contexto de visualização de dados que é a definição da geometria desses dessas visualizações aí depois V um sistema de coordenadas as facetas que a gente vai ver que separar para melhorar a maneira de comunicar os dados quando são visualizados a escala desses dados desse desses enfim desses valores
e o tema que é a parte mais de eh de cores a parte de paletas de cores que é um no qual se vai dar o vamos dizer o o desfecho da composição dessa visualização de dados aqui então aprofundando um pouquinho mais sobre esse conceito de gramática dos dos gráficos o conceito que é Central ali que é o também proposto ali pelo lilan wilkinson ali né que é o conceito de geomas nessa proposição que ele faz da gramática dos dados ele vai propor que semelhante como acon com a linguagem por exemplo que existem os fonemas
que são as partículas fundamentais da língua língua falada né língua oral ou os grafemas que são as as unidades fundamentais da língua escrita ele faz a proposta de que também seria possível visualizar esse problema de ter esse problema de visualização a partir dos gemas que são as estruturas fundamentais para construção da visualização ou seja aqui ele coloca vamos dizer uma evolução das mais simples como até mesmo um espaço passo em branco ele também comunica algo né Ou seja é um geoma o mais simples de todos né como se fosse no caso de um forema a
pausa né E aqui também daí tem os geomas que são linhas curvas caminhos geomas que são polígonos retângulos aqui são eh ribons que são como se fossem faixas né como se fossem eh tiras eh Depois tem geomas com uma variável como é o caso de uma área uma densidade ou um histograma que pode ser também um gráfico de frequência ou barras que podem também ser geomas para comunicar eh a a visualização de uma variável depois a gente vai ver na sequência o exercício disso aplicado tá aqui por exemplo geomas com duas variáveis os geomas de
dier que é como se fosse um ponto com um pouquinho de um elemento aleatório que dá como se fosse uma vibração Zinha nesse tipo de geoma geomas de Label como se fossem cartões e etiquetas que mostram ali valores dentro de um de uma visação geomas de pontos aqui de quartis que são separações de regiões né como se fosse a mediana a metade dos valores o quarto dos valores né quartil ou 75% ou os decis então aqui também tem outros geomas que são de linhas de tendência que a gente chama de Smooth que é suavização diversos
outros geomas e essa lista esse conjunto de geomas para além só do trabalho original que foi proposto pelo psicólogo lá em 1999 o número de geomas mas tanto em R como depois em outras ferramentas soluções cresceu muito assim como também a a utilidade a importância a presença né de instrumentos baseados em dados teve pra sociedade como até hoje né a gente encontra esse vários tipos de novas aplicações Como são os novos geomas que foram construídos também então esse esse conceito aqui de geoma fica como fundamental aqui no power bi a gente vai ver que esse
nome geoma não aparece não é usado geoma lá no power bi contudo Quando nós formos fazer ali uma prática com o Power bi que nós fos criar aqui as visualizações nós vamos ver que para construir cada uma dessas visualizações nós vamos precisar utilizar aqui ó nessa parte depois nós vamos ver lá na na ferramenta precisar utilizar visuais que são estruturas padrões de cada um desses tipos de visualização que a gente quer ter ou seja muito próximo muito semelhante com aquele conceito da gramática dos gráficos que a gente tá vendo por exemplo no R que foi
implementado vamos dizer muito fiel a maneira como o autor propôs né lá em Como eu disse na na obra original da gramática dos gráficos mas a gente vê também que a ideia é a mesma né que aqui embora são chamados de visuais os geomas que são aquelas estruturas fundamentais que formam a visualização padrão de cada tipo que você quer dar também tá presente e existem diversos geomas eu deixei também aqui o link para depois quem quiser conhecer um pouquinho mais de referência né dos diversos visuais que existem para Power Bi e essa lista não para
de crescer aada cada dia no power bi tem lá a opção de Procurar novos geomas ou aliás perdão Procurar novos visuais e aí existem lá muitas outras opções lá de visuais para diversos tipos de visualização que você queira construir tá aqui pro Nossa atividade Então a gente vai trabalhar com um conjunto de dados que a a comunidade científica disponibilizou faz pouco tempo Acho que em 2016 quando esse conjunto de dados foi disponibilizado foi publicado ele é um conjunto de dados sobre os pinguins do arquipélagos de Palmer nós vamos utilizar esse conjunto de dados aqui para
trabalhar com as visualizações tanto em R como também no power bi ele ele é um conjunto de dados que ele foi disponibilizado pela Dra christien gorman que ela é parte de um laboratório de pesquisa ecológica de longo prazo da estação Palmer a estação Palmer só pra gente também trazer um pouco de contexto de conhecimento que vai depois servir para emergir as visual ações que elas vão fazer sentido a partir desse contexto aqui é é uma estação que tá instalada lá na Antártica no continente Antártida onde tem aqui ó só como curiosidade tá uma câmera ao
vivo onde você pode lá ver agora nesse instante como tá lá na janela vamos dizer assim da estação tá lá um tempo não tá tão tão ensolarado né E aqui também a gente consegue ter uma uma referência deixa eu pegar aqui a coordenada certinho pra gente só ver como ela tá eh instalada lá no na Antártida Vou botar aqui as coordenadas para vocês verem ó ele vai levar ali ó olha lá eu vou eu vou dar um zoom out primeiro pra gente ter a noção em referência ao continente ó lá a gente tá aqui um
pouquinho aqui acima lá embaixo na Antártida nessa parte que esse aqui é o arquipélago Palmer nome desse arquipélago e lá embaixo no cantinho tá instalada a estação Palmer Onde foi construído esse conjunto de dados a partir da pesquisa daquela pesquisadora que é chren gorman ali então ela disponibilizou esse conjunto de dados que é conhecido também hoje pela comunidade científica porque foi disponibilizado para uso público né a partir do do perfil de três espécies de pinguins que é o pinguim team Strap em inglês mas que em Esse ficou chamado como pinguim barbicha o pinguim gentu ou
gentou e o pinguim Adel que é o menorzinho deles e no caso do desse conjunto de dados as pesquisas foram feitas em Três Ilhas ali do arquipélago Palmer uma ilha que é a ilha bisc vou aproveitar pra gente dar uma olhadinha como é que é onde fica essa Ilha ali em relação à estação por exemplo Deixa eu botar aqui ela é um pouquinho mais para baixo Essa é a ilha Bisco onde vão estar os pinguins ali onde eles vão pesquisar da ecologia dos Pinguins a outra ilha que é a ilha Dream também do arquipélago Palmer
botar aqui a ilha Dream também D do da apresentação e deixa eu Peg esse aqui esse aqui pegar aqui eh chat privado Ok e também a outra ilha que é a ilha eh torgon que é a terceira Ilha desse conjunto que vai fazer parte desses desses dados aqui tá pra gente fechar aqui só essa visualização dessas Ilhas que fazem parte do arquipélago Então essa aqui é uma outra ilha tem tem menos gelo aqui né esse conjunto de então nessas Três Ilhas esse grupo de pesquisa eh observou o comportamento dessas três espécies de pinguins durante 3
anos a gente vai ver na sequência já o conjunto de dados ali o ano 2007 2008 e 2009 Ok então a gente vai começar a a trabalhar com esses com esses registros dessas desses pinguins nesse arquipélago aqui do arquipélago Palmer mas antes de fechar aqui já pra gente partir pra atividade só comentar que existe também aqui em Florianópolis eu que eu achei muito curioso isso quando eu fui pesquisar sobre os pinguins ali né a gente sabe todo todo ano a gente vê no inverno por exemplo os pinguins chegando aqui né então existem instituições aqui em
Florianópolis que lidam com com esse suporte a essas espécies que chegam aqui e na ilha tá então tem Unos videozinhos aqui deles soltando os pinguinzinhos testemunho aqui de veterinário pessoal falando sobre o trabalho deles eu deixei aqui também a referência da associação que faz esse trabalho aqui em Florianópolis só para complementar esse contexto aqui a associação R3 animal e deixei também aqui a um catálogo das diversas espécies existentes de pinguim porque eu queria entender qual era o tipo de pinguim que chegava aqui em Florianópolis e nenhum desses três aí que a gente vai ver aqui
eh tá dentro desse dessas espécies só pra gente entender talvez seja por conta de que essas três espécies são bem lá vamos dizer endógenas nativas lá da região tá E também claro a pesquisa Se estende né para para mais a gente vai Claro depois explorar um pouquinho mais sobre esse contexto dos Pinguins no desenvolvimento das visualizações de dados mas é importante a gente ter essa essa base de conhecimento como referência porque já fica desde já a ideia de que os dados por si só eles não vão ter Como comunicar conhecimento A não ser que eles
estejam projetado sobre uma base de conhecimento no caso aqui um contexto né que aí sim vai dar sentido nessa comunicação no caso aqui é a pesquisa esse grupo de pesquisa lá do arquipélago Power Então vamos lá aqui ó vamos começar a nossa atividade com o r a nossa primeira parte aqui do webinar aqui eu vou deixar o link para que seja acessado o projeto que ele tá tá lá para acesso eh todos acesso público com na plataforma posit Como eu disse para acessar essa plataforma você só precisa ter um login do Google aqui na parte
grátis aqui você acessa dá um acessar aqui você vai ter que como acessar com o e-mail do Google eh não precisa ser e-mail corporativo nada um e-mail pessoal pode ser usado para fazer o acesso só que eu já deixei pronto aqui já o projeto ó Então a gente vai poder acessar já o projeto que a gente vai trabalhar aqui já a atividade tá do r e claro só o caso meu aqui vou vou rodar com a minha conta pessoal aqui para acessar esse mesmo projeto que vocês vão Acessar agora claro eventualmente não conseguiu acessar tal
vai ficar a aula vai ficar o webinário gravado aqui para vocês poderem depois revisar e refazerem também essa atividade né pra gente conseguir rodar aqui no na Live aqui né mas claro eh também já tá pronto ali o link só acessar de aqui no link vou deixar também aqui pra professora se quiser botar no deixa eu ver no chat vou botar aqui só como no privado aqui que é o Projeto r e a gente então toca pra nossa primeira atividade aqui que vai ser nesse espaço aqui que é preparado pelo R pelo R Studio no
caso a empresa que é chamada deit que disponibiliza essa ferramenta de forma gratuita né Para que se utilizado e essa é a cara Inicial que vocês vão ter eu vou só fechar aqui ó para liberar um pouco de espaço aqui na parte da esquerda vou limpar também um pouquinho aqui para arrastar aqui pra direita vou limpar também isso aqui para ficar mais espaçoso aqui nosso espaço de trabalho e essa aqui vai ser é o nosso que eu disse lá no começo lá no paradigma repep a nossa programação literária por quê Porque reparem que a gente
vai ter aqui como se fosse um texto aqui que a gente vai passando Ó com imagens com código também claro né PR a gente executar cada uma dessas etapas aqui eu vou só fazer aqui uma uma limpeza aqui de reiniciar e limpar todas as saídas para que a gente consiga fazer tudo novamente juntos aqui e só um alerta tá isso aqui não é como acontece por exemplo com Google doc que se alguém subir no projeto eh e alterar alguma coisa vai também alterar do outro lado aqui nesse caso desse ambiente do R cada um que
acessa esse projeto cria eh contas como se fossem isoladas um do outro que vocês vão poder caso queiram criar variações do exercício ou repetir uma parte ou modificar uma um título um parâmetro que seja depois que a gente vê aqui que isso não altere nada aqui na minha parte então fiquem à vontade para vocês fazerem usar isso aqui como um laboratório mesmo de aprendizado e de teste tá para vocês construírem a sua a experiência aqui no caso de visualização com R então eu preparei aqui já esse notebook vamos dizer Esse bloco de notas aqui né
com imagens aqui depois vocês podem ver por exemplo que é é trivial embora bom vou apresentar um pouquinho aqui da interface tem algumas partes aqui de de de trabalhar com o arquivo de configuração aqui em cima semelhante a qualquer outra n solução de de de edição aqui né aqui a gente vai ter eh nesse nessa parte aqui tanto a parte visual que é essa que a gente tá vendo aqui que pode trabalhar direto aquilo que você escreve aquilo que você vai ver como também tem a parte depois aqui ó source que mostra o código que
tá por trás disso rodando então aqui é uma parte mais mais difícil né de lidar aqui não não tão confortável para para trabalhar mas sim tem a parte aqui que é a parte visual Onde você trabalha você pode editar aqui os textos tudo em cima com o editor de texto inserir figuras tudo eh eh de modo muito mais confortável né E nós vamos fazer essa atividade em cima de uma publicação que é R para ciência de dados a segunda edição essa edição foi também traduzida para o português deixa eu pegar aqui pra gente ver aqui
ela tem também é aberto o acesso é um livro de acesso público ele tá na plataforma github tá aqui o link para acessar e a o primeiro capítulo desse livro ele é sobre visualização de dados utilizando R né então é o que a gente vai fazer aqui nessa atividade aqui de do R que é Rodar esse primeiro capítulo como se fôssemos eh de forma sintética claro né resumida ler o primeiro capítulo desse livro que é R para ciência de dados que é o capítulo mais importante aqui que eles consideram que é a parte de visualização
dos dados primeiro entender como que a gente vai visualizar esses dados e depois sim ao longo do livro ele desenvolve toda a parte de como construir organizar esses dados como se fosse primeiro ele vai falar vamos dizer do dos frutos né dos resultados que isso gera que é a parte de visualização mas ao longo do livro depois desenvolve toda a infraestrutura vamos dizer necessária para esses resultados poder ser visualizados como tá no primeiro capítulo Então a gente vai rodar aqui ó eu preparei todas esses esses bloquinhos aqui já de código pra gente ir passando isso
de uma forma sequencial aqui sem precisar desenvolver isso na mão né que demora tempo isso aqui nessa primeira nesse primeiro bloco aqui eu vou eh rodar todas as bibliotecas todas as ferramentas as capacidades que vão ser demandadas para executar aqui nessa atividade Então deixei Prontinho aqui ele fala ó se não tem o pacote então instale Esse pacote então vai ficar tudo aqui instalad essa essa execução pode ser feita tanto aqui pelo botãozinho do Play aqui como também através eh colocando o cursor aqui dentro de um control enter que ele consegue rodar aqui a gente vai
chamar Aquele pacote para memória que é através desse comando aqui ó Library Tid diverse Essa é a sintaxe do R quando você precisa chamar uma uma capacidade uma ferramenta uma biblioteca pra memória do do do R do do Engenho R para ele conseguir executar aquilo que você precisa ou seja aqueles gráficos aquela aqueles geomas que nós falamos sobre a gramática dos gráficos eles vão est sendo executados através desse pacote T divers como eu mostrei que dentro dele tá lá o GG plot 2 que a gente comentou que de onde vem essa implementação em R daquela
ideia de gramática dos gráficos então eu vou executar aqui né para ele vai dizer ó tudo instalado tudo pronto para você trabalhar com essa ideia no livro que a gente vai est aqui falando como eu disse a gente vai est falando do primeiro capítulo do livro então eles eles falam também vão utilizar esse mesmo conjunto de dados do dos Pinguins lá do aqu pelag de Palmer também por isso que é importante a gente utilizar essa tanto essa referência né como também esse esse conjunto de dados porque tanto o contexto dele como também a maneira de
construir isso fica tudo junto ali integrado nesse capítulo do livro né Depois quiserem repetir né ou tem mais detalhes também no livro que a gente não vai aqui passar então aqui a gente faz uma chamada só para chamar lá num pacote que é chamado de dados os pinguins que é a maneira como eles chamaram esse conjunto de dados lá nesse pacote e a gente vai só dar um Ele nessa variável então eu atribuo para esse pacote que ele vai chamar ali com essa chamada que ele faz com esses dois pontos que é a maneira que
ele faz de chamar essa api como se diz então ele traz para cá para essa variável pinguins aqueles registros acho que eu já cliquei aqui mas novamente aqui então a gente só D uma olhadinha Oi então a professora me comentou que tem uma dúvida aqui pessoal entrou no no posit ali mas não tem o documento então é preciso clicar eh entrar com esse link aqui ó com esse código porque é esse código que vai levar diretamente até o projeto se entrar só pela pela página principal do posit claro eu mostrei a página principal ali só
para apresentar a solução mas é preciso entrar por esse link porque daí esse link sim vai levar diretamente a esse projeto antes de levar o projeto ele vai pedir para fazer o login toda aquela etapa inicial de credenciamento mas ao final de ess essa sequência de etapas ele vai chegar no projeto mas é importante que seja esse link aqui que seja colocado no na barra lá de endereços tá senão Claro a gente não vai conseguir chegar nele esse esse endereço aqui da nuvem vamos dizer assim leva diretamente ao projeto lá quem tiver com dúvida de
acessar lá ok vou voltar aqui para vamos lá então aqui ó eu tava com tinha acabado de olhar pra gente o conjunto de dados mas deixa eu ver no chat aqui só me confirmem se se o pessoal tá conseguindo acessar está propondo uhum para mim deu bom já tem algum feedback aqui de alguns colegas que Já conseguiram Ok vamos tocando na sequência como eu disse também vai ter oportunidade de forma assíncrona também de revisar né e construir essa experiência juntos tá então aqui a gente tem aqui o conjunto de dados como eu coloquei ela dentro
de uma variável pinguim eu chamei agora variável para gente dar uma olhadinha o que que são esses dados aqui nesse conjunto de dados que vem desse livro ali do eh R para a ciência de dados ele já tá todo traduzido o conjunto de de dados em português então o nome das das colunas ó o nome dos Campos já tá tudo traduzido ó que diz a espécie mas também os registros estão todos em português Ó vai ter o pinguim Adélia que é aquele inglês é o Adele né vai ter outros duas espécies que a gente vai
ver na sequência aqui ele pega só um pedaço aqui dos registros tá deixa eu avançar um pouco aqui ó vai ter o pinguim gentu aqui dentro e tem também o pinguim barbicha que são aquelas três espécies que estão sendo monitoradas naquela pesquisa lá do grupo de Ecologia de longo PR caso lá vão ter Três Ilhas a ilha tensen a ilha bisc e a ilha Dream que a gente deu uma olhada já onde é que elas ficam lá no no continente Antártida o comprimento do bico vai ter registros de cada espécie que foi coletado a profundidade
do bico que a gente vai ver que é da pontinha do bico até aqui já quase na testa vamos dizer assim do pinguim o comprimento da nadadeira a massa corporal ou o peso do pinguim né o sexo do pinguim e o ano em que foi coletado como eu disse são três anos de registros aqui 2007 2008 e 2009 deixar aqui esse conjunto para depois a gente dá uma olhada aqui eu só deixei também para divulgar que existe um outro comando do R que é para dar uma olhada que é chamado de glimpse que é só
uma olhada no conjunto de dados uma pequena amostra dos dados né então at lá mais uma vez ó o nome das espéces das ilhas os comprimentos de bico nadadeira a profundidade do bico a massa corporal o sexo e o ano em que foi coletado o registro e aqui a gente vai começar Então a nossa experiência de construção da visualização com esses dados Como eu disse aqui no r a gente vai implementar de forma fiel à ideia da gramática dos gráficos com aquele conceito de geoma que foi proposto lá pelo psicólogo Lyan wilking lé que a
primeira forma de chamar esses gráficos ó através desse pacote que é o ggplot é uma função isso no livro eles também comento com bastante detalhe sempre iniciamos o gráfico com a função ggplot Essa é a função preparada para fazer a chamada e criar essa visualização então sempre começa essa construção de uma visualização em R A partir da chamada essa função que é ggplot então definido o objeto na qual a gente vai construir aí esse esse gráfico essa visualização né então se a gente fizer só a chamada do ggplot com os dados que a gente chamou
lá os pinguins lá né dizendo ó os dados que nós vamos utilizar vão ser os pinguins Essa é a sintaxe Essa é a forma que eh o pacote trabalha tá E aí a gente vê que mesmo fazendo isso não não aparece ainda nada pra gente poder visualizar né claro tudo em branco aqui né Ou seja a gente vai passar aqui pela construção das camadas como a gente tinha visto ali antes um pouco na parte fundamental dos conceitos ali né no livro também vai falar olha você vai precisar então de um argumento chamado mapeamento ou mapping
em inglês Então essa função mapping ela vai começar a construir o mapeamento dentro desses dados que você quer visualizar e dentro do mapeamento ele vai utilizar Aí sim o que ele chama de uma camada estética onde você vai definir o eixo X e o eixo Y nessa visualização aqui para esse exemplo a gente vai usar como eixo X o comprimento da nadadeira e o eixo Y a massa corporal do pinguim ou seja o peso do pinguim e eu vou botar lá para executar esse código nós vemos que já tem alguma mudança que os eixos já
estão bem definidos e não só isso as escalas dos valores máximo e mínimo onde vai enquadrar essa janela de de comunicação né de visualização já tá preparado Mas a gente não vê ainda os os dados que a gente quer ver projetados compostos dentro dessa dessa janela aqui desse dessa visualização não tá pronto ainda né então daí é onde chega o conceito fundamental paraa construção dessa visualização que é o conceito de geoma então no livro também comenta lá que olha é preciso definir Então qual é o geoma que você vai utilizar assim como lá no power
bi a gente precisa de definir qual é o visual que a gente vai escolher para projetar aqueles dados né aquela informação aqui a gente precisa definir qual é o geoma que a gente vai utilizar então aqui eu coloco um parágrafo dizendo assim ó que o gráfico de barras usa geometria de barras que é no caso o geoma bar é assim que é chamado o nome desse geoma no R quando é um gráfico de linhas a gente vai usar o geom Line em inglês né vai utilizar esse geom Line quando a gente quiser construir uma visualização
S por exemplo que é muito utilizado em estatística que é o boxplot que mostra como é que é distribuído os registros a gente usa lá um outro geoma chamado geoma box plot e também para pontos tem o geoma Point então aqui de uma forma sintética eu coloco aqui repito aqui que olha a gente então vai ter um geoma para cada tipo de solução geoma de barra geoma de linha geoma de de pontos e assim começa então a nossa visualização desses registros porque a gente vai começar então a utilizar os geoma como nós temos ali diversas
observações como são por exemplo cada observação tem o seu valor de comprimento de nadadeira do pinguim e a massa corporal do pinguim isso são pontos que vão se distribuir vão se espalhar pela nossa visualização pela nossa janela e a gente então vai fazer dessa forma aqui ó vai manter aquela chamada dos dados data pinguin que é onde veio os dados pinguins nosso conjunto de dados ali né vai definir esse mapeamento dizendo que no X no eixo X eu quero complimento a nadadeira e no eixo y a massa corporal e por fora eu vou somar aqui
ó o meu geoma que eu vou dizer olha eu quero que você aplique o geoma de pontos e aqui a gente vai rodar e vai finalmente começar a ver esses resultados aqui na na tela né então aqui a gente aplicou um geoma um geoma de pontos que sozinho ele já distribuiu aqui com conjunto de dados Todas aquelas observações que fazem parte daquele conjunto elas são 34 quatro observações que tem naquele conjunto ali e a gente começa a ver uhum pode ser pode ser professora pode ser você quer falar ali uhum pessoal eh a gente tá
vendo aqui que tem algumas dúvidas né no chat eh o nosso palestrante José ele vai tomar uma aguinha dar uma respirada tempo também dele olhar essas dúvidas tá enquanto isso aquelas a aqueles e aquelas que não tiveram sucesso ali executando a primeira vez as instruções peç que por favor voltem ali na apresentação e tentem novamente juntamente ali com as dicas dos colegas que estão nos assistindo via chat tá então José me dá uma sinalização ali quando quando pudermos voltar eu dei uma olhada no chat aqui eu acho que a principal dúvida é como a gente
acessa o projeto né como comentou tem que ser naquela url que leva diretamente lá com o código do projeto que aquele 8738 557 Ok vios colegas comentando funcionou hum não funcionou para mim não funcionou mesmo com o link Alan Lucas comentou aqui pois é é estranho porque a gente é como se fosse uma uma uma um lugar reservado que ficou pra gente para esse projeto funcionar com essa URL eu vou pegar ela aqui ó e vou colocar aqui pra gente testar aqui Claro os colegas já comentaram que conseguiram acessar então A ideia é que você
com esse endereço é como se fosse uma página da internet né você vai diretamente lá para aquela página do projeto bu UD Desk Hub bíblio o que pode tá acontecendo é o que pode tá acontecendo é que você precisa tá credenciado ali para acessar né você precisa dar conta do Google como eu sugeri ali existem outras maneiras de acessar até pelo posit parece que tem conta do Facebook que ele aceita ou diretamente através do e-mail eu acho que ele manda o e-mail de confirmação o caminho que me par ser o mais rápido e mais fácil
é através de uma conta Google que ele já integra diretamente com o credenciamento do Google e já dá acesso para você ó aqui os colegas comentando Thiago memo entrei com a conta Google cliquei no link e disponibilizou queou fui dentro do posit cliquei em Abrir isso no posit ele vai mostrar o projeto Ali você vai clicar no projeto hum ele tem lá o projeto chamado webinar bu hum vocês pois Eh eu então eu eu testei com outras contas eu vou entrar com uma outra conta aqui pra gente ver pra gente ver juntos quer ver eu
vou sair da minha conta aqui aliás vou desconectar isso aqui deixa eu sair eu vou entrar com uma conta do meu trabalho aqui para mostrar como é esse esse esse caminho vamos lá contra Google mas vou entrar com o meu e-mail corporativo cópia temporária [Música] E aí É nesse sentido né de que ele vai criar uma cópia para você no seu no seu ambiente e não é o meu caso porque eu criei eu sou o criador do objeto né mas depois você vai poder salvar isso aqui semelhante nessa experiência que eu tô fazendo aqui ó
de acessar a conta lá no caso eu acessei com a conta do Google que do meu trabalho e aqui a experiência é essa a gente vai direto para esse projeto né ó deixa eu ver aqui entendi entendi os colegas comentaram então isso a sugestão é de entrar no no documento webinar bu Desk rmd perfeito e aqui vir em visual que é onde vai chegar naquele mesmo Ponto onde eu estou ali Ok usar o visual mode e a gente chega então naquele ponto Então é isso gente aqui faltou também apontar que vocês cliquem nesse esse arquivo
que é o webinar buud desk R markdown que é esse esse documento aqui que é o notebook eu acho que aí sim os colegas vão conseguir chegar nesse mesmo ponto onde a gente tá aqui ok então aqui tá o documento que é o webinar bu Desk rmd que é o r markdown que é justamente esse documento e vir na aba aqui visual para isso dar certo uma vez que vocês vão estar aqui isso aqui vai ser uma cópia temporária como a gente falou né mas você pode salvar permanentemente essa cópia no ambiente seu agora que
você foi credenciado dentro dessa plataforma posit Ok então eu vou sair aqui para voltar paraa minha conta lá onde a gente tava desenvolvendo o o exercício Dea só confirmar aqui é isso aí ó é isso aí então pessoal vamos nessa eu vou botar minha conta pessoal aqui ab bíblio Eita de novo deixa eu pegar aqui o link né Eu só vou tá aqui para est seguro de que a gente executou essas etapas aqui vamos lá eu vou vamos lá a gente tava chamando o pacote tá diverse a gente chamou o pacote dados a gente visualizou
um pouco o conjunto de dados a gente deu uma olhada aqui nos dados aqui e começou a construção da visualização a gente viu que primeiro somente a chamada dos dados não era suficiente era preciso construir mais camadas para isso né definir os eixos e a gente chegou aqui no ponto de definir o geoma de pontos né E aqui nesse ponto a gente consegue então começar a dar mais detalhes do contexto que a gente vai est lidando no caso a daquela pesquisa com os pinguins ali vamos deixar o José tomar água dele respirar acredito que tá
todo mundo já eh conseguiu acessar né pelo que a gente tá acompanhando aqui pelo chat eh a temos ali o link agora para os certificados tá então o link tá sendo ali direcionado no chat também eh também perguntas né à medida que forem que a gente for evoluindo aqui no webinar pode eh digitar ali no chat as perguntas e ao final a gente vai fazer aí uma rodada de perguntas com o José tá E é isso José deu já tô por Maguinha já respirou deu professora obrigado e então a gente vai agora começar a dar
um pouco enriquecer um pouco mais essa visualização a gente aqui ó vamos ver por exemplo como botar cores que separem que diferencie cada uma daquelas espécies repare que eu vou fazer a chamada Aqui ó com cores lá dentro do elemento de mapeamento e só dizer assim ó pegue o conjunto de dados que tem lá e e pegue a coluna espécie o nome da coluna lá é espécie e ele sozinho já vai fazer esse mapeamento de cada ele vê que são três espécies no conjunto de dados e cada espécie vai receber uma cor diferente então ele
já começa a trazer mais informação pro dentro da nossa visualização aqui né dos registros do dos Pinguins do Arquipélago de Palmer ele faz isso aqui de forma também já direta Como eu disse quando é uma variável categórica né que ele consegue entender que existem poucos valores ali o que que é chamado também esse processo de dimensionamento Além disso ggplot também Adiciona uma legenda de forma também já integrada né a gente precisa lá criar legenda né então esse tipo de conjunto de de informação começa a emergir aqui dessas visualizações é de uma forma muito direta e
o pacote de gplot faz isso na sequência a gente vai ver depois como salvar essas figuras para depois caso queiram eh enriquecer um trabalho com alguns dados né a gente pode também não só usar esses dados aqui Claro do arquipélago Palmer mas outros trabalhos que vocês possam querer desenvolver visualizações usar dados que depois vocês podem salvar esses gráficos aqui né para colocar nossos trabalhos a gente aqui vai agora enriquecer um pouco mais com informações de tendência de linhas de tendência que é um outro geoma que ele apresenta que ele tem à disposição que é o
geoma Smooth quer dizer em inglês suavização né então ele tem essa visualização aqui para cada uma das espécies ele mostra uma linha de tendência que do ponto de vista do conhecimento aqui que é no caso da biologia marinha a gente vê que as espécies que são menorzinhas né Elas vão crescendo quanto maior o comprimento na nadadeira o peso também vai crescendo né Ou seja é preciso uma nadadeira er maior no ponto de vista como se fosse da biologia né evolutiva maior para conseguir tracionar aquele corpo que vai crescendo também então cresce junto com com nadeira
a massa corporal de cada uma dessas espécies Isso é uma tendência da própria biologia né do do crescimento da maturação da da espécie ali mas também a gente consegue criar uma linha de tendência única que daí para isso a gente tira o a cor lá do mapeamento geral e bota cor no mapeamento específico aqui dos pontos ol olha só a gente tirou de lá a cor e bota aqui cor aqui ó na no geoma ponto isso é uma maneira de gente trazer a cor para dentro de um contexto mais específico onde ele não vai colocar
isso para todas as espécies e vai fazer só uma linha geral só para todos os pontos de modo que a gente vai ter uma única linha de tendência para Todas aquelas observações independente da espécie que foi coletado aquele dado tá então a gente tem uma linha aqui de crescimento como se fosse uma a chama isso em estatística de uma regressão linear né uma linha um caminho que é onde vai a tendência de crescimento do comprimento da nadadeira com a massa corporal da espécie ali aí a gente vai também aqui dentro daquele mesmo Capítulo do primeiro
capítulo do livro R para data Science a gente vai usando Eh essas soluções de cores mas tem um alerta também no livro que eles falam assim que eh não é uma boa ideia se apoiar na representação na comunicação da informação somente nas cores porque é sabido que pessoas eh observam cores de maneiras diferente às vezes com algumas limitações tal então É preciso também explorar alguns outros canais de comunicação ou de visualização como é o caso da forma dos pontos que podem também servir para dar apoio e vamos dizer melhorar a comunicação de um de um
gráfico né de um painel então também sugere que às vezes você explore também esse tipo de de coisa que é dá uma forma diferente para para cada uma daquelas espécies no caso são três espécies aqui né Essa é uma maneira mas também na sequência ele comenta que olha a gente também depois pode utilizar um outro geoma que eles chama de geoma para color Blind que é para eles TM um geoma pronto em GG plot que é para cores de paletas de cores para quem é Dal Tônico e aí também é proposto explorar isso aqui nesse
capítulo Além disso ele usa aqui uma outra função que vai enriquecer o nosso Nossa visualização com mais detalhes como o título o subtítulo para aquela visualização hum o nome pro eixo X e o eixo Y melhor mais detalhado e a gente vai ver aqui vamos dizer esse resultado final aqui de uma visualização mais completa utilizando o r né ó aqui nessa paleta de cores que el cham de color Blind ele utilizou Azul paraa espécie do pinguim gentu que é o pinguim que tem é maiorzinho né tem maior massa corp fica mais mais longe aqui a
espécie gentu e e as outras duas espécies que meio que se se misturam ali as observações uma ficou em preto que é o pinguim Adel que é o menorzinho vem aqui pontos mais Olha só como é pequeninho O Pinguim tem alguns com 2 kg 2 kg e pouco e o pinguim barbicha que ficou laranjado aqui e aí essa a proposição que é feita no livro né para que para melhorar a visualização você também possa explorar paletas de cores que tenham esse tipo de de suporte né de preparo e é isso e aqui a gente começa
dentro do desse Capítulo também do R para data Science a falar de outros geomas que são utilizados com esse mesmo conjunto de dados dos Pinguins ali ele vai mostrar por exemplo que existe o geoma bar que você usa quando você tem uma variável somente que é o de barras né Ou seja a gente pega só diz aqui ó eu quero que você bote aqui nesse conjunto no eixo X o a coluna né o campo lá chamado espécie e ele sozinho já vai separar essas espécies em três que são as espécies que tem lá e fazer
uma contagem de cada uma delas a gente não precisou declarar nada disso só precisou dizer o seguinte ó e adicione nesse nesse conjunto de dados com x com a espécie o meu geoma de barras e ele sozinho já constrói essa visualização e separa esses conjuntos n em três correspondendo as três espécies que tem lá naquele conjunto de dados e dando a quantidade de cada uma delas aqui ele dá um detalhe também que se você declarar que aquele conjunto ali ele é uma categoria isso é um detalhe que tem da linguagem você tem que declarar ela
como um fator que é um detalhe que também explica mais no livro que o fator é a maneira de você dentro do R dizer que aquele dado é um dado de uma categoria ou seja ele separa em grupos né como se fosse aqui no caso da espécie também tem Outro fator do conjunto de dados que são as Ilhas né aqui no caso a a gente vai usar as espécies para mais uma vez trabalhar mas como a gente fala que é um uma categoria ele já organiza isso o do maior pro menor e fica um um
gráfico menor melhor para ver né Então essa aqui é a forma de usar o geoma de barras que é o outro geoma a outro visual pra gente ter as visualizações em R né aqui ele usa para eh variáveis numéricas só que utilizando uma só o geoma mais conhecido é o histograma que é um outro geoma importante também trabalhar em estatística se usa muito histogramas né que é a frequência de cada um daqueles registros dentro daquele conjunto de dados e o que a gente vê que se você pega todas as espécies que foram coletadas lá sem
separar por espécie né a gente tem um um valor máximo aqui um pico de de registros que é onde tem a massa corporal aqui ó da ordem de quase 40 espécies T aqui eh aliás quase 40 observações t em torno de 3,5 kg O que é como se fosse o valor máximo assim ou seja a maior chance de você encontrar o pinguim com a massa corporal de 3,5 kg naquela região ali né então continuando aqui falando de outro aqui ele dá um detalhe de que a gente consegue também definir Ó essas essas regiões que são
as várias eh franjas o que chama de Bim e essas várias intervalos ou classes que chama também estatística para se fazer mais mais estreitas ou mais largas tá a gente pode adicionar aqui por exemplo trocar aqui no código vocês podem experimentar isso botar com 300 por exemplo fica um pouco mais mais largo né com menos detalhes ou mais fininho Aí sim ele vai começando a pegar mais detalhes e reparem que isso ele já devolve ele retorna né quase instantaneamente aquio que a gente pede nesse documento que a gente criou aqui que é esse notebook ok
e aqui a gente tem um outro geoma que é também muito importante que é o geoma de densidade que é como se fosse uma curva suavizada de o histograma só que é de uma forma contínua né que chama de uma curva de densidade e no livro Até ele fala que para entender como é que é feito isso ele fala ah pega como se fosse uma um monte de macarrão cozido e joga em cima dessa curva aqui que é mais quadrada aqui e essa suavização vai acontecer assim que é construída essa essa visualização mais contínua aqui
do geoma densidade e aqui ele começa a mostrar quando é mais de uma variável ou seja as relações de uma variável com a outra né aqui por exemplo a eh por cada espécie em relação à massa corporal então ele separa nesse nesse geoma chamado boxplot que é uma uma solução de visualização um instrumento de visualização muito utilizado em estatística onde ele ordena os os registros de cada uma dessas espécies aqui no caso do menor para o maior ele coloca aqui bem no meio a região onde fica 50% das observações que é chamada de mediana e
aqui embaixo e aqui em cima ca os intervalos que são chamad de quartis que onde fica 25% para baixo dos registros e e os 75% dos registros lá em cima né quando aparecem esses pontinhos aqui ó é porque eles estão fora de uma região que é definida como chamada de alers se essa região aqui que é entre os 25% e os 75% ela passar para cima aqui replicar e ainda sobrar espaço a gente chama essa esses pontos que vão est falá como outliers Claro aqui a gente não vai conseguir tratar desses detalhes que existem aqui
nessas visualizações que vão dizer são essa essa base metodológica em estatística que vai dar sim aí profundidade né sobre cada um desses instrumentos que são usados em visualização a gente vai passando aqui e fica claro a chamada pra gente depois ter mais detalhes desses desses instrumentos de visualização no próprio livro ali do R para data Science então aqui são os Box plot que eles acabam sendo usados para mostrar também esses outliers que são os valores discrepantes como a gente diz e só aparecem outliers para essa espécie aqui que é o pinguim barbich aqui é o
pinguim eh chinstrap que chama ali em inglês né depois ele usa uma outra maneira de visualizar que são as densidades separadas por espécies outro recurso outro geoma que é utilizado né geoma densidade só que daí ele coloca aqui ó nas cores do mapeamento na estética as espécies então ele faz a mas ele separa essa densidade em cada uma das espécies e tem mais um pouco mais de recurso que é o caso dessa função aqui ó Alfa que vai dar a opacidade de cada uma dessas curvas de densidade então tem vários recursos e toda essa documentação
que a gente vai poder conhecer um pouco mais sobre Essas funções tá dentro do do R pra gente conhecer sobre cada um desses parâmetros que existem para explorar aqui tá aqui ele vem com duas variáveis categ óc geomas que são utilizados para isso já sessão 1.5 do livro aqui aqui quando a gente usa o o geoma de barras e pede para por exemplo eh no eixo X as Ilhas em que eles são observados e as espécies que eles vão eh que eles foram coletadas ali no caso as três espécies aqui ele vai colocar para cada
ilha a presença daqueles registros empilhados Ou seja a gente vai ver que na ilha toren Só existe uma só que é o pinguim Adel que é o menorzinho deles e esse mesmo pinguim ele tá só nessa Ilha mas ele tá em todas as outras ó então ele é mais presente nas Três Ilhas do arquipélago Já os outros pinguins habitam somente cada um a sua ilha aqui né o Bisco só tem o pinguim gentu e o Dream só tem esse pinguim eh barbicha Claro fora o adelli que tá nas três aqui então esses geomas mostram essas
informações que acabam sendo refletidas na pesquisa que que é feito né no caso do grupo de trabalho ali então isso que é comunicar né a gente vai falar sobre visualização a gente também tá falando sobre comunicar conhecimento né sobre composição sobre como que uma informação vai tá sendo transmitida através daquela daquele gráfico daquela janela daquele painel então Eh o contexto no qual aquilo tá sendo construído também vai ser preciso eh atravessar né esse canal de comunicação de visualização que são esses gráficos esse painel aqui para fechar é uma outra maneira de gente colocar ele bota
aqui nesse parâmetro position F ele coloca em vez de fazer com números absolutos aqui de Contagem ele faz em porcentagem onde zer até 100% E aí fica como se fosse como se diz normalizado todos eles com 100% onde 100% dos Pinguins dessa ilha aqui são a aqui tem uma parte um pouco mais de 50% do pinguim verdinho que é o barbicha e aqui o bisc a gente avança aqui um pouquinho mais sobre as variáveis numéricas que também descreve no capítulo a gente já viu esse essa essa visualização esse gráfico aqui ele vai dar um pouco
mais de detalhes como explorar isso também como a gente já viu por exemplo separar aqui não Só através das espécies com cores mas com formas através dos registros das ilhas então fica um pouco confuso aqui porque começa agora a acumular muita informação a gente vai ter formas que vão descrever a ilha vai ter as cores que vão descrever os pinguins e para esse tipo de sobreposição de de informação vai ser proposto um outro geoma para organizar essas coisas que vai ser o geoma facetas que vai vir na sequência aqui então um novoa aqui apresentado ó
esse facet Wap ou seja ele é um embalador de de facetas que permite que você também consiga separar esses registros ó tanto por ilhas eles separ em três conjuntos de ilhas aqui são as três que estão presentes no conjunto de dados mas também aqui por cores que são as espécies correspondentes presentes em cada uma dessas ilhas do arquipélago Palmar Então olha os recursos que existem aqui para fazer para construir visualizações que eventualmente pode ser importante para vocês utilizarem quando queiram comunicar algum tipo de informação no trabalho né o r é muito bom para isso e
aqui para fechar essa primeira parte aqui dos gráficos então a gente fala sobre como salvar esses gráficos a gente vai poder rodar seja qual for a chamada que a gente for fazer e sempre junto nesse bloco aqui executar o GG save que é o comando para salvar no caso aqui com o nome vou fazer aqui rodar esse arquivo que é o gráfico aqui de barras dos Pinguins aqui eh em cada uma das ilhas ele vai salvar aqui ó vou puxar aqui aquela barra de de documentos aqui que a gente tem aqui dentro e tá lá
salvo o pinguim plot que é aquele que a gente acabou de salvar também pode ser feito assim ó aqui nessa interface você pode vir aqui nessa engrenagem e pedir para exportar ou seja se você selecionar aqui ó pinguin plot e pedir para exportar ele vai salvar essa imagem no seu computador e você pode usar essa imagem né para para colocar esse gráfico em trabalho né então você consegue exportar extrair dessa desse ambiente ali que é mais de produção do das visualizações para ir levar ele para fora e conseguir trabalhar com isso como uma imagem né
aqui para fechar também o contexto do R é preciso falar de uma outra solução que foi criada para visualização que acabou sendo muito utilizado que é um pacote não só o ggplot que a gente vai que a gente utiliza dentro aqui dessa solução mas que ela vai ter capacidade de ser colocado eh painéis que que consigam servir de interação para poder fazer filtros poder mexer selecionar valores fazer com que sejam objetos de visualização interativos Então esse pacote do R que é chamado Shiny tem essa capacidade E aí são criados esses painéis e são colocados em
aplicações por exemplo em em em páginas web em aplicativos né então é muito utilizado esse esse pacote aqui o Shiny aqui para alguns exemplos que eu peguei que eu procurei exemplos que pudesse ter ainda a ver com esse contexto dos Pinguins eu fui atrás desse desse desse material que é programação em Shine aqui tem mais detalhes sobre como funciona isso tá deixei aqui a referência e o código que eu utilizei para visualizar os pinguins ele foi eh disponibilizado num repositório aqui de códigos que é o github e eu copiei aqui esse código simplesmente assim Claro
ele eh esse pesquisador ele coloca ali que ele é feito para o o conjunto de dados do do arquipélago Palmer e tal e botei ele para rodar aqui então ele vai mostrar pra gente ó uma maneira um painel que ele criou para ver de forma sintética né vários perfis aqui vários visuais desses que a gente trabalhou né ali com o ggplot já meio que composto aqui dentro de uma única tela aqui que vai ser esse painel ele pode abrir também no Browser aqui então aqui ele colocou lá no código tudo em inglês mas eu vim
aqui depois no código ó e traduzi cada uma dessas partes na mão aqui bot ter por exemplo o título em português aqui o se você for ver o código lá vai tá tudo em inglês quer veru aqui ah falando como é que funciona aqui detalhamento do conjunto de dados eu vim aqui para conseguir ter essa experiência eu fui ali no código e troquei esses esses esses registros para português aqui né o nome dos eixos tá vendo e aí a gente roda essa solução aqui manda executar ele tem uma parte que tem a ver com o
servidor dor de web para você conseguir comunicar isso com uma página web e tal ele são essa é uma solução que ela é um pouquinho mais elaborada não como um ggplot que você consegue construir dentro de um computador fechadinho ali e depois extrair como uma figura Mas como isso aqui vai ter interação com uma página por exemplo ele tem um pouco mais de conceito ali e Claro eu deixei a referência para vocês conhecerem um pouco mais sobre essa infraestrutura Por Trás Para viabilizar para funcionar esses painéis em Shiny que é o pacote do r e
o o o O resultado é sempre muito bom aqui de de visualização aqui no caso ele bota né separa o número de pinguins Que foi observado número de espécies número de ilhas a maneira como ele compôs aqui essa comunicação dele né Essa visualização desse contexto dos Pinguins do arquipélago Palmer eu botei também um outro exemplo que foi feito com R aí já um pouco mais elaborado porque o proponente que construiu ele fez um modelo estatístico de probabilid de você encontrar um pinguim em determinada Ilha que você for ou dependendo do ano que você esteja lá
né claro fazendo isso em retrospecto em relação aos dados que foram coletados Então esse esse painel também foi disponibilizado a gente consegue acessar ele aqui esse resultado deixar ele carregar aqui e a gente consegue interagir aqui por exemplo escolher qual é a ilha que a gente vai ver ele faz um modelo estatístico de probabilidade de encontrar alguma espécie eh Então dependendo da Ilha que você escolher ouou sexo do pinguim ou o ano que você for meio que só para é mostrar como interagir com esses registros que estão lá de uma forma dinâmica através de um
painel né filtros aqui que você consegue mexer ele dá a probabilidade dependendo do tamanho por exemplo do bico que você queira o tamanho da massa corporal aqui o tamanho da nadadeira e o tamanho aqui eh eh do bico a gente ter a probabilidade com esses parâmetros de encontrar um pinguim com aquela espécie naquela Ilha naquele ano então é mais uma maneira de só de mostrar como praticar como utilizar o r através de desse pacote que é o pacote Shiny então recomendação que eu faço é quando a gente quiser conhecer uma ferramenta como essa de procurar
por essas soluções como o caso botei no github lá eh R com Arquipélago de Palmer no caso esses dados né que são vários exemplos que existem para poder a gente conhecer Essas funções né que dão esses resultados como é o caso aqui desses painéis para esse pacote Shiny aqui a gente fecha essa parte do R eu fico à disposição de vocês pra gente na sequência passar pro Power Bi eu devolvo professora Vanessa a palavra aqui enquanto eu tomo uma aguinha e respiro também recebo aqui perguntas quem tiver para colocar Obrigado pessoal por enquanto muito mais
que merecida ess esse descanso né José pessoal Como já havia comentado caso tenha alguma dúvida eh especialmente nessa parte da da apresentação do webinar referente ao R acho bacana a gente colocar aqui no chat a gente lê aqui e o José pode responder para que a gente possa em seguida eh dar eh sequência a apresentação E aí tratar do tema de power bi que era o que era previsto para essa para esse webinar primeiro momento o r e no segundo momento o o o Power bi então Se tiverem qualquer dúvida pode colocar aqui no no
chat a gente já vai providenciar aqui para que o José possa responder ou então se por um acaso surgir essa dúvida aí ao longo dess desse segundo momento da apresentação aí também pode ficar à vontade de colocar o chat pra gente para que no chat pra gente para que possa responder ao final da apresentação eh quanto a ao a lista né de frequência já foi passado várias vezes aqui no chat tá Para que vocês possam eh ter acesso Depois aos certificados Tá então não esqueçam depois de de se inscrever al na lista de presença tá
e eh acho que podemos José que que acha pode sim então tá bom Dando sequência ali agora a gente vai pro segundo bloco powerb vamos lá professora obrigado então vamos lá a gente agora vai migrar para essa outra ferramenta Como eu disse uma ferramenta bem mais moderna né mais atual no sentido de que já é muito mais sintetizado muito mais facilitado o trabalho de construção a produtividade de de construção de objetos de visualização que é o Power Bi tá aqui o recomendado para quem às vezes eh não gosta de mexer com código não quero não
quero mexer com código eu quero realmente só ter como construir uma visualização Claro o recomendado é o Power Bi como a gente viu é a ferramenta que desponta né em capacidades em produtividade é o recom recomendado e é muito usado né paraa nossa prática aqui em Power bi a gente vai usar também um projeto também com o mesmo contexto dos Pinguins aqui para Power bi só que daí para conseguir utilizar o Power Bi eu preciso aqui comentar para vocês o Power bi ele tem uma solução em nuvem semelhante a como se fosse aqui essa solução
do R Tá mas como ela é uma solução da Microsoft o uso da da da solução em nuvem da Microsoft é bem mais amarrado eles cobram eles exigem contas corporativas que embora use de forma gratuita ele dá ele monitora o tempo que você vai utilizar tal então existe a solução e eh Power bi para nuvem vou mostrar para vocês que é o Power bi service nome da solução mas a gente vai trabalhar aqui com o Power bi desktop que para instalar o Power bi desktop eu deixo aqui para vocês o link para vocês acessarem é
preciso eu recomendo que vocês usem o powerb desktop porque ele dá muito mais liberdade para estudantes poderem utilizar ele não tem limite de uso você pode usar à vontade né sem tempo de de trial como a gente fala de experimentação é uma ferramenta dá para dizer que ela é gratuita quando ela é instalada no desktop tá tem esse link dá para fazer por aqui em instalação baixar agora ou tem um outro link que dá para fazer quando você tá no sistema operacional e Windows né que é você vai na Microsoft Store que é a lojinha
da Microsoft que tá em todos os sistemas Windows tem a lojinha e você bota lá Power bi que tamb também é o mesmo Power bi desktop que tá lá que você pode também baixar que é gratuito e você pode usar sem limites assim não tem nenhum limite de uso né só porque a gente vai ter que escolher por esse lado que é para dar mais Liberdade PR gente poder trabalhar aqui do que a solução em nuvem que é um pouco mais amarrada dado o contexto dessa Mega empresa que é a Microsoft né então para isso
eu instalei também aqui o Power bi se vocês quiserem fazer daquela forma é uma instalação rápida né se não tiverem ainda o Power bi instalado na máquina de vocês essas duas formas aqui na lâmina se você clica no na logo do Power bi ele vai direto para lá ou como eu falei na lojinha no Microsoft Store que você faz na busca aqui do Windows Microsoft S você pode instalar buscar o Power bi dessas duas formas tá aqui a gente vai ter um projeto que foi desenvolvido aqui por essa pesquisadora mostrar para vocês aqui a Maria
Isabel Gonzales que é uma analista de dados de Miami Flórida ela disponibilizou também um uma visualização através do Power bi desse mesmo conjunto de dados que a gente vai vir aqui simplesmente e pedir para fazer o download ó vou voltar ali para vocês verem o caminho aqui na lâmina eu cliquei aqui no no rosto dela aqui e aqui a gente vem ó Palmer penguins Power Bi que é entre outros projetos que ela disponibiliza Esse é o projeto que a gente vai baixar aqui para começar a experimentar o Power bi Nesse contexto dos Pinguins ali e
aí a gente vai vir aqui ó nesse arquivo porque o Power bi ele tem um arquivo com uma extensão própria que é extensão PB x ou seja Power bi execution né tipo assim executador do do de um arquivo Power Bi vai clicar nele aqui nesse tá no ambiente aqui do github e vai vir aqui em download Então vai baixar aquele arquivo ali e vai abrir no power bi Ok eu baixei duas vezes aqui deixa eu jogar fora essa uma vez que você instalou o powerbi você vai vir só nesse arquivo que a gente acabou de
baixar e executar aqui deixa eu ver como é que tá o pessoal ali vamos lá uhum ó ele abriu o arquivo que foi disponibilizado naele repositório lá pela Maria Isabel Gonçalves lá e aqui a gente tá naquela tela do Power bi que a gente já tinha dado uma Uma Breve olhada no começo e que aqui eu vou apresentar para vocês como é que ela se compõe aqui desse lado aqui direito ó vão ficar os dados do conjunto de dados nesse arquivo que a gente acabou de baixar ele já vem com aqueles registros lá dos Pinguins
que a gente também trabalhou no R mas também aqui no power bi existe um local aqui ó que é Obter dados tão vendo que você pode aqui clicar e através pode ser de uma planilha do Excel pode ser de um texto ou de um arquivo csv você pode subir registros e toda vez que você subir esses registros aqui por exemplo uma planilha da Excel você iria lá no arquivo lá botaria aqui ele traz ele alimenta esses dados disponíveis para você aqui também nessa barra aqui da direita que onde ficam aqui ó os dados Então esse
é o local aqui da nossa vamos dizer nosso ambiente de construção de visualizações do Power bi Onde ficam os dados logo aqui ó à esquerda dele vão ficar aqueles visualizadores que seria o equivalente como a gente falou lá no contexto do R dos geomas né que a gente disse Claro aqui numa linguagem um pouco mais moderna vamos dizer eles chamam de visualizações cada uma daquelas visualizações que a gente via lá de linhas de pontos de histogramas de barras também correspondem aqui ó gráfico de dispersão gráfico de barras tem aqui outros visualizadores né gráfico de danach
ou de rosca A pizza né famosa pizza então diversos visualizadores aqui e além do que eu também comentei pouco atrás que existe tambm como você também chamar outros visuais aqui que você às vezes não encontra existe daí sim um portal lá da Microsoft que você vai lá buscar alguma coisa que você às vezes queira tentar experimentar e não tá à disposição aqui nos visuais padrões vamos dizer assim né A primeira coisa que a gente vai fazer aqui para explorar um pouco do que o Power bi pode fazer é só utilizar esse mesmo painel que ela
disponibilizou lá pra gente esse arquivo né e começar por exemplo a trabalhar com altera só pra gente ver como é que ele funciona aqui ó Nessa construção a gente simplesmente eh reparem a gente só encaixou aqui ó alguns visuais que a gente trouxe de lá depois a gente vai fazer uma aba nova e vai construir do zero esses visuais tá Prim só considerar que a gente trouxe esses visuais deu uma um tamanho para eles e meio que encaixou eles aqui no espaço disponível E aí Claro o importante é entender o seguinte que a vantagem que
vai existir agora aqui do r do desculpa do por Bi é que ele é muito como eu disse é uma linguagem muito mais atual muito mais moderna que ele consegue fazer as a a os eventos que nós vamos começar agora a interagir aqui a se refletirem por todos os visuais que estão aqui disponíveis nesse painel por exemplo aqui aqui fala sobre as Ilhas quando eu quando eu seleciono uma ilha aqui como é o caso da Ilha tensen que a gente até chegou a ver que nessa Ilha só tem um tipo de pinguim lá o pinguim
Adeli repara como em todos os visuais que estão aqui nessa visualização eles vão agora responder a esse evento de seleção que eu fiz somente nesse visual ele vai refletir em todos os outros visuais que compõe esse painel ou seja ele vai fazer algo vai se expandir vai se estender por todos os objetos ali né então esse tipo de filtro como a gente diz que é feito aqui ele acaba tendo uma resposta rápida daquela informação em todos os outros visuais que fazem parte dessa desse painel aqui então isso do Power Bi é muito poderoso é uma
das características que diferencia a ferramenta ferramenta Como disse atual n comeou foi Public em 2015 Então tá falando aqui de algo que surgiu agora na útima era tecnologia aqui daria por exemplo em cada um desses visuais aqui nessa parte de visualizações el tem as configurações aqui as formatações a gente pode aqui por exemplo tem um visual e tem umal vir aqui e mudar o título por exemplo o título desse visual que a gente tá selecionado lá em cima à esquerda ele é o tamanho da nadadeira nadadeira versus e massa corporal então Acabei de mudar aqui
ó o título desse visual que é um dos dos valores que eu seto aqui nas na configuração quando eu seleciono esse visual eu venho aqui nas formatações venho aqui em geral e venho em título E aí eu consigo modificar isso aqui então isso é muito mais simples no power bi porque não precisa mexer com código né como a gente falou essas coisas são muito mais rápidas produtivas quando você não precisa lidar com o código às vezes uma falha você esquece de uma um ponto uma vírgula num código né claro aqui uma solução um pouco mais
rápida mais produtiva né recomendado e mas claro O importante da gente ter falar do R também do poder que ele tem também de de construir aquelas visualizações mas aqui Claro no power bi Essas coisas acontecem de uma forma mais rápida então a gente poderia fazer mudanças aqui que em cada um desses visuais muda cores por exemplo aqui no geral a gente tem na parte visual os marcadores por exemplo ó selecionar eu tô aqui vamos dizer nesse mesmo vou voltar aqui para cima à esquerda nesse visual aqui das dispersões das espécies aqui vou selecionar por exemplo
uma espécie e mudar aqui a cor dele por exemplo para uma cor sei lá que seja um azul aqui por exemplo E aí tá lá aquele cor azul então isso tudo é feito de uma forma muito mais rápida né através somente de um de uma seleção de um clique aqui na parte visual das formatações desse visual aqui do Power bi Então tudo isso pode ser modificado construído aqui né e a recomendação claro que eu faço também para vocês procurarem em outros projetos mesmo no Google ou diretamente lá no Git Hub por eh projeto Power bi
né que é no caso pode ser o arquivo PB de diversos outros temas que vocês procurem E aí cada um desses temas podem ter lá geralmente em inglês a gente consegue mais resultados né já outros exemplos que vocês possam subir aqui dentro do Power Bi e começar a modificar a explorar já fazer um reaproveitamento de outros projetos que já foram feitos sem precisar começar do zero mas a gente vai aqui sim construir as aqui do zero pra gente ver como é que isso funciona eu peguei essa primeira pra gente dar uma modificada olhar alguns parâmetros
conhecer aqui a interface do Power Mas então aqui a gente vai construir alguns visuais por exemplo reparem que a gente tá aqui com uma tela vazia aqui quando a gente constrói alguma alguma solução para que ela seja utilizada e que ela tenha também como a gente falou uma capacidade de comunicar de transmitir um contexto eventualmente o pessoal também coloca eh elementos visuais aqui imagens de fundo para ficar algo como emod durado eu trouxe ali um exemplo do Power bi quer viu ó eh aqui painéis em Power bi deixa eu ver esse aqui do Pinguim tá
certo aqui é um é um projeto que foi feito em porbi desses mesmos pinguins aqui esperar ele carregar que tem uma imagem de fundo que é uma geleira que dá como se fosse um contexto um ambiente Zinho para aqueles para aqueles registros dos pins ali ó lá tá carregando então essa parte de baixo aqui ó é uma imagem simples que foi criado né ou desenhado e foi colocado como tela de fundo para que daí você Construa os gráficos em cima e começa a compor esse contexto para ele comunicar melhor para ele dar mais contexto às
vezes conforto às vezes segurança né Todas aquelas características quem trabalha com design quem trabalha com comunicação quem trabalha com jornalismo né eles eles se interessam e que se veem a a capacidade desses canais de transmissão também de de informação de de intenções ou de ou de de conforto de capacidade de comunicar né de Cont textos Então esse tipo de coisa que também quando a gente fala em visualização vai tá presente aqui também no power bi não é só sobre dados sobre estatística né Nós estamos falando aqui sobre quando é visualização sobre comunicar E aí isso
é uma ampla área que desenvolve tanto a parte não só matemática a parte estatística mas também a parte de comunicação a parte de contexto Ciências Sociais né então aqui é uma riqueza de possibilidades que possam ser utilizadas com esse tipo de ferramenta Como é o Power bi não só em especí para quem trabalha com ciências exatas tal mas como tô dizendo uma ferramenta importantíssima para quem trabalha com tudo quanto é área de divulgação do conhecimento de comunicação né minha tentativa de falar um pouco sobre essa importância né de motivação para esses diversas áreas de de
conhecimento Então o que a vai fazer vamos só reproduzir Ó eu peguei aqui reparem gráfico de dispersão que que ele traz para cá ele traz um visual em branco vazio ó não tem nada aqui dentro e a gente vai poder dar a dimensão que quiser para ele fazer maior fazer menor vou poder deim a gente trabalhou lá naquele caso do R quando falou de dispersão basicamente com o tamanho da nadadeira no eixo X e o tamanho e e a massa corporal no eixo Y aí vem alguns alertas algumas características próprias do Power bi o Power
bi Quando lança uma variável eu vocês viram que Eu arrastei lá para cá ó esse visual aqui quando eu chamo ele apresenta aqui ó as possibilidades os o os locais que ele vai oferecer para você adicionar esses dados aqui de forma você pode arrastar aqui para dentro repara que ele já tem aqui ó um lugar específico pro eixo X porque ele fala assim ó adicionar os campos de dados aqui um pro eixo Y um local só para legenda então ele já tem a pré-forma das possibilidades que aquele visual que é no caso a dispersão pode
ser explorado então eu vou vou arrastar para cá Como eu disse o comprimento da nadadeira no eixo e vou arrastar para cá a massa corporal no eixo Y reparem que ficou só um ponto ali é porque o Power bi quando inicia uma chamada desses dados reparem só eu vou chamar nessa setinha aqui ó ele vai somar os registros então a gente precisa vir aqui dizer ó não não resume esses registros da mesma forma lá no eixo Y não resumir então isso às vezes assusta a gente fala mas Cadê meus dados eu trouxe para cá comece
primeiro conferindo as possibilidades que ele tem para agregar esses registros e ter seguro de que Primeiramente você não quer resumir nada não quer somar não quer tirar média ele deixa por padrão a soma setada lá e faz com que a gente às vezes pense bom mas não tem só um ponto ali na verdade é a soma ele deu um valor só que é a soma daqueles registros tá então alguns alertas que que a gente vai vendo né Por exemplo aqui como eu disse vamos mudar o nome do eixo ó tamanho da nadadeira no eixo x
e aqui em português massa corporal então reparem aqui que o gráfico agora tem o eixo aqui em Português ó tamanho da nadadeira aqui no eixo X massa corporal aqui no eixo Y A gente também agora tem o título ali que a gente pode alterar lembra que a gente veio aqui formatar seu visual geral título E aí a gente pode colocar relação tamanho nadadeira massa corporal algumas alterações né que a gente pode ir fazendo esse aqui é um visual que ficaria pronto poderia por exemplo eu separei aqui tá uma figurinha para botar deixa eu pegar aqui
ó se a gente vier em inserir e vier aqui ó inserir imagens eu peguei aqui no Google uma imagem de uma geleira que botei que seria o caso tá de uma forma bem precária assim eh colocar uma imagem que pudesse dar um contexto como eu tava falando né de comunicar melhor aquele aquele contexto da pesquisa que foi feita lá no arquipélago Palmer então poderia ser adicionado outras formas com vazios internos né que você pudesse encaixar ali um gráfico né uma visualização uma comunicação específica aqui a gente pode experimentar por exemplo um gráfico de barras e
a gente tá tá ouvindo e a gente aí puxar para cá por exemplo a espécie ó deixa eu botar aqui a espécie ali e botar deixa eu ver no eixo X também as espécies ó eu reparem só eu chamei vou repetir mais uma vez aqui vou jogar fora isso aqui eu chamei um gráfico de barras que é esse visual que tá aqui em cima ó gráfico de colunas clusterizado cliquei nele e peguei a espécie e botei no eixo X e peguei também a mesma espécie e botei no eixo Y o mesmo mesmo Campo botei nos
dois eixos então o Power Bi vai de um lado separar as espécies que existem e outro lado ele vai fazer a contagem desses registros muito semelhante aquil aconteceu lá no R né então ele já ordena também do maior para o menor então o o Power é bem mais ágil bem mais rápido com essas coisas assim e a gente consegue trabalhar com isso de forma modular assim né mais vai montando essas coisas e aí a gente vai tendo aqui mais um visual ó contagem de aqui tá inglês Vamos só mudar esse título aqui para ele ficar
mais contagem de espécies Opa contagem de espécies a gente faz aqui como se fosse separando né E se você for ver claro já começa a interação dela a acontecer desde já nós temos agora dois visuais se eu separo uma espécie se eu clico numa espécie aqui visual reparem eu vou até aumentar ele um pouquinho para ele ficar mais perceptivo esse evento eu separo ele e lá naquele outro visual que é das dispersões das amostras as medidas ele já vai fazer a separação somente daquele conjunto que corresponde a esse evento que eu acabei aqui de filtrar
que é só da espécie no caso aqui o barbicha né o teap em inglês ou o adelli o adelli vai est presente lá como a gente viu né em outras Ilhas Então esse tipo de evento de resposta rápida eh de conectar de expandir aquele evento para todos os componentes de uma visualização o Power VII é insuperável eu pegar aqui um outro gráfico que acho interessante que é o de cascata deixa eu pegar aqui cadê ele Cascatas e deixa eu ver barras aqui Cascata esse cara aqui uma outra forma reparem eu eu tava selecionado um eu
posso migrar de um para outro sem precisar eh criar um novo né posso experimentar várias formas de visualizar o mesmo conjunto de dados né então isso às vezes pode funcionar para você fazer testes né testar vou deixar aqui esse de barra e vou botar embaixo Aqui o novo do Cascata que eu tinha falado então aqui eu vou trazer para cá as espécies por exemplo das ilhas são várias ilhas aqui quero saber por espécie divisão por espécie pera aí deixa eu ver espécies deixa eu x deixa eu pegar hum aqui deixa eu ver se eu consigo
separar por Ilhas aqui isso então a gente tem aqui eh aqueles o conjunto dos Pinguins que a gente viu separados uma outra maneira de de apresentar que é chamado esse de cascata no total aqui esse esse conjunto de de de pinguins aqui ele vai somar no total a gente também pode separar aqui mais uma vez né cada um dos eventos ele vai separando lá nesses nesse nesses filtros que compõem aí todos esses visuais então Claro de algum modo esse trabalho que é feito agora com o Power bi se os colegas também instalaram vão poder baixar
esse mesmo arquivo como eu coloquei na lâmina ali e vão poder reproduzir isso aqui e vão poder variar experimentar outros visuais que existem tanto esses padrões aqui como aqueles que também como eu disse podem ser buscados através lá do da plataforma do Microsoft que oferece e outros visuais então de algum modo esse era exper queria mostrar para vocês do uso do Power bi ele fica à disposição aqui esse material da lâmina vai continuar à disposição de vocês mas eu meio que sintetizo aqui a minha a minha apresentação e fico à disposição professora pessoal quiser tirar
dúvidas F à disposição José Eh quero te agradecer uma apresentação maravilhosa aliem 1 hora e meia tu conseguisse apresentar dois assuntos muito importantes aqui principalmente para quem é né da área de cência de informação gestão da informação Então a gente tem bastante alunos aqui tanto da graduação quanto da pós--graduação então é um assunto que agrega muito pr pra gente aqui muito obrigada tá eh temos aí eh perguntas do chat Então a gente vai fixar essas perguntas das mais antigas para as mais recentes tá a primeira delas é do Jonatas Fernandes Ele pergunta o seguinte Existe
alguma solução similar ao pa EBI para o ambiente Mac Oi J Tudo bem então eu eu não tô seguro mas eu acho que Power bi também roda embora seja Microsoft ele também Rode em maos tá eu sei que outras soluções por exemplo para visualização de dados que são conhecidas como é o caso do clicksense eu acho que a minha tela ela pode até se compartilhar de novo aqui que é o click click View eu acho são soluções que não são às vezes só para um sistema operacional é uma outra uma outra solução que também tem
para visualização de dados tá is que é uma delas tem a outra que é muito conhecida também que é o tablô table Tableau em francês Tableau que eu também sei que elas rodam em domínio eh eh micos mas que eu imagino tá eu não fui conferir que a Microsoft não é nada eh tola né Deve sim tá disponibilizando o Power bi vamos até conferir aqui vamos lá quer veru Eh Power Bi macos eu não tô seguro dessa ó como usar Power bi no Mac então eles vão dar um jeito porque é preciso também cumprir com
uma demanda que existe de mercado que é instalar esse produto também no micros então eu me parece que ele não é só restrito para ambiente do sistema operacional Linux tá Jonatas perfeito José acredito que você respondeu muito bem inclusive indicando ali aonde pesquisar né melhor a gente tem uma pergunta aqui do da professora Fernanda Rod Professor Nessa versão desktop para entrar precisa ser conta corporativa ou de estudante certo não aceita contra pessoal do G meiro isso então eu fiz o teste como tinha dito na solu em nuv e tinha ess são que tinha que ser
uma conta corporativa né ou uma conta de est mas na solução que você instala no seu computador ele não faz tá ouvindo ele não faz essa essa restrição de e-mail como você instala a solução dentro da sua máquina ela começa a rodar ali sem ter essa esse vínculo com o credenciamento online assim então Eh foi onde sugeri que realmente os alunos O pessoal que queria explorar essa ferramenta faça a instalação no desktop que aí ela el é Ampla né porque se você fizer em nuvem também vai ter um tempo limitado para usar Acho que são
14 dias eu sei que no desktop ele é irrestrito e não tem esse vínculo com credenciamento perfeito José muito obrigada obrigada professora Fernanda também pela pergunta Eh agora nós temos uma aluna aqui do curso de bibli economia ela tá interessada em saber como essas ferramentas podem ajudar na tomada de decisão dentro da biblioteca a Joan esquece aluna ela faz uma outra pergunta mas eu vou deixar tu responder essa primeiro E aí em seguida a gente parte pra próxima Ótima pergunta Janice vamos lá essas ferramentas elas vão ser canais de comunicar sejam quais forem as áreas
que aqueles registros então estão sendo colocados ali para serem visualizados quando você comenta sobre um suporte a uma tomada de decisão a importância que você vai ter de conseguir colocar esses registros né que você de algum modo coleta armazena de um determinado processo um determinado domínio como é o caso de uma biblioteca que tem diversos registros de diversos tipos quando você consegue consolidar esses registros e colocar numa interface de visualização a síntese que você consegue ter de um Panorama de um domínio como é o caso de uma biblioteca né dos comportamentos dos eventos dos setores
das quantidades das distribuições né Então essas sínteses que geram pro observador pro visualizador elas são fundamentais paraa produtividade que você vai ter na hora de pensar de analisar aqueles problemas e tomar decisões Então esse tipo de ferramenta ela acelera a capacidade Nossa de sintetizar contextos né esses processos e sim facilitar a tomada de decisão excelente José muito obrigada agradecendo a Joanice ela fez mais uma pergunta pra gente aqui Joanice pergunta eu poderia usar por exemplo no TCC para ter um visual melhor sobre pesquisa de campo Pelo que eu entendi esse segundo bloco entendi melhor R
não somente seu uso seria numa empresa instituição e Universidade é claro a gente Claro hoje a gente sempre comenta sobre o uso de uma ferramenta acaba que com sempre um propósito de uma aplicação dentro de uma de uma profissão de um ofício né ou de de algum modo eh enriquecer o Nossa vamos dizer o nosso portfólio de capacidades para de algum modo se tornar eh mais capaz de de concorrer a uma vaga de emprego mas esses Artefatos de comunicação de informação eles eles vão poder enriquecer tudo quanto é tipo de produção de conhecimento né seja
para um estudante que tá ali construindo seja às vezes para organizar o seu trabalho também né como um de interesse pessoal de organizar a informação que a gente tá o tempo todo rodeado né então sim existe sempre esse esse primeiro aspecto fundamental né na no aprendizado dessas ferramentas que é de algum modo para instrumentar anizar nossas capacidades para ser de algum modo e inserido dentro de um mercado de trabalho Claro mas isso aqui hoje qu a gente vive rodeado de informação são instrumentos necessários para que a gente consega organizar essa quantidade enorme de informação que
a gente aqui hoje interage Então vai ter diversos motivos pra gente poder utilizar esse tipo de ferramenta para organizar o nosso trabalho tal ou é claro de algum modo também trabalhar nesses setores né perfeito José Obrigada temos mais uma pergun a agradeço né a interação do do pessoal fazendo perguntas são bem é bem contiva aqui pra gente né porque a pergunta de um pode ser pergunta de outros que estão acompanhando a gente Obrigada loural Francisco pergunta Professor José conheces o Google data Studio tem como fazer algumas comparações com o Power bi sim obrigado pergunta conheço
Google data Studio é até naquele lá no começo nas lâminas que eu coloquei aquele quadrante mágico que chama do gartner ele tá lá presente também você repara que ele tá um pouco aquem da performance do Power bi Eu trabalho num setor Como disse uma divisão com eh informação e a gente trabalha sempre com Power bi a gente já comparou com outras ferramentas eu também claro meio eh com cuidado aqui eu não tô né De algum modo fazendo propaganda de uma outra ferramenta mas a experiência que a gente tem de resposta do Power de conseguir agregar
informação de aqueles eventos que a gente chama de filtragem de seleção a resposta deles é muito boa mas assim o que que a gente recomenda né claro sempre tá observando essas empresas elas estão numa dinâmica de transformações de melhorias que a gente tem que acompanhar as outras feramentas também porque daqui a pouco já tá melhor do que a outra e você nem sabe assim sabe Então é eu recomendo assim a gente colocou aqui Power bi porque é uma ferramenta hoje inquestionável tem muito uso muito divul ado mas sim existem muitas outras soluções como a gente
disse aqui o Tabu o click viw aqui o Google data Studio que estão o tempo todo sendo transformados a gente às vezes nem vê mas de uma semana para outra já mudou uma versão a empresa já colocou uma outra forma de trabalhar que é mais fácil que é mais otimizado então sim a tua chamada de atenção era fundamental Porque existe uma diversidade hoje aí de soluções mas claro a nossa capacidade às vezes é limitada né de de se acostumar de se habituar de experimentar uma ferramenta e a gente acaba daí de um modo de outro
ficando com uma ou com outra mas sem dúvida o Google Studio é uma baita ferramenta bacana José obrigada pela resposta n então é sempre todo ano eles lançam né uma versão nova desse quadrante né que tu comentou então é legal para quem tem interesse também verificar alí Quais são as ferramentas que eles eles inserem nesse nesse quadrante né e eu tenho uma pergunta vocês tem mais pergunta aqui todo mundo tá te agradecendo muito tá aqui no chat José eh e muito obrigado e ótima resposta inclusive eh a gente tem aqui eu tenho uma pergunta assim
em termos de visualização de dados que esse que esse é o tema do nosso webinar de hoje né olhando lá pro Futuro eh eh em termos de Big Data né esse volume imenso aí de D de dados que a gente tem eh o que que pode esperar o que que tu vê assim pro Futuro além daquelas ferramentas que a gente já já mencionasse o que que tu tu vê aí de perspectivas Nossa Professor obrigado pela pergunta eh o que eu tenho visto assim é que a gente ainda tá muito preso à interface bidimensional né essa
esse quadrado essa tela que a gente olha sempre é um gráfico com duas dimensões Ou no máximo TRS assim a gente consegue né às vezes enriquecer um pouco mais com informação ou uma cor ou uma forma para dar mais dimensões o que a gente tem visto hoje é a presença né pelo menos ainda bem Inicial assim de interfaces que De algum modo gera o que a gente chama de realidade aumentada né onde o o uso de dados passe a ter algo espacial assim então o que o que eu imagino que essa integração da nossa da
nossa interação com o espaço assim possa com o tempo Eh vamos dizer tirar a gente Dessa limitação da tela em 2D sempre algo plano né para ver se a gente consegue com o tempo ter mais experiência de uma de uma interação com informação algo mais espacial né mais tridimensional sei lá algo que eu penso assim que não só limitado a tela que é o que a gente tem visto aí ao longo das últimas um as décadas aí né algo que tore isso né nesse domínio que é chamado hoje de realidade aumentada algo desse tipo assim
mas claro a gente tem visto ainda engatinhando tal que eu imagino que isso possa estourar né Essa maneira até mesmo essa esses visualizadores que a gente falou aqui de visuais ou de geomas possam se extrapolar para objetos tridimensionais que daí expressem também comunicação informação né através de texturas volumes né Por exemplo a gente vê o pessoal que trabalha com obras que é os beams né o business inteligente eh inteligência de gerenciamento de de de construções e aí tem já aqueles eles fazem por exemplo um uma imagem 3D de um prédio eu Suponho que às vezes
possa ter também como colocar por dentro ali o o tamanho as medidas de de de tubulações tal né e aqui você possa interagir selecionar filtrar essas coisas então me parece que esses objetos tridimensionais com agora com as com as inovações começar a ter mais e mais camadas de informação que a gente possa interagir em projetos né desenvolvimento de de produtos de informação isso aí professora obrigado mesmo pela pergunta José eh a aqui tem o o Thiago acrescentou aqui o build information modeling sim é e mod de informação de construção Obrigada Thiago Eh José Eu acredito
que a gente não tem mais nenhuma pergunta tá o pessoal já fez ali pelo chat eh disponibilizasse o material ali né e via link tá na na primeira a parte da apresentação Então quem quiser eh pode eh recuperar essa apresentação via chat via apresentação ali também do teu da tua primeira parte da tua apresentação pessoal que tá elogiando bastante tá agradecendo bastante eu começo aqui né então encerrando começa o encerramento eh agradecendo eh e te parabenizando tá muitíssimo pela tua apresentação e pelo trabalho que tu e toda a tua equipe todo o seas que desenvolvem
tá são projetos que são mundialmente reconhecidos Então a gente tem aqui uma institução né que tá bem do ladinha aqui do outro lado da rua da da nossa universidade que é premiada o José coordena esses projetos participa desses projetos ele e toda a equipe tá então eu gostaria de parabenizar agradecer a José pela apresentação e pelo trabalho desenvolvido né Eh também né toda a equipe esse esse esse agradecimento e e enfim ele também se estende a toda a equipe né do sias que realmente desenvolve um trabalho de muita qualidade com muito profissionalismo tá José se
tu puder agradecer lá o pessoal da equipe do sias a gente tem muita admiração pelo trabalho de vocês tá eh tem eh muitas pessoas agradecendo aqui no chat tá Agradeço também eh e parabenizo toda a equipe da bu da UDESC sem ela a gente não táia aqui nem eu nem o José e nem vocês então assim muito obrigada tá a a equipe da bu o trabalho que é desenvolvido aqui dentro é sensacional né Então parabéns a toda a equipe pela pelo suporte pela parceria por todos os perren que a gente passa aqui alguns minutinhos antes
de começar a o nosso webinar tá um grande abraço a todos e a todas e também pro o sempre serem meus parceiros aqui e poderem proporcionar a realização desse programa né de extensão que é um programa de extensão chamado Hub bip Por fim eu quero também agradecer a presença de todos e de todas vocês quero também eh deixar aqui um recadinho que para 2025 a gente vai ter novidades temos outros webinários aí também já conversamos aí né José Então a gente tem boas perspectivas para 2025 então fiquem atentos e atentas a gente vai divulgar aí
as novidades em relação ao webinar e aos webinares e as programações aí do programa eh Hub BP então muito obrigada a gente não pode dar palmas né uma sala de Palmas José mas tô dando aqui o José tá aqui do meu lado o pessoal aqui do chat também tá né aplaudindo Parabéns Muito obrigada mesmo até lá pessoal tchau boa tarde acho que não Tiraram a gente vamos vamos sair aqui para câmera senão Obrigada José