Introdução ao Pandas no Python - [SAIA DO ZERO EM 1 AULA]

286.11k views9724 WordsCopy TextShare
Hashtag Programação
CLIQUE AQUI PARA SABER MAIS SOBRE O CURSO COMPLETO PYTHON IMPRESSIONADOR: https://lp.hashtagtreiname...
Video Transcript:
e fala galera na aula de hoje você vai aprender os principais comandos do pandas para você trabalhar com dados análise de dados ciência de dados tratamento de dados dentro do Python E por que isso é importante leira porque o pandas é a melhor biblioteca do Python para dados ou seja sempre que você for trabalhar com essas coisas que eu falei tratamento de dados análise de dados em seus dados Você vai precisar o sal Panda citando muito importante que você domine os principais comandos Eu quero fazer uma aula com trê taça com os principais comandos para
você sair daqui com duas coisas primeiro uma cartilha para você poder consultar sempre que você precisar e essa cartilha vai ser justamente o gabarito da sala porque organiza essa aula para ela se tornar uma cartilha assim que a gente finalizar Mas também eu vou deixar ela disponível aqui na descrição para você fazer download Mas se você tiver com preguiça e se você vai pegar a cartilha vai lá clica no download e pega a cartilha e a segunda coisa que você vai sair daqui nessa aula é sabendo os principais comandos do panda e sabendo usar isso
no que você precisa Bom dia sim analisados beleza bom alguns aquilo que tem aqui disponível para download tem o gabarito pronto e esse arquivo Inicial né que o gabarito é a nossa cartilha também mas o arquivo inicial para você poder acompanhar comigo Além disso eu vou deixar também o link da instalação do Júpiter e do Anaconda que é o que a gente vai usar essa esse ambiente aqui onde a gente escreve nosso códigos em Python que é justamente o ambiente mais usado para dados que eu recomendo muito que você faça a instalação dele porque ele
também já vem com pandas pronto dentro do Pai então tudo junto então recomendo que você faça a instalação dele e também eu vou deixar esses 3 arquivos que são as bases de dados que a gente vai usar dentro dessa aula aqui para você acompanhar tudo comigo tá tudo no link da descrição e aproveita e quando você descer a tela ali para baixar o arquivo no link da descrição já deixa um like e já se inscreve no canal e do lado botão é só clicar no link e te dá certo beleza então vamos lá vamos começar
aquela sala que eu quero ser bem direto ao ponto mas também bem didático para você poder aprender primeira Oi pandas Como que você usa o pão das dentro dos seus códigos para você usar o poder dos seus códigos se tem que importar ele então vou fazer assim ó Import pandas quando você fizer Import pandas ele já vai importar toda a biblioteca do panda para dentro do seu código Lembrando que que uma biblioteca linda é um pacote de códigos que alguém construiu uma vez e que você pode usar de forma gratuita beleza e mais porque que
você botou esse SPD no final Lira pelo seguinte você vai ver que a maioria das pessoas quando uso pandas importa o pão das dessa maneira que importa quantas vezes pedi porque porque quando você vai usar os comandos do pandas novamente você vai escreve pandas. O que que você vai fazer esse SP de nada mais é do que um apelido que você tá dando para o panda para você não tem que escrever pandas o tempo todo você pode só escrever p&d. O que que você quer fazer eu sou um apelido para facilitar a escrita e não
é uma convenção mas a maioria das pessoas que usam todos acabam fazendo isso então por isso que eu tô fazendo para você já se acostumar com os métodos para se vai encontrar por exemplo quando eu fui tirar uma dúvida eu pesquisar um código na internet Beleza então tá lá Import pandas SBT show Tenta essa importação agora a gente tem que entender o seguinte o pandas ele funciona com inteira Friends o que que são da Ilha Friends Lira é uma tabela dentro do Python então quando os que não criam não deixa frame aqui é o seguinte
sempre que você for trabalhar com dados no Python você vai ter que usar os de ir à frente seja você importando informações que vende uma planilha seja importando informações que vem de um banco de dados esteja importando informações que vem na internet o até de um dicionário o pai tu não importa o que importa é o pão das trabalha com de na frente e sempre que você ouvir pela frente eu quero que venha na sua cabeça beleza uma tabela no pai é isso que eu tenho entender não dele afirma é uma tabela no pai e
agora você vai aprender a trabalhar com elas beleza existindo três grandes formas de você criar a primeira frente a primeira delas é você criar um dele frame vazio fazendo assim dessa maneira de ir à frente variável res o bebê ponto de ir à frente esse método de lá frame é o método do panda acho que cria um ver a frente que crie uma tabela para gente beleza então esse aqui é o primeiro método só que eu vou deixar ele comentado aqui porque a gente não vai usar mesmo pra muita coisa que não deve apenas Brasil
beleza aí você vai fazer com ele depois vai ter que adicionar informações então não aumente vai usar algum dos outros dois métodos que vou falar agora que o que você criar um inteira frame a partir de um dicionário do Python Como que você creme de um dele a fêmea a partir de missionário do parto vem comigo que como é que você tem um dicionário funcionário de vendas e dentro desse dicionário se tem a data da venda tá vendo eu tenho a venda que aconteceu de aqui em fevereiro e outra venda que aconteceu no dia dezesseis
fevereiro o valor que foi vendido r$ 500 300reais o produto foi vendido que feijão e arroz EA quantidade estão 50 sacos de feijão deu que eu já 50/70 de arroz deu 300reais e assim vai beleza bom se vocês é que tá isso aqui não vai fazer nada ele só vai criar esse áudio e se você der um print nesse dicionário venda Olha lá ele vai te dizer só esse dicionário que tem as informações só que agora a gente vai criar um dele na frente e criar uma tabela no pai então a partir de um dicionário
que já existe Como que você faz isso da seguinte maneira vendas DF Lira o que que se deve que você colocou aqui ó Isso aqui é uma variável do pai só que eu tô querendo normal só que aí eu vou deixar uma recomendação que eu que sempre que você for criar uma variável que ela vai ser um inteira frame eu gosto de fazer uma de duas coisas ou eu boto um DF no final do nome da variável para gente saber que madeira frame DF Beleza então vendas DF é um de ir à frente de vendas
ou eu coloco o nome da variável de tabela vendas por quê Porque eu sei que ele é uma tabela do Python de vendas Eu acho que isso facilita na hora de você olhar o nome da variável e saber o que que ela representa Beleza então eu vou criar o meu vendas DF que é um deira frame de vendas e quem é o meu vê-las DF é o eu volto Beira frame E aí dentro do parênteses você vai passar a variável vendo a variável que o seu dicionário beleza e isso daqui sozinho já vai criar para
você um dele a frame no pandas Beleza já vai criar um deira frame com todas as informações que tem dentro desse dicionário essa Faria beleza entendi mas como é que eu sei que ele criou certo como é que você que vem bonitinho E aí foi para parte de baixo que é o que você quer visualizar esse dira frame que ele criou para você você quer conseguir visualizar ele para saber se ele vem certinho só tem algum problema se você tem que fazer algum tratamento existem dois métodos de visualização o print e o display vamos ver
a diferença aqui na prática print vendas DF Olha lá é uma tabela bonitinho tá vendo com a coluna de data coluna de valor coluna de produto coluna de quantidade e as informações Então quando você usa o print ele exibe assim ó como se fosse só um bloco de texto Tá vendo só contexto quando você usa o display ele exibe também só tá vendo que ele vem mais utilizado o cabeçalho vem quando você passa o mouse em cima ele já meio que marca em azulzinho na linha que você tá e assim vai então quando trabalhando com
de na frente eu gosto de usar o display que eu acho que ele visualiza melhor as informações Beleza mas se você quiser pode usar o print também mas eu recomendo o seu display então só os dois métodos que eu tenho e os dados de um de grafeno e saber se ele importou de forma correta essas informações aqui da seu dicionário aí agora vamos para o outro método de criar Bandeira frente que o que você importar a partir de uma base de dados então agora a gente vai usar essa base de dados aqui que a base
de dados venda está vendo e repara o seguinte nesse meu caso a base da de venda está no mesmo local do arquivo que a gente está executando o nosso código e eu quero que você faça a mesma coisa no seu computador quando você fizer o download da base de dados de vendas eu vou querer que você coloca ela no mesmo local do seu arquivo que você está executando o seu código Lira poderia estar no local diferente poderia eu vou te explicar o que que você teria que mudar o seu código tá então vem comigo como
é que a gente vai fazer isso vou fazer agora um venda de f-1000 vendas DF vai ser quem ele vai ser um p&d. Só que agora ele vai ser um dele a frame que veio a partir de um arquivo em Excel tá vendo tá vendo esse arquivo termina com xlsx o X é o arquivo Excel então PDS vai usar um método mid Excel o método media Excel você passa para ele Ó o vendas pontos xlsx e ele vai ler esse arquivo e transformar esse arquivo em uma tabela em uma madeira frame do pandas beleza ali
ele se tivesse em outro local no meu computador em outra pasta aí eu invejo só passar o número do arquivo você tem que passar aqui [Música] você://usuários/João P/downloads/não sei que tô sabendo muito dá muito mais trabalho fazer dessa maneira se você precisar Ok mas como você não precisa pelo menos por esse nosso exemplo deixa na mesma pasta e aí lógico como você vai importar esse arquivo é legal depois você dá um display para você conseguir visualizar esse arquivo que você tá trabalhando Beleza o seu vendas deve Então vamos voltar esse código aqui agora e você
vai ver que ele vai demorar um pouquinho no meu computador e vai demorar um pouquinho pode ser que não não demore muito porque que essa base de dados que eu dei para vocês é uma variedade bem grande ela tem 90 mil line e se eu não me engano e era só ele demora um pouquinho mas ele conseguiu ler e olha só pequena mostra para gente ele mostra tem 93 mil linhas tem 17 colunas e aí ele exibe as colunas exibe os valores Mas eles viviam os primeiros valores e os últimos valores depois ele pode se...
Aqui por quê Porque se não tem ocupar página inteira que só com um display Mas com esse display só consegue visualizar mais ou menos como é que funciona essa sua tabela ah ah legal minha tabela tem mais de 90 mil linhas tem Sete Colunas as colunas são essas coisas que estão aqui então o display tem esse objetivo de você conseguir ver e visualizar que ele importou corretamente as informações e ir você tem uma noção de como é que tá a sua tá dela então tá assim a minha cabelo agora eu vou ensinar para vocês outros
métodos outros três metros para você visualizar os seus dados para você dá uma olhada nos seus dados para ver como que eles estão se comportando o primeiro método que você tem é o método Red tô por exemplo não chegar aqui e vou dar um display de quem do meu vendas DF. Retro beleza vendas DF. Rede com esse abre e) no final sim beleza que o neto do Red exige que você coloque e se abre e fecha parentes no final Que hora que ele vai te mostrar o método Red ele te mostra o seu Day a
friend mas só as cinco primeiras linhas e se eu quisesse as dez primeiras linhas dentro do parênteses do Red Você fala quantas línguas que você quer ver ele vai te mostrar as dez primeiras linhas ó do índice zero até o Mc 9 tem 10 linhas aqui dentro Beleza então esse método ele é bom para você ver com o início da sua tabela Porque se ela tá tá tudo certinho sim é daquela visualizada Inicial beleza além do método Red tem um método Shape então eu vou dar aqui agora um print pode ser um print não ser
um display necessariamente no vendas DF. Cheio e aí o shape não tem abre e fecha parentes está a medida do tempo você vai se acostumando com os métodos que tem o abre e fecha parentes os métodos que não tem o abre e) puxei pinão tempo só que tem que o método Shape mostra para você quantas linhas e quantas colunas tem dentro da sua tabela mas eu falaria mas foi inútil porque se eu der um display eu já vou ver quantas vezes quantas colunas sim mas essa sua tabela tivesse 100 milhões de linhas um display e
essa um método muito gostoso para executar ele é dá muito trabalho de executar enquanto que o método Shape independente do tamanho da tabela ele executar muito rápido ele é muito bom para executar Beleza então fica aí essa diferenciação para você já ter ela um mente tá E aí Além disso eu vou dar também um display no método vendas dfp o script e esse aqui é muito legal olha isso e os escravos também tem abre e fecha parentes do final tá olha só que bacana quando você rodar esse daqui ele vai te mostrar esse resumo o
que que é esse resumo ele basicamente vai pegar as suas colunas numéricas colunas numéricas eu tenho aqui código da venda que ele está considerando como o número mas ele dá para a gente é um código Eu por enquanto vamo ignorar ela mas eu tenho quantidade o valor unitário ou seja quanto que custa uma Peça uma peça de sapato estampa custa r$ 380 e o valor final O que é quantidade vezes o valor unitário ou seja Quanto que é cada linha desta aqui é uma venda beleza é uma venda que aconteceu em tal dia então loja
de tal produto em tal quantidade Então essa linda Aqui também dizendo faturamento dessa vendo aqui ó de camiseta no Iguatemi Esplanada no dia tal na venda número 16 no cliente número um que entrou lá para contato beleza e aí aqui embaixo nessa tá bom em resumo ele falou só Qual a quantidade de qual é a quantidade de itens que você tem então vai ser a quantidade de linhas que tem na nossa tabela de beleza até que não disse muita coisa mas ele fala olha só em média as pessoas compram dois produtos em média o valor
dos produtos é de 191 reagir em média o faturamento que você tem em cada uma em cada linha dessa em cada transação dessa é de 414 Oi e aí a quem te dá o desvio-padrão te dar um mínimo te dar o máximo esse da cada um dos partes 25 por cento e cinquenta por cento e setenta e cinco porcento eu não vou entrar aqui no detalhe do que que é o partiu como que ele funciona se você não souber nesse primeiro momento pode ignorar falar OK beleza depois eu pesquiso dou uma olhada mas eu não
vou entrar aqui para o nosso foco vai trabalhar com o panda senão entrar na análise de dados especificamente são os comandos do pandas que eu quero te mostrar mas que interessante aqui se descobre já que dá uma visão Geral de como estão as informações por exemplo eu sei que o produto que foi mais vendido de uma única vez foram cinco unidades então Terminei um produto que eu vendi 10 unidades de uma vez só não vezes cinco o máximo que o faturamento maior faturamento de um único produto numa venda foi de 3.750 tá vendo Então você
já tem algumas informações interessantes aqui dentro produto mais barato foi r$ 30 tá vendo Então já tem informações legais aqui dentro pra gente show com isso você já aprendeu os primeiros métodos de visualização de dados usando o e agora a gente vai para os métodos de editar a nossa odeio a frente editar a nossa tabela E aí por exemplo Digamos que eu não quero olhar todas as colunas Eu quero puxar só a coluna de produtos para saber os produtos que eu tenho que dentro como que eu faço para puxar só a coluna de produtos da
minha tabela vendas DF da seguinte forma a gente vai criar a variável produtos Quem vai ser a variável produtos ela vai ser a variável vendas DF e sempre que você quiser pegar uma única coluna da sua tabela você vai passar entre colchetes o nome dessa coluna Então qual o nome dessa cor o nome dessa coluna é produto está vendo nome da coluna é produto no singular tá vendo Então a tem que escrever igualzinho produto no singular e aí se eu chegar aqui agora e de um display nos produtos Olha lá ele me deu todos os
meus produtos aqui listados e isso vai reparar uma diferença nesse display aqui com ele por causa display veio com uma coluna só e não veio estilizada a bonitona e o display aqui do outro Vinhas o Tom pelo seguinte esse cara daqui quando você pega uma única coluna da sua tabela ele não é um dele frame esse cara que não é o inteira frente por isso que eu não botei DF aqui no nome do produto está vendo ele não é madeira frame ele é uma série do panda então o que que é um dellafrango Na verdade
ele é uma tabela em que cada coluna da tabela é uma série do panda eu quero que você entenda isso porque pode ser que algum momento você encontre o p&d por ciúmes em algum lugar eu quero que você sempre tem excelente uma série do pandas séries do pedreiro nada mais é do que uma coluna do seu panda beleza uma coluna do seu dele é fraco é isso que eu tô querendo postar para vocês irem se eu quisesse pegar mais de uma coluna como que eu faria não tem problema ao invés de passar um único valor
aqui dentro você vai passar uma lista de valores então sim ao invés de ter um colchete só você dois conceitos tá vendo e esse é o pa só que era a coluna de produto E quero também a colante e de loja aqui ó longe e de loja Oi e aí agora se eu mandar executar esse daqui ó agora ele virou uma tabela por quê Porque não tenho uma coluna só agora tem duas colunas coisa tem duas colunas já não é mais uma série só uma série uma coluna só quando tem duas colunas ele é uma
tabela que veio da tabela original então tal eu tenho agora a coluna produto é o nome de loja então com isso você já aprendeu um pouquinho pegar esse pedaço da tabela quero pegar aquele pedaço da tabela você aprender a fazer isso numa boa ó molezinha né só agora vamos para outros métodos porque eu imagino que deve estar se perguntando Ele é bem assim oferece uma linha que você pegar o valor específico E se eu quisesse duas colunas e uma linha e assim vai para isso você vai usar o método loc o método lote é um
método muito importante que ele ajuda a gente a pegar uma única linha pegar em linhas de acordo com uma condição a eu quero pegar todas as linhas da loja Iguatemi Esplanada todas as linhas da loja do NorteShopping todas as linhas do produto calça o lote é o método que vai permitir a gente fazer isso aí eu quero conseguir pegar as duas as colunas e até a décima linha da minha tabela ele vai permitir fazer estou vamos ver cada um desses caras aqui primeiro como que eu faço para pegar uma linha específica para pegar uma linha
específica você vai usar o método lote Como que você usa o método loc da seguinte maneira o vendas DF. Lote isso aqui é a maneira com que você usa um lote agora Como que funciona ele tá vendo que você tem uma coluna aqui ó que não tem não tem nome essa coluna aqui ela tá indo ele também essa coluna e a coluna de índice Será que são os índices da sua tabela são os índices da linha e o lote esse método loc ele olha sempre os índices bom então se eu pegar o vendas de F1
e ele vai me dar essa linha aqui como resposta quer ver ó eu vou mandar ele dar um display para mim um display para mim no lote não vendas de F Lote um tá lá é aquela primeira linha lembrando uma linha única também do meu dera frame também é uma série do panda está então eu não é um tem na frente uma tabela ela também é uma série do padre Senta aqui ó código da venda um da tal Iguatemi Esplanada camiseta duas 180/360 que é exatamente o que têm nessa linha de código aqui a sua
Lira você precisa pegar a linha 1 até linha cinco não tem problema o note também permite fazer isso eu quero pegar a galinha um até a linha 5 E aí ele é uma tabela que agora tem várias linhas ele pegou a galinha um até 65 Então essas tabelinhas aqui dentro e aí já permite você trabalhar com várias então isso aqui já o primeiro método que eu vou deixar ele comentado aqui para não atrapalhar a gente mas a gente vai agora para o segundo que o que polir a beleza mas agora quero pegar todas as linhas
do Norte Shopping E aí o macete é o seguinte para você pegar todas as linhas que correspondem uma condição você vai fazer da seguinte maneira eu vou botar aqui ó pegar linhas que correspondem a uma condição Como que você vai fazer isso vai fazer da seguinte maneira eu vou dar um display aqui no vendas df.org e o que que você passa aqui dentro do lote aqui dentro do lote você passa a comparação que você quer fazer por exemplo eu quero pegar todas as linhas em que a loja é Norte Shopping então aqui você vai passar
o que coluna loja igual ao norte shopping só que lembra como que é uma coluna ó eu vou ter que passar coluna é igual a norte shopping só que como que você pega a coluna das lojas de um de La Femme a gente aprendeu aqui em cima quando você pega a coluna das lojas Leader in a frame assim então aqui dentro do colchete você vai ter que passar onde igual no Python é igual igual beleza primeira coisa é isso aqui um a comparação desse um negócio é igual a outro no Python são dois sinais de
igual e como que eu pego a coluna de loja como um de loja é o vendas DF e vendas DF coluna e de loja concorda comigo então essa comparação aqui ó eu quero pegar todas as linhas onde a coluna de loja foram igual ao Norte Shopping Então essa comparação aqui você tem que passar ela dentro do colchete do Loki tá vendo coloque ele também usa colchete Então dentro do colchete do lote você passa a comparação que você quer fazer e olha só porque vai acontecer ele vai te dar todas as linhas da tabela onde a
loja North Shopping o resto das ninja ele não faz nada com ela e você pode exibir essa informação ou você pode armazenar por exemplo vendas Norte Shopping DF o vendas Norte Shopping DF é isso daqui são as vendas DF. Nossa eu seja quero localizar aonde na coluna e de loja é igual a Norte Shopping tá vendo eu quero todas as linhas onde a colorida loja é igual ao norte shopping é isso aqui que você tá dizendo por pai então é isso que ele tá fazendo para você aí você pô Me Sinto Legal porque da câmera
e se eu quisesse pegar Exatamente isso daqui que a gente fez eu queria pegar por todas as linhas onde é a loja North Shopping Mas eu não quero todas as colunas eu não quero todas as colunas eu quero só a coluna de data produto e quantidade só quero essas três colunas data produto e quantidade Como que eu faço isso para isso eu vou ter que te ensinar uma pequena modificação do método loc que é o seguinte shopping pegar várias linhas e colunas usando o lote como que a gente faz isso vai seguinte maneira ó essa
tabela daqui essa tabela original que a gente colocou ativo botar ela aqui e vou dar um display nela aqui embaixo a display vendas o Norte Shopping DF beleza tá lá display - North Shopping né então se você que tá isso aqui vai dar esse resultado só que acontece seguinte coloque se você só passa aqui eu tô passando uma informação só dentro do lote tá vendo uma única informação se você passa só uma informação dentro do lote ele vai procurar as linhas só que no Lock ele também permite você selecionar dedinhos e como ler então o
padrão do lote é linhas, coluna Quais linhas você quer quais colunas você quer Quais linhas a gente quer eu quero as linhas onde a loja é Norte Shopping Então essa comparação que a gente fez eu quero as linhas ou da loja North Shopping quais colunas Você quer ah eu quero a colorir de loja produto e quantidade então aqui nas colunas será passar uma lista tá vendo com colchete uma lista com os nomes e de loja, produto que regula quantidade tá vendo e aí olha só que acontece ele vai te é aquelas linhas só que agora
ele vai te dar só as colunas e da loja produto e quantidade tá vendo o que que você tá fazendo Você tá funciona filtrar ao mesmo tempo linhas e colunas Olha que bacana então assim eu sei que a primeira vez que você olha isso daqui essa linha de quase todos Fala meu Deus do céu que que ele tá fazendo ele perdeu a linha Mas você ficou um pouco confuso volta um pouquinho vídeo e assistir de novo a construção dessa linha de código porque essa linda que nada mais é do que o eu vou usar o
loc com linhas e colunas Quais linhas eu quero as linhas que correspondem essa condição aqui quais colunas eu quero as colunas com o nome de loja produto e quantidade e aí você colocando a informação fica esse negócio gigantesco aqui e com o passar do tempo você vai se acostumando você vai começar a fazer isso aqui de cabeça você não vai nem começar a pensar muito melhor eu tudo fazer direto beleza e aí eu quero mostrar também para você uma outra utilidade do método Note que é o que quer pegar um cara específico por exemplo é
então que eu queria pegar um cara que tá aqui ó eu já fiz cara que eu quero pegar esse valor aqui é só você passar Qual é a linha dele e a coluna dele no Loki não era isso você pode passar várias linhas e várias colunas Você pode passar uma linha e uma coluna tem um por exemplo se eu chegar aqui em baixo e passar para o nosso Loki ó pegar um valor específico se eu chegar aqui embaixo e passado o display está o print não sabe display to print Vou botar aqui o print print
vendas DF. Lote E aí lembra linha coluna colinha eu quero eu quero pegar o galinha tá vendo linha 1 coluna produto a resposta vai ter que ser camiseta vamos ver linha 1 coluna produto tem esse cara camiseta tá vendo tenho para pegar um Um item específico você passa você passa qual linha e qual coluna você quer ali mas eu quero descobrir o item que corresponde a determinada condição a mesma coisa que a gente fez aqui ó o item onde vendas DF de loja igual a norte shopping e assim vai isso pode te dar uma informação
só como resposta ou uma coluna inteira que eu tô querendo mostrar para você aqui é que esse uso do Loki seja como condição seja com números ele pode te dar com resposta várias informações uma informação só no caso aqui e me deu uma informação só porque eu passei e fica uma coluna específica tranquilo tô com isso a gente tem aqui o dedo e deixei tudo comentário mais um bloquinhos separados para você poder consultar sempre que você precisar para você pegar os comandos do tá porque aí ó eu vou até fazer seguinte eu vou deixar aqui
ó sem este comentários aqui para você poder saber quais são as linhas de código importante de você prestar atenção beleza bom vamo então agora para os próximos método que é o beleza Lira já consegui pegar já consegui aprender a pegar informações de era frango agora eu quero adicionar como que adiciona uma coluna nova como que eu adiciono uma linha nova Vamos ver se agora bom para você adicionar uma coluna nova se tem que tomar um pequeno cuidado que é o seguinte no banner Existem duas grandes formas você adicionar uma coluna nova ou você adiciona a
partir de uma coluna que já existe ou você cria uma coluna nova com valores padrões Então vamos fazer as duas Vou botar aqui ó a partir de uma coluna que existe e a criar uma coluna é colocado tá E aí Acompanha comigo porque essa diferença vai ser importante a partir de uma coluna que já existia mais simples por exemplo E como que eu queria criar uma coluna nova que a coluna da comissão do vendedor e digamos que o vendedor ele gangue de comissão cinco por cento do valor final sim por cento do valor que tá
na coluna valor final então eu quero criar uma coluna aqui que é comissão que nada mais é do que o valor final vezes 0,05 que há cinco porcento tem como que a gente vai construir isso da seguinte maneiro a gente vai chegar ao nosso vendas DF e ele não tem uma coluna de comissão então se você fizer isso aqui vendas DF comissão recebe tal coisa significa que se não se já tiver a coluna comissão ele vai substituir a coluna comissão pelo novo valor dela se não existe essa coluna comissão e vai criar automaticamente então vendas
DF Comissão vai ser quem vai ser o vendas DF coluna de valor final Quero valor que a gente tinha lá era coluna que a gente tinha vezes 0.05 tá vendo e aí agora se eu chegar aqui dá um display no vendas DF Olha lá agora eu tenho uma coluna de comissão com os valores de comissão bonitinhos aqui do lado tá vendo que assim por cento do valor final do valor de vendas Então quando você fez isso daqui você editou o efetivamente a sua tabela original então eu editei a variável vendas DF só que eu meditei
ela criando uma coluna A partir de uma coluna que já existe Aline Se eu quisesse criar uma coluna nova que depois eu vou preencher ela por exemplo G1 Bom dia como eu quero criar uma coluna de imposto mas eu não sei ainda como que eu vou preencher a coluna de imposto então quero criar essa coluna de imposto o valor 0 para todo mundo como que eu faço você poderia sim fazer isso daqui vendas DF no posto no posto vai ser zero você poderia fazer isso isso daqui pior vai dar um display aqui no vendas DF
ó e vou te mostrar como que vai estar o resultado final tá e olha só ele vai funcionar só que o pandas às vezes reclama da maneira com que você tá fazendo isso daqui porque porque para coisas simples assim ele vai funcionar uma boa e às vezes não vai reclamar muito mas se você tiver falando de uma tabela muito grande ou condições mais complexas aqui dentro normalmente o panda já comendo aqui você preenche essa informação daqui essa informação colocando assim. Locke e aí no ponto lote você passa Paulinha em qual coluna você quer preencher com
o valor zero tá vendo Quais linhas e quais colunas que você quer preencher com o valor zero Lira mas não tem a coluna de imposto não tem problema na coluna você escreve lá coluna de imposto Imagina eu quero preencher todas as linhas como que eu falo para ele todas as linhas você coloca um dois pontos: por pão de significa todas as minhas a se fossem todas as colunas todas as colunas seriam: também mas eu não vou fazer isso ensinou madeira frente vai ficar todo com o valor Zerado então isso aqui significa que na coluna de
imposto eu vou preencher todas as minhas com valor zero por que que eu tô fazendo isso dessa maneira porque essa maneira daqui ela é menos custosa por nossa para nossa tabela Ou seja é mais fácil para nossa tabela de executar então acontece de forma mais rápida e o pão Deus não reclama às vezes se você fizer da outra maneira que eu fiz o pano as vai reclamar quantos a partir de uma coluna original não tem muito problema mas quando está colocando um valor fixo tá vendo valor fixo para todos os itens é legal você usar
o meta a fazer isso também tá então método loc além de localizar você botar eu quero localizar esses caras aqui e quero dar um valor de zero para ele ele também consegue notificar então o método muito versátil uma delícia beleza bom aí você deve tá pensando bom adicionei linha adicionei coluna agora tem que adicionar uma linha e prática uma linha Tem uma parte muito interessante que para o seguinte aqui no nosso caso a gente tem as vendas até Novembro só que na nossa base de dados aqui a gente tem uma tabela que são as vendas
de dezembro Então vamos ver quem são os caras aqui ó pegar aqui ó vendas dezembro DF Quem é esse cara ele é o p&d. Vídeo tem que ser Aldo vendas dezembro. Xlsx tem que escrever esse nome aqui do arquivo igualzinho tá aqui ó vendas traço 10 com D maiúsculo. Xlsx tá lá eu vou dar um display do meu vendas de exemplo DF e olha lá quando você importar ele vai ser exatamente a nossa tabela original tá vendo você exatamente Nossa tabela original só que agora e como as vendas de Dezembro tá vendo pois nossas vendas
de dezembro e aí repara o seguinte se você quiser adicionar eu quero adicionar o vendas de dezembro no final do meu vendas DF normal como que você faz isso é muito simples é um prato celular gente vai fazer da seguinte forma vendas DF ou seja eu quero armazenar a resposta no STF eu quero modificar então um novo valor do vendas DF vai ser quem vai ser o antigo vendas DF só que agora adicionando o meu vendas dezembro defe beleza adicionando o meu vendas de dezembro deve tá E aí agora se você der um display no
seu vendas DF escrevi Veda sakineh vendas beleza E agora se você der um display Olha que que vai acontecer ele vai adicionar as linhas de Dezembro tá vendo ele vai adicionar a gente de dezembro dentro da sua tabela Então resultado final vai ser esse daqui só o primeiro como você fez adicionais colunas comissão imposto antes de adicionar as linhas novas elas bem vazias e se não significa que elas estão vazias Então seria duas opções ou você primeiro que são as meninas depois adicione as colunas ou você deveria adicionar com os comissão imposto também é o
vendas de dezembro antes de adicionar ele no vendas da empresa aí você escolhe quando você for fazer qual o método que você vai preferir tá um outro detalhe que eu te aviso aqui o seguinte se você botar essa célula aqui de novo de código vai dar um problema porque porque ele vai de novo adicionar o vendas de dezembro depois de novo depois de novo depois de novo depois vai ficar adicionando nem é repetido aqui dentro então se algum momento essa quantidade de linhas aqui ó tiver diferente para você que provavelmente aconteceu ou eu esse aqui
tem mais uma vez o código ou vocês eu tô mais uma vez o código de adicionar um aninho e é verdade diferente não é igual a coluna na coluna eles são eles identifique aquela coluna já existe e tento substituir bom dia para substituir se não der para substituir ele adiciona na linha não mas ele sempre adiciona beleza que o método append Sem pressão tá tão feito agora a gente aprendeu adicionar vão aprender a excluir excluir bem tranquilo é um método só por exemplo tipo chuteira aí com isso a coluna de imposto que não serve para
nada que ela tá vazia beleza gente chega assim ó e vendas DF vai ser quem vai ser o meu vendas DF. Drop E aí você passa aqui qual é a coluna que você quer excluir quero escolher a coluna de Imposto de imposto e você passa aqui também para ele o eixo tá esse eixo pode ser 0 ou pode ser um no caso da coluna você vai colocar que o eixo um então um eu esse da coluna e zera o eixo da linha então por exemplo se eu chegar aqui agora ele é um display no vendas
DF Olha que que vai acontecer ele vai rodar e ele vai ter que tirar da nossa coluna de imposto a lira eu queria excluir a linha zero Como que eu faço com ela aqui você passa 10 e no eixo você passa zero se você não passar a informação do eixo automaticamente o pano vai tentar excluir uma linha tá então eu recomendo que você sempre passa informação do Eixo para você poder manualmente escolher o que você quer e aí se eu rodar agora lá ele Excluiu a linha zero da minha tabela então escolhi linha e coluna
é igual só é importante você olhar um eixo tá eixo zero é a linha e um e a coluna E aí agora eu quero te ensinar um negócio muito legal os comandos mais básicos aqui do pão daí você já aprendeu só que tem alguns comandos que sempre que você for fazer tratamento de dados ou análise de dados eles vão importante para você e eu quero que você já site dessa aula sabendo esses comandos isso os primeiros comandos são os comandos de tratar valores vazios que são as flores não aqui ó tá vendo como que você
Trata esses valores vazios Existem algumas formas tá que aí a primeira coisa tem que pensar e pensar o que que você quer fazer com esse valor dos vazios porque imagina seguinte image e por uma coluna e a coluna é toda vazia que que você vai querer fazer você vai querer excluir só que imagina se você tivesse 10 colunas todas vazias Eu ia excluir uma de cada vez existe um método do pai do padre que permite você Excluir todas as colunas de uma vez que estão vazias ou então pô beleza não são todos os valores eu
tenho só alguns valores que estão vazios e se aquele pacote vazio vou querer preencher ele de alguma forma ou com uma média dos todos os valores ou com o último valor preenchido e assim vai isso que eu quero te ensinar a fazer agora que são sentimentos que estão aqui primeiro Vamos aprender a deletar linhas o e colunas completamente vazias Ou seja que todos os valores são vazios é muito simples você faz assim havendo é que nosso caso não tem mas você faria assim vendas DF Parece o nosso vendas DF. Drop me a esse drop n
a n exclui valores vazios só que ele tem um parâmetro aqui dentro que é o parâmetro Hall Onde você coloca aqui ou se você fizer sol ó vou seja como quem vai excluir os valores e na nana os valores vazios se você passasse para o metropol O que que significa significa que ele só vai excluir linhas e colunas que forem completamente vazios se você rodar assim por padrão ele vai excluir as linhas ou de todos os valores são vazios livre se eu quiser colunas passo Echo Echo um ele vai excluir todas as colunas em que
todos os valores são vazios Beleza então isso aqui é um método para você Excluir todos os valores vazios agora às vezes por exemplo e você pode ter nessa tabela aqui um ou dois valores vazios soltos E aí você quer simplesmente jogar essa linha fora se tiver pelo menos um valor vazio naquela linha você quer excluir aquela linha se tiver pelo menos um valor vazio eu quero excluir aquele cara como que funciona isso é muito simples deletar linhas que possuem pelo menos um valor vazio é isso aqui em projetos de ciência de dados e você tem
uma base de dados muito grande é muito comum de você fazer só tem uma cidade grande o suficiente só que tem será a cena baseados em meu linhas só que por 200 linhas estão com valores vazios e não vai fazer diferença nenhuma você exclui elas excluir porque elas vão mais atrapalhar do que ajudar tu como se faz vendas DF vai ser o vendas DF. Droga.na você só rodar opiniar vazio assim sem nada ele exclui as linhas que tem pelo menos um valor vazio é a forma padrão de executar o drop me a E aí existe
um outro método aqui que é para você preencher valores vazios que existem duas grandes formas que eu quero comentar com vocês aqui para você preencher valores vazios que é preencher com a média da coluna beleza e aí como é que você faz isso por exemplo de de um chuveiro e preencher a comissão com uma média de comissão aqui nesse valores como você vai fazer isso da seguinte maneira vendas DF Oi e aí a coluna que você quer preencher Qual é a coluna que eu quero preencher lacunas comissão tem que ver se ela tem acento a
comissão aqui o acento comissão aqui com a quem vai ser vai ser o vendas DF coluna de comissão ou seja o novo valor da coluna de comissão vai ser o antigo o valor da coluna de comissão só que agora com filme A preenchendo os valores se você colocar aqui por exemplo se eu ganhar com o número um ele vai preencher todos os valores vazios com o número um se você colocar aqui preencher com 10 ele vai preencher todos os valores vazios com 10 agora se você colocar aqui o vendas DF a comissão. Mim o que
que significa isso aqui significa que ele vai preencher todos os valores vazios da coluna de comissão com a média da colônia comissão esse cara daqui ó é a média da coluna de comissão já até te ensine a calcular média de uma coluna médio de uma coluna então que tem vai fazer ele vai preencher todos os valores vazios com a média da coluna da coluna de comissão e repara seguinte eu chegar agora aqui de um display no vendas DF e lógico e a gente tem que comentar se as linhas de código aqui de cima olha lá
o que que vai acontecer ele vai preencher a nossa comissão aqui eu todo mundo com a média que é 20,70 e431 Sei que Sei lá tá vendo Então e preencheu todos os valores vazios essa daqui é uma das formas mais usadas de preencher a outra forma bem usada bastante usada também de preencher é preencher com o último valor o que significa isso significa o seguinte ó pobre aqui no Excel para você visualizar eu não sei se você já viu às vezes a gente encontra mais tabelas que são esse formato aqui ó a gente tem que
o a data de hoje aí eu tenho que a quantidade assim [Música] e aí vem aqui às vezes até acima o produto um o produto do está vendo e aí esse valor aqui tem que ser preenchido com o valor de cima esse valor tem que ser preenchido com o valor de cima esses valores tem que ser preenchido com o valor de cima e assim vai Como se faz para ajustar uma tabela assim o pandas no Excel dá um trabalhinho no pandas Pois é muito fácil de fazer como você faz da seguinte maneira você vai fazer
o vendas DF vai ser o vendas DF. É fio Esse é fio significa que ele vai preencher com o first né o primeiro valor acima dele então ele vai preencher cada ele vai lá cada coluna e vai preencher com o valor que está logo acima em cada coluna correspon-dente Então esse é Phil basicamente faz isso aqui pega esse valor Oi e a raça para baixo pega esse valor arrastar para baixo pega esse valor Opá arrasta para baixo copiando Sônia e aqui também para que esse valor e a raça para baixo confiamos ó tá vendo ele
faz isso daqui oestw em todas as colunas do seu de na frente Beleza então é incrível uma linha de código que Bruno resolve vários problemas para você Quais são os outros métodos de análise dados que eu acho que são legais Você já tem em mente também os métodos group by e método velho calmos esses dois métodos que tava aqui dentro eles são métodos muito bons para você começar a calcular os indicadores por exemplo Qual foi o faturamento Total Qual foi o faturamento por loja quantas transações eu tive quantas linhas é que eu tenho nessa tabela
né seja quantas transações eu tive em cada uma das lojas quantas internações ative na loja Iguatemi Shopping Norte Shopping e assim vai Como que você calcula essas coisas vão uma de cada vez primeiro eu quero primeiro quantas transações eu tive por exemplo por loja ou seja quantas linhas eu tenho em casa em cada loja aqui dentro você vai usar o método velho carros então por exemplo eu vou chegar aqui e vou usar aqui o vendas DF aí você escolhe qual é a coluna que você quer fazer uma coluna que eu quero fazer isso com o
nome de loja então na colônia de loja eu quero que você. Velho calmas conte todos os valores para mim e esse pode até salvar isso aqui numa variável por exemplo aqui a variável de transações por lógico Essa é variável E aí você pode mandar exibição a variável não tem problema nenhum eu quero exibir as transações por hoje era só ele vai mostrar ele vai olhar sua tabela inteira olhar coluna de loja e criar para você a quantidade de transações que você teve em cada uma das lojas assunto cada uma das Rocha tá vendo e já
organiza para você que antes do maior para o menor Então esse velho carlos.so me um rapidinho Ele conta. Os valores aparecem ali podia ser também por produto e assim vai o que você preferir e agora o grupo vai estão aqui esse cara de cima aqui foi velho calça agora o grupo vai e como é que funciona o grupo vai o grupo vai ele vai agrupar as informações como o nome mesmo já diz ele vai agrupar por exemplo Digamos que eu queria saber o faturamento de cada um dos produtos o que seu faturamento de cada os
produtos o que que você tem que pensar que o resultado final que você quer essa no final que eu quero é eu quero ter uma tabela com todos os produtos e a coluna do faturamento de cada produto somado a coluna de valor final somada então quero agrupar os produtos pro ter um produto só de cada vez e quando ele agrupar o produto por exemplo eu quero agrupar todas as linhas Onde tem escrito aqui camisa que eu quero que ele faça eu quero que ele some a coluna de valor final acompanha a lógica comigo quando ele
Agro paculandia produto eu quero que eles some a coluna de vou final faça a soma da Coruja o final então acompanha essa lógica você vai entender como que o grupo vai funciona por quê que por exemplo se você saber aqui o faturamento por produto que você vai fazer quem e ele vai ser o seu vendas DF E aí você pode aplicar e se movendo as defe inteiro ou só em algumas colunas de vendas DF vai como você preferir eu vou aplicar nele inteiro ponto grupo pai e é o grupo bye é assim mesmo tá tudo
junto minúsculo E aí aqui no grupo by você passa para ele Qual é a coluna que você quer agrupar Qual é a coluna que eu quero agrupar eu quero agrupar colunas de produto beleza produto e aí depois que você fechou parentes do grupo bye você tem que dizer para ele o seguinte o que que você quer fazer com as outras colunas ou seja com as colunas numéricas você quer calcular médio você quer calcular a quantidade você quer somar Ah não eu quero somar beleza eu quero sua Marca então aqui você vai botar no chão tá
vendo que que você tá dizendo assim que era só eu vou pegar ouvindo STF eu vou agruppa coluna de produtos Bruno agrupar para aparecer um produto só em cada linha e quando eu fizer isso o que que eu quero fazer com as colunas numéricas que estão aqui aí eu quero só eu quero saber o total do valor final o total de faturamento é isso que você tá dizendo aqui E esse você dá um display no faturamento por produto olha lá o que que ele fala mostra para você é uma tabela com todos os seus produtos
tá vendo e aí eles Tomou todas as colunas numéricas então eles tomou o código de vendas uma quantidade sumô também valor final tá aqui ó na sua mão do valor final em cada um dos produtos Poli mas coloca confuso eu não quero que ele me mostre todas as colunas eu quero só produto e valor final o resto eu não quero não Ah então beleza então aqui ó na hora de agrupar sua tabela ao invés de você ter a tabela inteira você bota só as colunas que você quer aqui quais são as colunas que a gente
quer lembra eu quero filtrar as colunas Quais são as colunas que eu quero filtrar aqui dentro ah ah gente que a coluna de produto que a gente vai precisar dela e eu quero a coluna de valor final tá vendo antes do grupo vai você faz você se agrupa dessa maneira tá vendo e agora qual vai ser o resultado final resultado final vai ser só tabela com cada um dos produtos tanta lá bermuda 272 mil duzentos e cinquenta bermuda estampa 291 1694 peniche a 59 1725 que assim vai então isso somou faturamento de todo mundo e
aí novamente podia ser a soma mas podia também se a média e aí que ele vai te mostrar e vai te mostrar o valor médio da bermuda valor médio da bermuda estampa e assim vai tá vendo é muito simples você ajeitar o método que ele vai usar para agrupar e somar ou fazer a média dessa coluna de valor final que você tem beleza com isso daqui falta só um método que eu quero apresentar pra vocês que o método de mesclar que o método muito legal também que ajuda a gente a procurar informações de que tão
um tabela diferente então por exemplo olha só compra aqui comigo e aqui dentro a gente também tem uma tabela de gerente como importar essa tabela de gerente para ver como é que ela é eu vou criar aqui ó o gerente DF que vai ser um pedreiro.de dixell da nossa tabela de gerentes cliente que fez aqui com todas as tabelas Desse nosso programa que E aí eu vou dar um display nessa tabela aqui de gerente DF tá vendo e olha só quando você exibir esse gerentes DF ele vai te mostrar você tem uma ideia da loja
eo gerente de cada loja então quê que pode ser interessante eu quero na minha tabela original no meu vendas DF eu quero adicionar uma coluna com o gerente de cada loja para eu saber aqui nessa tabela original quem é o gerente de cada uma das lojas só que eu vou ter que procurar o gerente dessa loja dentro da minha tabela de gerente Então como que a gente vai fazer isso como que eu vou procurar as informações de uma tabela ó tá vendo dentro da outra tabela Como que eu faço isso que vai usar o método
de mesclar que é o método Murphy Beleza então como que a gente vai rolar Vamos Construir aqui ó eu quero Lembrando que a gente quer fazer eu quero que a minha tabela vendas deve final tenha a coluna com o gerente então eu vou fazer isso tudo não vendas DF eu vou falar assim ó o meu vendas DF quem vai ser o governo do DF vai ser o meu antigo vendas DF só que agora mesclando o vendas DF com a minha tabela gerente de F gerente deve tá vendo e aí repara o seguinte aqui ó a
minha tá as minhas duas tabelas tem uma coluna com o mesmo nome então tem a coluna e de loja e aqui a coluna e de loja então automaticamente o bandas consegue pegar de uma e procurar dentro da outra é porque ele já tem conosco o mesmo nome então se eu chegar aqui olha só executando isso daqui Se eu chegar agora e mostrar o vendas DF para vocês ele já tem o gerente de cada uma das lojas Olha só o Salvador é o gerente do Iguatemi Esplanada é só você olhar aqui ó na nossa Bela gerente
você vai descobrir que o Salvador Iguatemi Esplanada O Mateus é o gerente do Salvador shopping e assim vai então com isso daqui é só com uma linha de código você conseguiu pegar todas as informações estavam na tabela jogar para outro e Bruno rapidinho ele fez isso para mais de 100.000 linha está vendo Então o único trabalho que o plano esteja de importar as informações uma vez ele demora de quem depois disso cara ele trabalha dentro do Pai tô com uma velocidade incrível e o panda é muito bom por isso que o panda é muito bom
para trabalhar com dados para trabalhar com análise de dados para trabalhar consciência de dados por isso que ele é ferramenta do pai tão mais usada preço e com isso a gente encerra os métodos que eu queria apresentar para vocês e aí Olha só você vai apertar nele ações como que eu continuo aprendendo a bandas mais análise de dados com vocês eu fazer o seguinte eu vou pedir para equipe deixar aqui na descrição um minicurso gratuito de análise de dados com python for minutos que a gente montou em que a gente usa esses métodos do pandas
eu faço eu lá faço Eu relembro né eu faço a explicação de novo de vários do que a gente aplica lá mas a gente usa esses métodos para construir uma análise de dados e para tomar a decisão de o que fazer como fazer o porquê de uma coisa porque tem outra coisa a gente usa isso tudo lá para chegar a uma resposta final Então eu acho que você tivesse muito legal para você como continuação do aprendizado que você fez a criança eu espero de verdade você tenha gostado da aula pega lá o minicurso aproveitando e
pegar um recurso dá um like no vídeo se inscreve no canal seja muito a gente grande abraço e eu te vejo na praia
Copyright © 2025. Made with ♥ in London by YTScribe.com