Estatística e Probabilidade - Distribuição de frequências

9.68k views4079 WordsCopy TextShare
UNIVESP
univesp.br Estatística e Probabilidade Univesp (Universidade Virtual do Estado de São Paulo) Profess...
Video Transcript:
[Música] Olá pessoal bem-vindos novamente a nossa disciplina a gente vai falar hoje de distribuição de frequências distribuição de frequências é uma das principais ferramentas matemáticas para organizar os dados ela permite a gente não só organizar como extrair algumas medidas e extrair informação por exemplo vamos lá a gente tem uma massa de dados como é que a gente constrói a distribuição de frequências distribuição de frequências também são importantes porque é a partir da tabela de frequências que a gente constrói o histograma que é a principal ferramenta de visualização de dados quantitativos vamos lá bom a gente vem dizendo isso aqui já mais uma vez né dados brutos não são muito úteis a gente tem uma tabela com 100 números lá difícil de olhar né pessoal você olha olha vê um monte de número cada um vale uma coisa diferente e daí a gente quer organizar resumir aqui a gente tá usando a palavra agrupar mas com sentido de resumir é que para construir tabelas de frequências distribuições de frequência a gente vai organizar para a gente vai significar e apresentar esses dados Então os objetivos da estatística descritiva Estão todos aqui informação é diferente de dados eu tenho os dados Mas e as informações que esses dados estão me passando tem que extraí-las vamos ver como é que a gente faz isso usando uma tabela de frequências Tá bom uma distribuição de frequência então podemos organizar um conjunto de dados quantitativos a gente vai estar sempre falando de dados quantitativos basicamente [Música] ordenando esses dados Então essa é uma primeira em primeiro passo sempre que você tem um conjunto de n dados numéricos quantitativos convém ordená-los ou do menor para o maior ou do maior para o menor esses dados ordenados nos dão as estatísticas de ordem que se chamam meramente ordenando os dados pela mera organização dos dados em ordem crescente por exemplo eu já consigo ver imediatamente qual é o valor mínimo que é o primeiro que tá lá quem é o maior valor ou recorde que é o valor que tá lá no por último Quem que tá no meio que é a mediana a gente vai ver então essas estatísticas de ordem quantias em geral que a gente também depois vai mencionar quer dizer qual são os pontos que dividem essa amostra em quatro partes iguais primeiro quartil segundo partiu terceiro Partiu e quarto quartil esses pontos aqui para descobri-los eu tenho de organizar os dados em ordem crescente ou decrescente porque dá na mesma né então quando eu ordeno os dados eles deixam de ser X1 x2xn e passam a c X1 entre parentes Então essa anotação que vocês estão vendo aqui é anotação padrão para dados ordenados então quando eu falo a grandeza o número a medida resumo que eu tô procurando é o x parênteses 5 é o quinto valor orde do menor para o maior Então essa é uma anotação muito usual a gente tem que conhecer também e a distribuição de frequências então a gente ordena depois monta a distribuição de frequências e depois monta o histograma tá bom a distribuição de frequências ela é uma versão empírica empírico quer dizer baseado nos dados e na teoria a distribuição de frequências quando bem construída a gente vai ver aqui ela é uma representação empírica da probabilidade da população então quer dizer qual a probabilidade de eu ter alguém com 1,78 M na população brasileira não sei porque eu não olhei para a população inteira mas eu pego minhas amostras construa uma tabela de frequências uma distribuição de frequências eu vou olhar lá na minha distribuição de frequências quantas pessoas com 1,78 ou mais um pouco menos um pouco depende da largura do intervalo de Classe A gente já vai falar também recai naquela categoria E aí eu tenho uma ideia de quanto isso representa do total e isso para mim vai ser a probabilidade de eu encontrar alguém com 1,78 na população brasileira o empírico porque é baseado em dados Tá bom uma distribuição de frequências é uma tabela na qual os valores são agrupados em classes então eu quero agrupar Eu não quero fazer uma tabela em que eu tenho 1,67 duas pessoas o metro e 68 3 1,69 uma média se eu tenho 50 medidas de altura e você e eu for separar essas alturas pelos centímetro eu vou ter uma distribuição toda desdentada vai ter um cara que vai ter um dado aqui aqui não vai ter ninguém vai ter uma lacuna aqui vai aparecer eu não quero então eu quero de certa forma montar uma caixinha que seja larga o suficiente por exemplo entre 1,65 m e 1,70 m para que ali caiam os dados que tem aqueles valores naquele intervalo então eu quero agrupar é esse conceito de agrupar tá bom Aqui eu tenho duas por exemplo uma tabela para dados qualitativos nominais é fumante sim não ou não respondeu e eu conto esse ni aí a gente chama de incidências eu conto quantos recaíram quantos incidiram em cada categoria aqui no gráfico na figura para o tabagista São variáveis qualitativas no dado para salários são varais quantitativas então por exemplo eu tenho aqui entre 0 e 3 salários mínimos quantos eu tenho 42 dos 53 que eu investiguei entre 3 e 5 entre 5 em 10 então esses intervalos de três zero a três e três a cinco a 10 são as minhas categorias no caso de variáveis quantitativas a gente chama de intervalos de classe tá bom e finalmente uma boa tabela uma boa distribuição de frequências tem uma linha final de Total tá bom pessoal é boa prática é quando você monta uma tabela Você tem uma linha de total para que você possa se verificar sempre se não tá deixando nada de fora tá bom então vamos ver como montar essa tabela dessa eu diria aqui dois exemplos vamos ver como é que a gente monta para construir uma distribuição de frequências a gente precisa decidir Quantos intervalos de Classe A gente vai ter eu vou agrupar os dados eu quero colocá-los enquanto os intervalos de classe eu quero encontrar a amplitude de clássica quer dizer vou pegar o intervalo eu tenho lá sem valores de Salários eu vou pegar o intervalo de 0 a 10 de 10 a 20 de 20 a 30 talvez não seja muito razoável porque eu vou ter um salário 29 mas eu vou ter 300 sei lá 200 salários de 0 a 10 então eu tenho que usar classes mais estreitas então como fazer isso eu tenho que determinar os limites Opa desculpe eu tenho que determinar os limites inferiores e superiores a partir de quando eu vou começar a contar e colocar esses intervalos de classe eu não posso esquecer de ninguém eu não posso deixar de recobrir todo mundo eu não posso eles nem se sobrepõem porque se eu tenho intervalo que vai de 50 a 60 e outro que vai de 58 a 68 o cara que é 59 ele recai nos dois intervalos como é que faz não pode Então essas são os requisitos que estão aqui contar os dados depois que eu já escolhi o intervalo de classe quantos eles são eu vou contar quantos recaem em cada um deles e fazendo isso eu construo uma tabela sem esquecer ninguém a observação aqui o seguinte eu quero contar eu quero construir a tabela Sem esquecer dos seus principais elementos que são as incidências as frequências relativas que é quantos incidiram naquela categoria dividido pelo total de dados que eu tenho uma uma percentagem um percentual eu quero as densidades de frequências porque são esses os números que vão construir o histograma eu já vou falar deles e eu quero ter uma linha de totais porque é boa prática eu volto a insistir É muito ruim quando a gente está lendo uma distribuição de frequência de uma tabela dessas não tem uma linha de totais Então veja só você tem ali 10 linhas ah na categoria um Eu tenho 25 incidências na categoria 2 eu tenho 70 incidências na categoria 3 eu tenho tantas incidências sim mas quanto isso é do total eu vou ter que somar as 10 linhas lá para saber quantos dados foram usados nessa pesquisa não eu faço uma linha de Total lá embaixo e vou indicando esses tois como vocês viram na tabelinha que a gente mostrou como vocês vão ver nas tabelinha que a gente vai mostrar aqui mais para frente tá bom então a gente tem que fazer isso então vamos lá todos os elementos número de intervalos de classe se eu pego poucas classes eu tô tendo uma visão muito macroscópica Foi o que eu disse eu tenho 100 valores de salário eu vou dividir entre 0 a 10 e 10 a 30 isso não me traz muita informação eu vou tô colocando no mesmo eu tô colocando na mesma categoria o sujeito que ganha três salários mínimos e o sujeito que ganha 9 eu tô colocando na outra categoria o sujeito que ganha 12 salários mínimos junto com o que ganha 27 quer dizer que tipo de pesquisa é essa que resposta eu vou que pergunto eu tô querendo responder se eu tô colocando pessoas que tem um salários o triplo uma da outra na mesma categoria não é razoável e uma visão muito fina também se eu pegar a categoria de um em um salário mínimo vão pensar assim eu vou ficar eu não tô agregando eu tô pegando uma massa de dados lá sem valores que como a gente já viu são difíceis de entender e transformando numa tabela que tem 100 linhas não resolveu nada tá certo a gente tem que ter um pouco de arte isso você escolher Quantos intervalos de classe você quer existe uma regra tipicamente para se você não tem milhares de dados uma pesquisa uma medida física de um laboratório de bioquímica sei lá que tem 25 mil dados para serem tabelados Aí talvez vale a pena você usar 30 40 50 categorias eu já tive oportunidade de fazer histogramas com 50 categorias mas eram milhares de dados mas se você tem pesquisas típicas que sem 200 500 mil respostas raramente você usar vai usar mais do que 15 intervalos de classe então é uma regra da mão direita aí tá bom entre quatro e 20 intervalos de Clans e tem um número chamado regra de stude que sugere um número tá bom Um mais log na base 2n se eu tenho 100 dados eu pego log na base 2 de 100 soma com um e pego o a parte inteira né então isso dá uma sugestão essa regra de Studio ela é válida ela é limitada Mas é uma excelente sugestão Tá bom então a gente determina o número e a amplitude bom amplitude é fácil Se eu quero cobrir a amplitude dos dados o menor valor é um e-mail o último valor é 9 eu quero dividir isso aqui em seis intervalos de classe bom eu pego 9 menos um e-mail e corta em seis partes essa forma que vocês estão vendo esse Delta maiúsculo aí é a largura do intervalo de classe frequentemente como vem usar um valor aproximado porque às vezes o maior dado é 9,37 o menor é um ponto 82 você faz a diferença dá um número quebrado você divide por sete Ixe dá um número com seis casas decimais sei lá ou uma dízima então não convém não convém eu começar em 1,87 somar um ponto três quatro nove dois depois o que deu tomar mais um 3. 4 toda até chegar no último não vale a pena fazer isso é muito complicado vai vai me complicar a própria vida eu vou estar fazendo uma coisa que depois vou ter você vai ser difícil para eu próprio entender então frequentemente a gente arredonda esse valor Ah o valor sugerido o valor de Delta aqui deu 1,47 bom vamos pegar um e-mail o valor de Delta de 33 pode pegar um e-mail pode pegar 1,25 números que sejam fáceis de entender humanamente né então aqui também tem um elemento aí de arte tá bom pessoal mas não é difícil é só vocês olharem e falarem não não não 1,37492 não vai dar eu vou usar um e-mail E aí você começa Ah beleza vou usar o e-mail vou começar Aonde então decidi que vou usar a largura de classe um e-mail só que o meu primeiro valor é 1. 3 9247 eu vou começar ali somar um e-mail e vai 1.
8 347 depois vem para 2. 5 sei lá três quatro Ah não eu falo mano em vez de começar já que o meu primeiro dado é 1.
Related Videos
Estatística e Probabilidade - Medidas de posição e de dispersão
20:47
Estatística e Probabilidade - Medidas de p...
UNIVESP
7,686 views
Estatística e Probabilidade - Variáveis aleatórias e valores esperados
23:20
Estatística e Probabilidade - Variáveis al...
UNIVESP
5,651 views
AULA 10   DISTRIBUIÇÃO DE FREQUÊNCIAS COM INTERVALOS DE CLASSES
19:23
AULA 10 DISTRIBUIÇÃO DE FREQUÊNCIAS COM ...
Ed Academy
80,603 views
Estatística e Probabilidade - Os axiomas da teoria das probabilidades
19:56
Estatística e Probabilidade - Os axiomas d...
UNIVESP
10,366 views
CONCEITOS BÁSICOS DE ESTATÍSTICA: POPULAÇÃO,  AMOSTRA, AMOSTRAGEM, VARIÁVEIS E ORGANIZAÇÃO DE DADOS
18:45
CONCEITOS BÁSICOS DE ESTATÍSTICA: POPULAÇÃ...
Professora Gisele Ramos - Matemática
432,749 views
Estatística e Probabilidade - Introdução à inferência estatística
19:34
Estatística e Probabilidade - Introdução à...
UNIVESP
5,657 views
Estatística e Probabilidade - O teorema central do limite
22:15
Estatística e Probabilidade - O teorema ce...
UNIVESP
4,739 views
Estatística e probabilidade - Alguns conceitos matemáticos
20:18
Estatística e probabilidade - Alguns conce...
UNIVESP
11,695 views
Distribuição de frequência com classes
14:37
Distribuição de frequência com classes
Matemática no Papel
509,018 views
Estatística e Probabilidade - Probabilidade: Exemplos resolvidos
20:48
Estatística e Probabilidade - Probabilidad...
UNIVESP
5,998 views
Estatística e Probabilidade - Revisão geral
25:52
Estatística e Probabilidade - Revisão geral
UNIVESP
7,159 views
Estatística e Probabilidade - Introdução à estatística descritiva
21:56
Estatística e Probabilidade - Introdução à...
UNIVESP
19,491 views
Estatística e Probabilidade - Organização e apresentação de dados: Exemplos resolvidos
20:34
Estatística e Probabilidade - Organização ...
UNIVESP
6,663 views
Tipos de frequência - Distribuição de Frequências - Estatística
14:01
Tipos de frequência - Distribuição de Freq...
Paulo Lima Carvalho
396,743 views
Estatística e Probabilidade - Distribuição Amostral da Média
27:48
Estatística e Probabilidade - Distribuição...
UNIVESP
4,667 views
Estatística e Probabilidade - Leis dos grandes números
21:15
Estatística e Probabilidade - Leis dos gra...
UNIVESP
6,110 views
FREQUÊNCIA ABSOLUTA E RELATIVA \Prof. Gis/
22:59
FREQUÊNCIA ABSOLUTA E RELATIVA \Prof. Gis/
Gis com Giz Matemática
150,471 views
QUARTIL PARA DADOS AGRUPADOS COM INTERVALO #01 ✅ INTRODUÇÃO À ESTATÍSTICA
15:49
QUARTIL PARA DADOS AGRUPADOS COM INTERVALO...
Prof. MURAKAMI - MATEMÁTICA RAPIDOLA
58,933 views
DISTRIBUIÇÃO DE FREQUÊNCIA ✅ ESTATÍSTICA
8:08
DISTRIBUIÇÃO DE FREQUÊNCIA ✅ ESTATÍSTICA
Prof. MURAKAMI - MATEMÁTICA RAPIDOLA
705,928 views
Estatística - Aula 09 - Distribuições de probabilidade
24:34
Estatística - Aula 09 - Distribuições de p...
UNIVESP
51,833 views
Copyright © 2024. Made with ♥ in London by YTScribe.com