foi pessoal tudo bem bruno damásio aqui no canal que cometeu online e hoje a gente vai falar um pouco sobre distribuição da normalidade a idéia é apresentar para vocês o que a curva normal o que a distribuição normalidade e ensinar vocês procedimentos no fss avaliar seus dados onde são normalmente distribuímos o mal a distribuição normal é uma das distribuições de probabilidade mais utilizado na estatística para modelar fenômenos naturais isso acontece porque o pessoal na natureza existe uma ampla variedade de fenômenos que ao serem avaliados ele tem exatamente esse tipo de distribuição mas imagino que vocês
estão vendo aqui é uma curva normal né chamado também de curva de ensino ou curva de gauss e ela está me dizendo o seguinte próximo a um determinado ponto central aqui responde central a gente entende como a média na distribuição dos eventos existe uma grande quantidade de eventos ou de pessoas que você tenha trabalhado com pesquisa com seres humanos uma grande quantidade de eventos sobre pessoas que se aproximam da média e um número muito menor de pessoas nas extremidades tanto na extremidade esquerda quanto na extremidade direita eu vou mostrar pra vocês agora um vídeo pra
vocês entenderem como a distribuição de normalidade ela acontece na natureza nesse vídeo que vocês vão ver agora um rapaz ele pega uma série de bolinhas e ele distribuem num funil e esse funil ele tem alguns pinos de modo que quando a bola ia bater em um pino ela vai ser distribuído aleatoriamente tanto na esquerda quanto pela direita algumas bolinhas vão entender a equipe cantando nos fios e cair no ponto central algumas vão tender a cair nas extremidades vamos ver como é que vai ficar isso ap veja que interessante pessoal ele então ele vai jogando uma
série de bolinhas aqui no ponto central exatamente no meio essas bolinhas elas vão ficando para a esquerda e para a direita a grande maioria delas teve a cair aqui não é exatamente no ponto central e algumas poucas número muito menor vai entender aqui kaká e caído na extremidade esquerda e na extremidade direita né esse é veio que quando a bola cai aqui a gente não sabe a gente não tem como prever praquela londrina então o comportamento individual a gente não tem como saber mas a teoria disse que o comportamento coletivo num comportamento populacional ele vai
entender né sempre a gerar essa curva normal se esse evento aqui ele foi completamente aleatório é então a curva normal e pode repetir esse exemplo aqui centenas de vezes que o resultado certo vai ser o mesmo vai estar sempre vai ser nessa distribuição normalidade aqui como vocês podem ver um número muito maior de bolinha centralizadas em número muito menor de bolinhas aqui nas extremidades então o pessoal a gente pode dizer k como normal ela representa a forma como diferentes valores vão se agrupar em torno de uma determinada média tá quando a gente trabalha com pesquisa
com seres humanos a gente pode dizer é que a curva normal ela representa é a forma como diferentes pessoas se agrupam em torno do entorno num determinado score eu vou dar um exemplo aqui para ficar mais claro com dados de altura de homens do brasil esse dado é fictício e foi elaborado por mim apenas a título de exemplo então vamos avaliar é como é que se dá à distribuição de altura em homens no brasil tá então imagina que a gente tem que a gente sabe né que a média de altura dos homens do brasil é
um em 70 então coloquei aqui 170 sedentos metros 70 e que o desvio padrão na população é 7,16 ou melhor não na população mas da amostra que eu coletei agente calcular é para a gente avaliar se os dados ele tem distribuição normal ou não a gente precisa ter então esses dois para mas a média e desvio padrão imagina então o pessoal que a gente tem aqui a altura de 15 pessoas aqui tá então a gente tem aqui uma pessoa mais baixo que é representado aqui por 1 59 e a gente tem aqui um cara mais
alto apresentado por 111 a 88 a média da altura dessas 500 pessoas nada mais é do que o somatório de todas as alturas e dividido pela quantidade de pessoas que a gente tem então a gente vai ter aqui né 2.550 é um somatório desses números aqui dividir por 15 então os 170 centímetros então um metro e setenta calcular o desvio-padrão o desvio-padrão nada mais é do que uma estimativa de variabilidade dessa média né dos escores individuais em relação à média então a gente tem aqui no gráfico é onde a gente apresenta é que a média
o valor da média é 170 centímetros mas a gente sabe que a gente tem pessoas que têm escolas abaixo da média então são representados por essas bolinhas aqui abaixo do traço é quem apresenta média ea gente tem pessoas que têm é alturas acima da média bem a primeira coisa que a gente precisa fazer pra gente calcular é o desvio padrão da amostra a gente diminui o score do indevido da média então aqui 159 menos 170 da 11 160 mil 170 da 10 163 menos 160 170 das sete e assim sucessivamente a gente calcula a diferença
dos cortes do indivíduo dos indivíduos para a média de todos os indivíduos aqui só que aí pessoal se a gente somar essas diferenças de média aqui essa segundo ele essa gente somar isso aqui vai dar zero então é esse não é um dado muito informativo então prefeito cláudio padrão que a gente precisa fazer a gente precisa é levar o quadrado essas diferenças aqui então menos 11 ao quadrado das 121 menos 10 ao quadrado da senha e assim sucessivamente até então a gente leva as diferenças da média ao quadrado e para calcular o desvio padrão a
gente vai pegar a raiz do somatório dessas diferenças ao quadrado e dividir por n menos um que a gente está trabalhando com dados amostrais então o desvio-padrão nada mais é do que a raiz quadrada de 718 que é o somatório dessas diferenças ao quadrado / 14 porque a gente tem 500 participantes nosso exemplo então ele - 1 o desvio padrão então desse nosso exemplo é 7,16 então o pessoal vejam que a gente tem aí é pra gente mostrar pra vocês como ficaria essa questão de distribuição normalidade dados fictícios onde a média é um em 70
170 centímetros e um desvio padrão e 7,16 a curva normal então ela é como eu já falei é do fim é definir por meio desses dois indicadores aqui vejo o pessoal que há como normal é o povo é simetricamente distribuída então a mesma informação que a gente tem aqui pelo lado esquerdo a gente tem aqui pelo lado direito então o ponto central aqui tá da curva normal é a média então esse ponto central que ele é exatamente 1,70 e é exatamente a média na curva normal existem outros dois indicadores que são exatamente iguais à média
o primeiro deles é a moda ea moda é o número que aparece mais vezes né veio aqui na curva normal essa altura aqui representa a freqüência é a quantidade de casos que aparecem então vejam que quanto mais alto for nada mais é do que mais pessoas têm esse determinado escolhe se a gente voltar aqui pro nosso vídeo a gente vai ver que essa altura que o pico de altura nada mais é do que a o ponto tem mais pessoas aqui né mais bolinhas no carro que agrupadas e uma terceira propriedade da como normal é o
fato de que por elas e exatamente é simétrica a mediana é que é o número em que vai dividir 50% por um lado e 50% o outro também é exatamente igual à média então esse ponto esse ponto central aqui ele vai agrupar tanto a média um em 70 170 quanto à moda então 170 também vai ser o número um é que vai aparecer mais vezes enquanto a mediana 170 ele é exatamente o número que vai distribuir 50 por cento pessoas abaixo de de 170 e 50 pessoas 50 por cento de pessoas acima de 1 70
só para vocês entenderem isso aqui eu vou voltar aqui alguns slides para vocês pra vocês verem isso aqui nos dados é que a gente tem então vejo que o a média é como eu já comprei pra vocês é 1 70 mas os 70 também é o número que aparece mais vezes à então a gente tem aqui três vezes o valor de 1 70 para representar aqui por essas três bolinhas em cima da da média então isso aqui a moda tá e acho que tem também a mediana que é um dos 70 então a mediana o
número que separa duas metades iguais pra cima e pra baixo então a gente tem aqui os seis casos abaixo de 1 70 ea gente tem seis casos acima de em centenas então como eu já falei ah como normal eu tenho exatamente esses três valores eventos média o nome de adriano a curva normal ela também tem uma distribuição é de dados é padronizada então o que a gente sabe na curva normal a gente sabe que 68% dos casos eles vão acontecer entre mais ou menos um desvio padrão acima ou abaixo da média considerando dois de seus
padrão acima e abaixo da média a gente vai compreender 95,4 por cento dos casos e se acha que considera três vezes no padrão acima e abaixo da média a gente vai considerar já conseguir a agrupar 99,7 por cento dos casos vamos aqui para o exemplo com a idade e com a média da idade sérgio considera nem sabendo que a média é 170 centímetros e um metro e setenta e um desvio padrão é 75 16 se os dados forem normalmente distribuídos ajuste mais a gente vai ter 68,3 por cento de pessoas nessas 68,3 por cento de
pessoas que voltei alturas de 1 62 até os atacantes 7 neodi o padrão abaixo num desvio padrão acima da média se acha que considera dois desvios padrão então os valores seriam de 1 55 até 1 84 e saque metros neto 55 155 centena de 64 centímetros a gente vai ter então 95,4 por cento das pessoas que vão te entre 1 55 até 84 de altura e consideram três meses o padrão a gente vai ter 99,7 por cento de pessoas compreendidos nas alturas de um metro 48 até um metro e 91 vejo que isso aqui é
um exemplo hipotético mas é importante que nesse momento já tenha claro pra vocês que quanto mais afastado a pessoa tiver da média não é isso sendo computado um desvio padrão quanto mais afastar essa pessoa tiver menor é a probabilidade da jeito de encontrar é este pessoa que eu tô querendo dizer com isso é muito mais fácil você encontrar uma pessoa que tem um metro e 70 de altura ou até mesmo é de 65 de altura em que você encontrar uma pessoa com um metro e noventa e dois de altura as pessoas mais altas assim como
as pessoas mais baixas elas tendem a aparecer de forma muito menos freqüentes mas vejam só embora a distribuição da normalidade seja uma das curvas de probabilidade mais utilizados na estatística nem todos os dados eles têm distribuição normal e isso pode acontecer por uma questão de desvio da amostra na sua mostra não representa muito bem a população ou pode ser daqui fato aquele evento aquele fenômeno que você esteja investigando ele de fato não tem uma distribuição normal da natureza um exemplo fácil de compreender é a renda no brasil né a renda no brasil ela tá mais
ou menos distribuída dessa forma né a gente tem aqui um número muito maior de pessoas que são mais pobres e um número muito menor de pessoas que são mais ricas vejam que aqui então né na faixa na faixa mais pobre a população mais pobre do país ela representa um número muito maior de pessoas do que o o a partir de pessoas mais ricas então isso aqui é um exemplo claro em que a gente não tenha de distribuição normal da natureza então o pessoal desvios de normal nada pode acontecer por duas formas é o primeiro desvio
por assimetria né esse desvio por assimetria que ele pode ser uma assimetria positiva ou uma assimetria negativa né assimetria positiva ela é exatamente esse exemplo e mostrar pra vocês da renda então vejo que a maioria das pessoas se encontram concentrados aqui no lado esquerda e aí nesse tipo de desvio por assimetrias a gente é a seguinte característica net o ponto mais alto da curva continua sendo a moda né amor dell de um número que representa a maior quantidade de pessoas depois a gente tem a mediana é estratégica descritivo que vai separar a amostra em duas
partes iguais e depois a gente tem a média então o valor da média na simetria positiva é onde é o valor mais alto então o valor mais alto é a média seguido da mediana e por fim a moda né então vejam que a gente tá dizendo aqui na questão da renda é que o valor mais baixo é de renda ele é o valor de mais vai ter pessoas aqui é alocados nas pessoas com jo cuja renda maior número de pessoas vai ter a renda mais baixa que a mediana e mais baixo que a média bem
na assimetria negativa a curva exatamente o contrário tende a cair para a direita então um exemplo disso é por exemplo é felicidade nessa gente fizer uma pesquisa sobre felicidade no brasil a gente vai ter uma característica do corpo mais ou menos parecido com essa né a maioria das pessoas nem vão dizer que elas tenham alto nível de felicidade e vão ser poucas pessoas que vão dizer que tem um bar um nível muito baixo de felicidade né então é isso isso é a assimetria negativa o outro exemplo né de desvio de normalidade se chama diesel por
cortá los na anterior o desvio por assimetria e esse é o diesel por dose o desvio por tozzi pode acontecer de três diferentes tipos né na verdade dois diferentes tipos a curva laptop porque eu queria ver bem aqui o colector curta os dados estão muito concentrados junto à média então são é uma mostra na gt uma pouca variabilidade e muita gente se concentrou a lei no ponto central da curva então aquelas proporções que eu falei pra vocês elas não acontecem a curva laptop lógica a curva normal é considerada é chamada também de como mazzoco ficando
então a distribuição normal tem esse nome e a gente tem também uma curva chamada platt kurtyka é que os dados estão muito dispersos então a gente tem mais ou menos na idéia da coplac curto é que a gente teria mais ou menos a mesma quantidade de pessoas tanto no extremo quanto na parte central quanto na no extremo direito nós temos quer sendo direito e ea parte central mais ou menos com a mesma quantidade de pessoas na então vejo que é uma coisa um pouco mais achatada né então vejam que quando a gente tem esse tipo
de desvio de de cor tozzi essa proporção a cnec a proporção da curva normal de alocação de pessoas e de escolas ela não acontece então essa locação essa proporção aquilo não acontece nem por assinei por desejar simetria e nem por desvios de cortadas então agora eu vou ensinar você irá avaliar se o status de vocês têm uma distribuição normal ou não e pra isso a gente utiliza um software spss vejo que existem basicamente de duas formas a gente está a distribuição normal dos estados a primeira é a partir de critérios descritivos utilizando os valores de
assimetria curto dose oral é e avaliar se estão dentro de alguns critérios que a literatura sugere ea segunda por testes estatísticos então vamos fazer aqui a primeira forma critérios desses critérios a primeira coisa que a gente precisa fazer é é a gente faz sol no estado é que o programa ele pega uma determinada variável e ele calcula fragetti os valores de assimetria e de cortar 11 junto com os valores o spss ele vai dar um erro uma informação que o erro padrão o que a gente vai precisar fazer é transformar esses valores de cor tons
de assimetria e estatística chamado estatística z e pra isso a gente nada mais faz do que dividir os alunos da simetria cortados pelo erro padrão que vai vir junto com o programa a literatura sugere o seguinte isso na verdade bem eu é oriunda da tabela normativa da escola z se essa razão aqui ea simetria cor tons defendida pelo erro padrão for maior do que o governo 96 o soldado não tem distribuição normal então a modelo é rejeitado com pm menocchi 0,05 se o valor de assimetria cor tons dvd pelo padrão o acima de 2 58
a distribuição de normalidade também é k não é a catalunha como ter menor que 0 01 e se o valor dessa razão foi igual ou maior 3.29 a sua distribuição ela não é normal com nível significa sp menocchi 0,001 então o pessoal vamos aprender a calcular isso aqui não spss eu tenho nesse banco de dados duas variáveis aleatórias com alguns cortes aqui imagine essa questão escolhe a uma variável psicológica que eu coletei agentes vão estar os valores de assimetria por dose ficamos em analisar estatísticas descritivos explorar nós iremos colocar essas duas variáveis aqui na lista
independente originalmente ela estão aqui na esquerda vocês trazem aqui pra direita e aqui a gente vai solicitar diagramas a gente pega o histograma é o instagram é justamente a a distribuição normal dada a distribuição na verdade é como os dados estão distribuídos ea gente vai ser o estado da grama de normalidade com testes então aqui a gente vai solicitar ambos também exibe ambos de ajeitar perto oque a primeira coisa que sai aqui são as estatísticas descritivos do meu das variáveis então vejo que aqui a gente tem esquinas esq 10 o termo em inglês de de
assimetria e depois embaixo a gente tem curta doses sejam tão pessoal que eu falei que pra gente ter a distribuição de normalidade a razão entre o valor da assimetria curto ozzy dividido pelo valor do erro padrão ela não pode ser maior do que o 1,96 vamos então calcular começamos então problema de assimetria skills da variável o time bidding 0,411 dever dinheiro por 0,098 então vejam que o valor ele foi altíssimo 4,19 a gente deveria esperar que esse valor não fosse maior do que o veículo 96 agora vamos fazer o cálculo da cor tosa dividindo 0,539
0195 esse valor é 2,76 mais uma vez a gente não poderia esperar que ele falou que o assassino divulgando 96 na variável dois dividindo os valores do cortume assimetria 0,04 por 0,01 98 a gente tem uma assimetria de 0,24 então vejo que nesse caso aqui por assimetria ele desde que a distribuição não é assimétrica só que quando a gente faz o cálculo da curta dose 0,638 / 0,195 a gente tem aqui no bairro acima do esperado de 3,27 então vejam que na variável a gente tem uma é uma distribuição que ela não é normal porque
ela tem desvios de assimetria e também desvios de cortar 11 e na variável 2a jeito não tem desvio de assimetria mas a gente tem um desvio de portugueses se a gente olhar que os gráficos vocês podem ver facilmente como essa aparece vejam que essa é a variável ela tem um desvio de assimetria né então você vê que há possivelmente as caldas nelas não são equivalentes então por isso tem um desvio de assimetria e ela tem também um desvio por tozzi vejam que aqui vocês têm aí uma uma curva muito muito alto é um pico muito
alto a gente tem um número muito concentrado de pessoas aqui nos pontos centrais número maior do que o que se espera na variável 2 por sua vez a gente não tem um desvio de assimetria é conforme à os cálculos mostraram mas já tenho um desvio de cortesia então a gente tem aqui um número muito maior de pessoas concentrados aqui nem em alguns pontos centrais não vejo que possivelmente a distribuição normalizada não foi acatada por causa desse valor aqui que concentra um número muito maior de pessoas do que se esperava então é assim pessoal que a
gente calcula então a distribuição de normalidade por meio dos critérios descritivos dividindo o valor de assimetria por todos pelo celular um padrão e esperando que esses valores eles estejam menores do que o derrubou 96 a nível dp menocchi 0,05 se você quiser usar critérios mais rigorosos nep menor que 0 01 o pm não quiser ouvir uma 001 você considera então esses valores aqui 2,58 e 3.29 existem também testes estatísticos que fazem esse trabalho pra você são peças de significância para avaliar se a sua distribuição é normal ou não o spss oferece dois testes que são
os testes de com gomes - e shapiro willkie então basicamente os testes de como móveis - deixa pelo link eles vão dizer que os seus dados a eles eles não são normais não há hipóteses lula é que os dados não são normalmente distribuídos para você a catar a distribuição de normalidade dos seus dados você precisa rejeitar a hipótese lula então quando você faz um teste com o moral dos menores shapiro willkie você espera é que o valor dp do seu teste seja maior do que r 0,05 assim você está rejeitando a hipótese de lula de
que seus dados não são normalmente distribuídos então num spss pessoal como 99 shapiro eu que eles aparecem exatamente os mesmos lugares que a gente a versão lançada apenas para retomar vamos ver aqui estatística descritiva sem analisar textos descritivos explorar e aí vejo que a gente tinha solicitado só está tanto o histograma quanto o diagramas de normalidade com testes então é exatamente aqui que a gestação estando o teste estatístico isso aparece também na abl inicial de explorar onde ele pergunta o que é que você quer então a gente está pedindo ambos tanto as estatísticas quanto os
diagramas então quando a gente aperta ok a gente chega então nesse alto puty aquino onde puder a saída e aí pessoal vejam que nos dá uma das saídas até aqui é testes de normalidade com komorowski mesmo e shaper o wii então como eu falei pra gente acatada distribuição na maldade a gente tinha que esperar que o valor dessas estatísticas aqui fossem maior do que 0 05 então vejam que para ambas as variáveis e para ambos os testes como móveis - ficha piorou e a gente não tem uma distribuição de normalidade é captada então a gente
tá dizendo que os nossos dados eles não são normalmente distribuídos então é isso pessoal duas formas muito simples da gta avaliá a distribuição normalidade dos dados que espero que vocês tenham gostado espero que tenha esclarecido a ino alguma dúvida os eventualmente essa terra abraço