Associações entre Variáveis Categóricas - Teste Qui-quadrado e Teste Exato de Fisher

7.09k views2292 WordsCopy TextShare
R, Estatística e Aprendizado de Máquina
Neste vídeo falamos sobre os testes qui-quadrado de Pearson e exato de Fisher.
Video Transcript:
o Olá pessoal então nosso vídeo de hoje nós vamos tratar agora das associações entre variáveis categóricas até o momento a gente falou de uma variável quantitativa como variável qualitativa uma vez oramos e essa variável qualitativa com duas categorias e aí a gente tem os testes te ou tentaria vão dependendo se são grupos Independentes ou cariados e peste é - Whitney e o Robson quando a gente tem que testes não-paramétricos vemos também no último vídeo sobre a noiva e o teste de kruskal-wallis e agora nós vamos falar então quando a gente tem a situação de duas
variáveis qualitativas se relacionar aqui no nosso curso Mas vamos falar de dois o teste fica bravo também chamada de teste qui-quadrado de pico e o teste exato difícil é bom esse tipo de teste estatístico ele é utilizado para determinar se duas variáveis categóricas são chamadas de variáveis qualitativas estão Associados e as análises e ela corre por meio da tabela de contingência lembra da nossa estatística descritiva que a gente falou da convivência e que a gente poderia observar as porcentagens o meio de um perfil linha e coluna pois bem essa tabela vai ser muito importante agora
no nosso teste de avaliação de associação entre duas variáveis categóricas você verá também que às vezes tem intendência usado para significar que não há associação entre as variáveis tá então é muito comum a gente é um artigo e falar que as variáveis são independentes significando então que elas não possuem Associação então como eu disse para vocês agora a gente vai ter um relacionamento de trabalhar qualitativa com outra qualitativa bom então vamos falar do teste qui-quadrado e fecha exato onde fica e vamos imaginar a seguinte situação a gente tem plaquinha apresentado duas variáveis qualitativas homens e
mulheres representam né A primeira variável que tem ascendente e acidentes os níveis da segunda variável que a gente poderia levantar seguinte pergunta Será que homens têm uma probabilidade maior de sofrer um acidente de carro que mulheres pois bem A partir dessa nossa morte representada aqui na tabela de contingência a gente deu o seguinte padrão desde as mulheres totalizando 56 mulheres 51 registraram não ter sofrido acidente e quatro cinco registraram que já sofreu um acidente de trânsito né um acidente de carro na linha de baixo onde a gente pode representar homens totalizando e 44 homens Nós
vamos que 29 não sofreram acidente enquanto que 15 sofreram acidentes dentre o total na de observações nesse total de 100 observações o cento são mulheres que sofreram acidente e 34 por cento são homens que sofreram acidentes parece então que a porcentagem de homens que sofreram acidentes é maior que a porcentagem de mulheres que não sofreram acidente então será que a gente pode garantir que existe uma associação entre essas variáveis então que existe uma maior probabilidade de homens sofrerem acidente de carro porque mulheres Ah pois bem é isso a gente vai utilizar cinco anos eu acho
que quadrado assim como os testes paramétricos que a gente viu né fecha ter a novo ele também possui seus pressupostos pois bem os pressupostos são os níveis ou categorias das variáveis são mutuamente exclusivos é isso significa que eu não posso ter uma observação presente em dois grupos diferentes eu não poderia ter na nossa tabela de incidência uma mulher que está presente está sendo contabilizada estão na coluna de acidentes pontos na coluna de não acidente Então as categorias elas são mutuamente exclusivos outro pressuposto é que a gente tenha duas variáveis qualitativas com dois ou mais níveis
fado cada um lembrando de uma variável qualitativo com apenas uma categoria Deixa de ser uma variável da nossa análise certo já que ela não possui várias vida outra característica importante aqui e as unidades de observação elas não são variadas Ok então a gente não tá comparando aqui um antes e um depois algo desse e o valor esperado nas células devem ser cinco ou mais em pelo menos oitenta por cento das células e nenhuma célula deve ter um valor esperado menor filme parece um pouco complicado né mas basicamente a gente tem um certo resumo cá isso
de que se a gente tiver né células com valor abaixo de cinco no nosso na nossa tabela de contingência isso já é um alerta porque talvez o site de quadrado não vai ser adequado e o bacana que a gente fazer é que eu só te leve ele permite Na verdade ele emite uma mensagem indicando que talvez o teste que pagar não esteja adequado aquela distribuição de dados que a gente tem então ele já diga para gente usar como alternativa o teste exato de bom então o teste exato de Fisher ele só vai diferir aqui em
relação aos pressupostos if qual Este último aqui marcada guarantee não for atendido aí a gente utiliza como alternativa o teste exato de Fisher então recapitulando o principal pressuposto é que é o valor esperado nas células deve ser cinco ou mais em pelo menos oitenta por cento das células o que que é esse valor esperado a gente já vai ver daqui a pouco e nenhuma saúde deve ter um valor esperado menor filme então eu não posso ter células com valores valor esperado zero e oitenta por cento desses valores eles precisam ser 5 ou mar o quê
quais são as hipóteses do nosso teste qui-quadrado a hipótese nula diz que não há associação entre as duas variáveis ou seja as variáveis de linha e coluna da tabela de contingência são independentes não há uma associação entre ela EA hipótese alternativa consequentemente de que existe uma associação entre as duas variáveis ou seja as variáveis de linhas e colunas são dependentes a gente também poderia pensar nessas hipóteses em termos de proporção que é o que a gente está avaliando certo a proporção de mulheres que sofrem acidente difere da proporção de mulheres e de homens que não
que só pra ensinar a gente poderia também pensar nesse sentido interno de um bom E como que o teste qui-quadrado funciona então teste qui-quadrado né ele é baseado na diferença entre as frequências observadas e esperar e a famosinha da estatística do teste é nada por esse somatório dos valores observados menos os valores esperados elevado ao quadrado dividido pelos valores esperados sendo que o valor esperado é a soma da linha vezes a soma da coluna pelo total da tabela caramba preocupa não entendi nada mas não sou toda minha mãe vamos utilizar então um exemplo que a
gente viu sobre homens e mulheres Sim acidentes de trânsito estão lá no início a gente tinha né uma distribuição né nos valores para cada caixinha vamos dizer assim para cada célula da minha tabela de contingência como que eu vou calcular o valor esperado esse valor esperado ele é calculado para cada célula Zinha tá então para mim Olá mulheres com acidente homens em acidente e homens com acidente e ele é dado pela soma da linha vezes a soma da coluna dividido pelo total na tabela então o valor esperado para mulheres sem as ideias vai ser a
soma da linha então a gente precisa voltar lá na nossa então a o valor esperado para mulheres em acidente vai ser nada pela soma na linha e este valor está na primeira linha e a soma da linha 56 vezes a sombra da coluna este valor está nesta coluna EA soma é oitenta dividido pelo Total se é assim então o valor esperado para mulheres em acidente a 56 vezes 80 / sem e de mulheres com acidente 56x 20 / cem homens em um acidente vai ser 44 x 80 divididos por 100 e homens em acidente 44
x 20 / sem fazendo esses cálculos a gente então encontra o valor esperado para cada célula Zinha da nossa tabela de contingência então aqui depois encontraram esses valores esperados eu vejo tem algum valor esperado aqui abaixo de zero ou melhor a baixa de O Zé não tenho né eu tenho aqui algum valor esperado né é o melhor oitenta por cento pelo menos oitenta por cento dos meus valores esperados são maiores que sim todas são maiores que 5 né 44,8 3512 11,2 e 8,8 poluição maiores que sim então acho que quadrado é indicado ele funciona Tá
bom quando eu falo né o valor esperado menor e um e eu falei 0 Mas a gente pode ter valores quebrados na 0,1 0,3 0,4 0,5 porque o valor esperado ele vem deste cálculo aqui tá bom então depois que eu calculo o valor esperado eu vou pular para cá passear Luanzinho aí a sua operação o observado que aquilo que a gente chama o terror na nossa mostra menos o esperado de ao quadrado então 51 anos 44,8 ao quadrado dividido por 44,8 que o valor esperado então aqui eu e tem seis 3,43 1,09 4,37 ao final
que eu faço eu somo todos esses valores então a minha estatística qui-quadrado vai ser 9,75 a parte dessa estatística Então a gente vai ter um valor P associado bom então vamos lá a mão e aí naquela nossa situação se a gente representasse aqueles valores graficamente que a gente observar esse gráfico de barras empilhadas então a gente percebe né Tem um gráfico que fica bem claro o seguinte se a gente olhar a coluna verde né que representa sem para acidente a gente vê que a área né compreendida que lá pela coluna verde ou simplesmente a loucura
já que as bases são idênticas é bem maior se a da mulher né então eu vejo uma maior proporção em que os homens como é que ela acidente de trânsito do que em relação né as mulheres e aí realizando o teste de qui-quadrado chega no valor pedir 0,0041 valortejo 0,004 e o que que ela indica para mim tá baixo do meu livro de significância de cinco porcento logo a gente rejeitar a hipótese nula se rejeitar a hipótese nula eu falo que tem uma associação entre acidente e gênero Tá bom então existe uma associação entre estas
variáveis e de fato parece que os homens né os dados trazem evidências de que os homens comecem mais acidente de trânsito do que as mulheres acho que quadrado vocês vão ver que ele é muito utilizado nos trabalhos científicos né nos artigos científicos e consequentemente também o teste exato de Fisher já que quando a gente não tem né algum valor Sendo atendido né algum problema com os valores esperados Aquela aquele pressuposto que a gente definiu ele não sendo atendido a gente utiliza taxa exato difícil então aqui no exemplo do artigo percepção da a minha causa localidades
próximas ao Complexo Petroquímico do Rio de Janeiro Brasil a gente vê o seguinte na máquina dolorido as quando tabuada e analisadas utilizando o software statistical package For The Social sciences né o spss utilizado versão 21.0 foram utilizadas estatísticas de sistemas ou seja né o ativo então provavelmente traz uma descrição da amostra e teste de qui-quadrado e o exato de Fisher para comparar proporções as respostas por grupos e categorias considerando nível de significância de cinco porcento são aqueles utilizaram os dois testes bom e aí a gente vê a panela onde os resultados né dessa e dessas
variáveis que foram analisadas então a gente vê por exemplo que a gente tem qualidade né qualidade do ar qualidade dos rios qualidade das suas e qualidade das áreas de lazer sendo uma variável qualitativa com três ou quatro categorias e uma variável e seria localidade certo representado pelos níveis né pelas categorias cursos das caixas e maneiras certo e aí a gente observa que aqui né se a gente considerar Posto das caixas e Mania como as nossas variáveis talvez explicativas a gente tem aqui 40 as qualidades né como variáveis pensando assim vamos dizer resposta tá não seria
bem respostas mais para gente interpretar fica muito mais interessante esse pensamento então a gente percebe por exemplo e a gente ver aqui Posto das Caixas né 45 porcento possui né uma qualidade do ar regular Enquanto aqui em Manilha 45 porcento é ruim então quando a gente avalia isso né de forma não tem não por um teste estatístico a gente encontra o valor P de 0,005 abaixo do nível de significância indicando a uma associação entre as variáveis então parece realmente que o que Porto das Caixas tem a qualidade do ar né uma proporção maior para regular
enquanto assim Mania uma proporção maior para a categoria funde-se A gente observar aqui por exemplo qualidade dos rios provavelmente nessa situação teste utilizado foi o teste de Fisher não taxa exata difícil porque o que eu já vejo E aí vamos muito baixo só 146 então quando eu tenho valores muito baixos valores abaixo de cinco isso já me remexi na ao problema né então provavelmente nos valores esperados vão ficar abaixo de um ok o mesmo a gente observa aqui ó qualidade das suas em que a gente tem o valor zero qualidade das áreas de lazer que
a gente tem os valores é então com certeza nessas três situações aqui Este valor é decorrente do teste exato de Fisher ouviu o valor zero na planilha né Ou melhor ela alerta ligado teste qui quadrado não vai ser indicado para essa situação então a gente utiliza o teste exata de vir tá bom pessoal então espero que tenha ficado Claro para vocês a gente finaliza essa vídeo-aula por aqui e no próximo vídeo a gente fala sobre os testes de em relação avaliando então duas variáveis quantitativas até a próxima
Related Videos
Correlação entre Variáveis Numéricas - Teste de Correlação de Pearson e de Spearman
12:00
Correlação entre Variáveis Numéricas - Tes...
R, Estatística e Aprendizado de Máquina
3,409 views
Pressupostos dos Testes Paramétricos
9:22
Pressupostos dos Testes Paramétricos
R, Estatística e Aprendizado de Máquina
5,525 views
Teste Exato de FISHER mais simples do mundo! (JAMOVI)
14:55
Teste Exato de FISHER mais simples do mund...
Canal Pesquise
17,930 views
Teste exato de Fisher no SPSS
24:17
Teste exato de Fisher no SPSS
Fernanda Peres
21,421 views
Diferenças entre Dois Grupos Independentes - Teste t e Teste U de Mann-Whitney
23:11
Diferenças entre Dois Grupos Independentes...
R, Estatística e Aprendizado de Máquina
4,761 views
Resumo - Testes Qui-Quadrado de Pearson e Exato de Fisher
10:23
Resumo - Testes Qui-Quadrado de Pearson e ...
R, Estatística e Aprendizado de Máquina
7,677 views
Estatística Básica| Quando utilizar e como interpretar o teste do QUI-QUADRADO?
14:05
Estatística Básica| Quando utilizar e como...
SOS Ciência
11,227 views
Variáveis
18:50
Variáveis
R, Estatística e Aprendizado de Máquina
5,932 views
Testes Unilateral e Bilateral e Poder Estatístico
13:27
Testes Unilateral e Bilateral e Poder Esta...
R, Estatística e Aprendizado de Máquina
5,036 views
Teste Qui-quadrado (SigmaPlot 12.0)
18:24
Teste Qui-quadrado (SigmaPlot 12.0)
Canal Pesquise
6,573 views
Estatística e Probabilidade - Aula 12 - Teste Qui-quadrado
17:41
Estatística e Probabilidade - Aula 12 - Te...
UNIVESP
98,410 views
Como escolher o teste estatistico ideal - teste t, Mann-Whithney, Qui-quadrado
8:03
Como escolher o teste estatistico ideal - ...
Easy-knowledge treinamentos
27,505 views
Qui-quadrado de independência no R
54:11
Qui-quadrado de independência no R
Fernanda Peres
16,917 views
Teste de Qui Quadrado -Resumo - Bioestatística
13:54
Teste de Qui Quadrado -Resumo - Bioestatís...
Canal Resumed
403,162 views
SPSS| Como FAZER e INTERPRETAR o teste do QUI-QUADRADO no SPSS?
8:36
SPSS| Como FAZER e INTERPRETAR o teste do ...
SOS Ciência
14,413 views
Teste exato de FISHER (SigmaPlot 12.0)
17:54
Teste exato de FISHER (SigmaPlot 12.0)
Canal Pesquise
5,922 views
Resumo - Testes de Correlação de Pearson e de Spearman
7:46
Resumo - Testes de Correlação de Pearson e...
R, Estatística e Aprendizado de Máquina
11,687 views
Qui-quadrado x Exato de fisher
11:19
Qui-quadrado x Exato de fisher
Paty Bioestatistica
923 views
Testes Paramétricos e Não Paramétricos
6:43
Testes Paramétricos e Não Paramétricos
R, Estatística e Aprendizado de Máquina
29,437 views
Copyright © 2024. Made with ♥ in London by YTScribe.com