e quando eu tenho três grupos como é que eu faço como realizar um teste de hipóteses quando tenho três grupos já não é mais uma situação de dois grupos como é como é que seria a sugestão natural realizado em 2 a 2 netão se eu tenho por exemplo um caso que eu tenho médias três grupos terapêuticos aqui como é que eu analiso para desembaralhar estatisticamente o problema será que realizando 2 a 2 não seria uma boa estratégia faço é tst 2 a 2 o que acontece se eu fizer isso né a primeira eu tenho que
responder à pergunta esses grupos são independentes esses grupos têm distribuição normal tem exibição conhecida a variável estudando é qualitativa e quantitativa sempre lembre se de fazer essa pergunta antes de iniciar um estudo uma estratégia análise como é que eu vou comparar essas médias se eu fizer a testes ter duas a duas no caso alidado da figura eu tenho três grupos eu tenho que realizar três testes t se eu tivesse seis grupos e teve que realizar 15 testes t afora o fato de nós termos um problema operacional mais intenso né temos que realizar muitas vezes o
teste t nós temos um problema de outra natureza que a quantidade de testes é explosiva você tem os dez grupos é aquele 10 fatorial pra frente e pra frente ou seja o número de testes vai ficando muito grande mas esse não é o principal problema a questão é que a quando eu realizo testes te múltiplos usando o mesmo nível de significância eu perco a noção de que eu estou acumulando erros se reuniu de câncer a 5% na verdade com três testes e não é mais 5% ele é de 14,3 por cento vejam aqui a conta
se eu tinha um nível de significância de 5% definido a priori quando eu realizei três vezes os testes t eu tinha 95% de correção eu fiquei com 85,7 por cento de correção ao realizar três tst portanto 1 - esse valor dá 14,3 por cento de erro que é meu critério ficou completamente perdida imagina realizado então seis testes t-15 testes te daí pra frente quanto mais tst realizo meu alfa teria que ser corrigido proporcionalmente de que baixando o alfa pra poder dar conta essa realização mas existe uma técnica estatística ou várias técnicas que resolve essa questão
de análise de múltiplos grupos simultaneamente eu preciso conduzir então um teste diferente nesse caso que mantenha o erro tipo 1 o alfa e no valor que estabeleci inicialmente ou seja se a 5% não pode ser diferente ao final das análises encostassem no critério de 5% o teste nós vamos realizar para múltiplos grupos de três ou mais grupos têm duas opções principais ou análise de variância batizada de a nova análise sof várias ou o teste de cruz kolles que é um equivalente não paramétrico dá para a análise de três ou mais grupos vamos então ver como
é que realizamos esses testes quando nós trabalhamos com diversos grupos portanto o que me interessa saber é se há aquela média está variando dentro entre eles igualmente ou não se a média igual em todos os grupos similar em todos os grupos ou alternativamente se uma delas é diferente dos outros do grupo uma ou duas ou mais são diferentes entre si eu posso reduzir o problema no caso as de variância a duas variantes mesmo tempo três quatro grupos eu posso reduzir o problema há duas variantes a variância dentro dos grupos os e a variância entre os
grupos e é isso que faz o procedimento da análise de variância a variância dentro dos grupos nada mais é do que uma espécie de média ponderada das variâncias ponderada pelo que ponderada de novo pelos graus de liberdade de cada grupo então se nós fôssemos fazer a mão aqui a variância dentro dos grupos bastaria fazer essa conta que é a média ponderada das variâncias de cada grupo então multiplicado pelo seu grau de liberdade / todos os graus de liberdade - o auditor fiscal de verdade né simplificando um pouco essa fórmula eu tenho esse numerador igual mas
o tamanho total do tamanho total de n - oscar grupos então a variância dentro dos grupos é esta a variância entre os grupos têm esta formulação é uma média na verdade das variações das médias em relação à média geral então veja aqui a variância entre os grupos é a diferença de cada média de cada grupo - a média geral ao quadrado muito caro pelo n do grupo somados dividido pelo número de grupos - um tostão nós temos dois tipos variância agora mesmo que tenha seis grupos dez grupos 20 grupos e reduz o problema duas variantes
a variância dentro dos grupos e a variância entre os grupos muito bem se nós temos duas variantes você já sabe como resolver o problema basta fazer um teste efe olha que interessante nós tínhamos dez grupos de estudo estudando 10 para verificar a diferença entre médias reduzir para 2 variâncias a minha conta basta fazer um teste efe agora então surpreendentemente é um teste extremamente simples análise de variância para um fator é muito filho se ela for multivariada nós temos que pensar um pouco mais mas para um fator ela está reduzido tf de duas variantes a variância
dentro e a variância entre os grupos análise de variância para ser executada exige que nós atendamos alguns pressupostos alguns critérios mínimos para poder realizar uma análise de variância o primeiro critério que é o critério de todo o teste estatístico é que as amostras sejam independentes e aleatórias obtidos de forma aleatória ou por sorteio que os dados sejam de variáveis quantitativas contínuas ou têm distribuição normal se eu não tenho uma variável quantitativa contínua tem uma variável qual a quantitativa discreta por exemplo mas os dados não têm distribuição normal eu já não devo eu não devo realizar
lá de variância eu voltar pelo cruz com olhos como a gente vai ver em seguida eu preciso fazer um teste de homogeneidade entre os grupos das variâncias esse teste é o teste de barco led então a nós de variância simples mas existe um empecilho aqui no meio do caminho eu preciso testar tudo isso é preciso verificar essas condições que são mínimas para atender e realizar o teste então vamos lá vamos fazer a análise de variância tomando aqui o teste inicialmente debate né vamos pegar um outro conjunto de dados interessantes que é um dado de gestantes
em que foi verificado a a deficiência de ácido fólico durante a gestação não suponham que nós tenhamos essa pergunta que para responder à concentração de ácido fólico sérica varia de acordo com a etnia da gestante uma pergunta válida em certa medida sim se a etnia reflete variações genéticas de absorção por exemplo de ácido fólico é uma pergunta interessante se a etnia eventualmente refere é refere se a um programa cultural um problema econômico também pode ser uma característica interessante então a etnia pode ser um fenômeno que vai que mude a concentração de ácido fólico ou absorção
jazz o fone portanto vale a pena estudar esse fenômeno que está faltando aqui o alfa netão sem o alfa a gente não tem decisão vamos escolher um alvo então de 5% mal chegou a 0 05 e vamos realizar o teste de bafômetro para verificar se entre essas três etnias uma ótima oriental caucasiana e afro-descendentes aqui simbolizado pela as letrinhas a mbr e p d ok ambientais amarelos caucasianos brancos e afro-descendentes pardo ou negro há muito bem realizado o teste de bateria do mini tap faz pra gente teste de batley butler quando eu peço um teste
para a igualdade variâncias temos o butler eo levine como já tínhamos visto anteriormente como a variável quantitativa continuar estou fora m de medida não gramas por ml então nós podemos ao teste bairro se fosse uma variável quantitativa de destruição normal discreta normal eu usaria o teste de levine nesse caso e como nosso alvo era de 5% o teste de barco deu 7,1 por cento tac 0,071 portanto as variações são homogêneas são similares eu posso rodar o teste a nova lá rodando análise de variância pelo militar ea gente obtém um valor de p&d 0,026 nosso alvo
era de 5% que eu posso concluir então que existe diferença entre as médias de ácido fólico de acordo com a etnia da gestante então essa média está anotado aqui embaixo as orientais origem asiática tem uma média de ácido fólico de 10,67 5as caucasianos tem uma média de 7,5 76 são 10 e 67 meio e asafa descendentes de 5,7 então o ácido fólico significativamente diferente nesse caso menor do que as há pelo menos do que a as de origem asiática não dá pra saber se existe diferença nesse nível aqui agora entre os caucasianos e as afrodescendentes
não consigo afirmar neste teste que há uma diferença entre elas aqui eu posso passar a realizar um teste agora te quando o teste a nova nossa significativa diferença entre as médias de 3 ou mais grupos estou toda começar a realizar testes t desde que corrigido o alfa eu não posso usar hoje 15 por cento de novo eu tenho que diminuir o meu alfa de acordo com o número de testes como com essa uma correção que é uma correção então apropriada para poder rodar múltiplos testes te ei conhecida como de bonfim roni ok então tá está
feito o nosso teste a nova realizado de maneira simples nome tab é bastante simples realizar este teste vamos lá no militar para demonstrar pra vocês como é que nós fazemos vamos abril a planilha a planilha então é de gestantes a fólico e b12 aqui a planilha gestante e vamos lá vamos realizar a primeira unidade das variâncias o ácido fólico está aqui anotado aos sete meses que é o que interessa durante a gestação no início do pré-natal mas já perto do final da gestação aos sete meses então em estaç nós temos um botão uma opção no
menu pra nova e na nova nós temos aqui teste pra variâncias para a igualdade de variâncias a variável de resposta é ácido fólico aos sete meses de idade e o fator de discriminação dos grupos é a etnia da gestante eu rodo e obtemos então aquele gráfico obtemos aqui o resultado tanto em gráfico quanto no laudo do militar bna sérgio aquino butler com o pedido 0,071 maior que nosso alfa como demonstrado anteriormente por tantas variantes são homogêneas eu posso rodar finalmente a análise de variância bastando para isso entrar em estaç a nova o ano e é
um fator só que eu estou avaliando não é a etnia então ácido fólico aos sete meses e o fator que nos interessa é a etnia ao rodar aqui temos o nosso laudo com aquele gráfico que é muito interessante esse gráfico que mostra a média e desvio padrão em torno da média o p como nós já sabemos é um p de 0,86 rodamos uma nova obtemos um p vou desculpar 0,026 né menor do que os 5% de alfa que nós tínhamos e finalmente podemos ver qual média é diferente das outras ou pelo menos de uma delas
aqui nós não sabemos se a média de ácido fólico das asiáticas e diferente das outras duas ou se é de da safa descendente é diferente das outras duas acerto é preciso para realizar o teste ter subseqüente para definir quem é diferente de quem a nova não me diz directamente quem é diferente de quem apenas mostra uma dica pra que lado está a diferença está muito bem vencida a nova vamos voltar pro nosso slide e vamos ver o que fazer agora quando a variável foi qualitativa original não é mais qualitativa não quantitativa contínua a variável às
vezes é qualitativa e quantitativa reta mas não tem transmissão normal portanto não posso usar nova as variações não são homogêneos a variável era quantitativa contínua mas as variantes entre os grupos não era homogêneo se tudo isso falha eu não vou desistir da minha pesquisa posso realizar um teste que é o teste de cruz coalizão é um teste não paramétrico é muito importante ter essa alternativa porque quando você começa uma pesquisa clínica você não sabe o resultado que vai ter nas mãos você até se propôs a realizar uma área de variância mas aconteceu das valências não
será homogênea então nem tudo está perdido é possível realizar um teste não paramétrico de cruz com wallis como é que a gente faz o teste de cruz collins como é o teste não paramétrico nós vamos exemplificar lo por uma variável qualitativo original que é mais diretamente ao ponto aqui vamos usar de novo nosso a briga né o apoio dos recém-nascidos será que ele é similar entre as etnias será que algum fenômeno étnico interferiria na avaliação da apreciação do a pinga muitas vezes é importante que eu tenho uma escala nova super que a escala certos testes
para verificar se ela sofre interferências culturais por exemplo se ela sofre interferência de uma natureza econômica então é importante constituir grupos no caso o nosso aqui por facilidade agora eu tenho a etnia será que o abriga sofre alguma interferência da etnia da mãe tentamos pegar aquele nosso exemplo quase 210 parturientes e seus recém nascidos lá no na no estudo de vacinação para hepatite b e vamos verificar o apca com um alfa de 5% vamos ao militar e portanto recuperamos aqui a planilha de o hpv que não está aqui vamos carregar então então abrimos a planilha
a fire workship hpv vaccination aqui abrimos a planilha nossa variável então entramos em estar directamente não há nenhuma manipulação necessária não para metrics para realizar o teste de cruz colares nossa variável de resposta é o upgrade e o fator de agrupamento das mães ea etnia rodamos o teste diretamente temos o p ajustado para os impactos que é igual a 0,143 ou seja o nosso valor dp 14,3 por cento maior do que a alfa portanto a etnia não parece mudar ou resultar em abrigar diferentes na mediana veja que as medianas aqui para o grupo de mães
asiáticas é de 8 o grupo demais caucasianas desculpa o recém-nascido né a mediana do aplica dos recém nascidos de mães asiáticas e oito demais é caucasiano às 8 e de afro descendentes 7 não há diferença então entre as medianas do atletas recém nascidos de acordo com a tia da mãe voltamos à nossa slide e concluímos isso transcrevemos o laudo aqui para o slide né e temos um perigosa 0,14 o disco é 14,3 por cento dp maior que o alfa portanto sem diferença de apgar entre as etnias ok uma representação gráfica em boxe lote dos três
grupos mostrando que há uma grande integração dos grupos realmente como a mediana um pouco diferente apenas mas não significativamente diferentes para o grupo aqui afrodescendente ok muito bem quando temos apenas uma variável hoje já sabemos como resolver o problema né temos apenas uma variável com dois grupos com mais de três grupos temos tst teste efe teste de baixo e teste de que os collins mão item o cotton para uma variável hoje até aqui já saberão resolver e quando eu quiser fazer uma medida de associação entre duas variáveis como é que eu vou proceder vejo que
a palavra associação agora m e vai induzir a pensar numa análise bem variada até aqui nós mostramos análises une variados para vocês eu tinha uma variável em jogo e há grupos diferentes agora vou ter uma associação da de duas variáveis numa mesma análise uma análise bivar yada porque eu quero relacionar duas variáveis no mesmo indivíduo nesta então eu quero pegar o mesmo paciente e saber se tem relação entre o rei e creatinina quero saber se existe relação entre fumantes e fumantes e desenvolver câncer de pulmão como é que eu faço uma associação de duas variadas
é preciso de métodos estatísticos específicos para variáveis categóricas que são qualitativas nominais para variáveis qualitativas originais e para variáveis quantitativas eu posso eventualmente estimar a força desta correlação mas isso só vai ser possível que alguns tipos de variáveis variáveis qualitativas originais e variáveis quantitativas avaliáveis variáveis categoria de não poder é definir a força da associação pelos métodos variados usar outros métodos para isso eu posso representar as variáveis por funções matemáticas quando elas forem quantitativas eu posso produzir então o posso calcular uma variável pela outra quando ela foi quantitativa fazendo então uma regressão tão ver como
fica esse é esse conjunto de análises de associação o primeiro grande método para medir a associação é o que quadrado o que quadrado ele faz associação de variáveis categóricas então o que significa isso quando tenho duas variáveis categóricas fumante e não fumante câncer de pulmão sim ou não quando eu cruzei essas duas variáveis eu resultou numa tabela de contingência em que eu tenho cá categorias eu tenho dados que são observados são contagens e tenho dados esperados naquela posição na tabela o que me interessa aqui nessa medida dê a sensação é que a proporção de observação
é similar a proporção da expectativa então o que eu estou vendo aqui nessa manifestação é se a proporcionalidade ou desproporcionalidade tá só não vê isso de maneira um pouco mais para quando tiver a tabela né eu tenho uma certa contagem para cada área da tabela de contingência e pra isso então eu eu faço um teste que leva em consideração a diferença entre observado e esperado eu e leva ao quadrado o que aqui essa letra grega a gente fala em português que e divido pelo esperado e observado menos esperado ao quadrado dividido pelo esperado soma essas
diferenças ao quadrado de vida pela expectativa e vou resultar num valor de que quadrado se observado é muito semelhante ao esperado esse número aqui em cima é pequeno ele tende a zero eventualmente o número fracionário não desse mal ele vai acordar e ficar menor ainda né quando devido pelo esperado fica de menor ainda então que quadrados baixos levam a uma expectativa de igualdade que quadrados mais altos há uma expectativa de diferença ok a uma uma definição de diferença então nós vamos rejeitar h0 em relação ao valor de quadrado que é uma distribuição são é importante
aqui verificar que o que quadrado é uma distribuição que têm graus de liberdade também como é que será o jeito da distribuição que quadrado né sempre lembrar que ele é um teste também de caudal porém ele só tem uma cauda a distribuição é positiva porque ao quadrado tem uma cauda apenas mas a gente trata como se fosse de caudal apesar de jogar o valor de alfie inter numa cauda som esse é o aspecto a distribuição estatística que quadrado reparem que com um grau de liberdade ele vem daqui quase que exponencialmente descendo e quando tenho dois
graus liberdade ele assuma uma forma assimétrica quando vai aumentando os graus de liberdade ele tende a ficar simétrico chegando em 30 graus de liberdade ele é bastante simétrico em relação ao centro não é uma média esse valor de quadra não é uma média exatamente ele é apenas uma variação de 0 a inffinito mas acima de 30 graus liberdade ele se torna bastante mas vocês vão ver que não é fácil ter 30 graus de liberdade numa tabela de contingência né os gaúchos liberdade depende do número de casas na tabela então tem uma tabela de até 30
anos liberdade tem que ter cinco por set por 6 ou coisas dessa natureza e aí eu tenho que ter muita gente vai preencher estas elas o ele tem que ser muito alto é diferente do da questão do tst o conseguiu obter a liberdade com facilidade mas no teste que o atraso não é fácil obter 30 graus de liberdade muito bem notem que a variação é assimétrica geralmente para o lado de cá pelo lado direito né eu tenho uma ponta uma espera uma cauda que se assimetricamente vem pra direita né ok muito bem vamos considerar uma
tabela para resolver um problema verdadeiro aqui será que o uso de capacete protege contra lesões cranianas em acidentes de motocicleta será que a verdade será que realmente vale a pena usar capacete não foi feito uma pequena contagem no pronto socorro do hospital das clínicas né onde foram observados 793 acidentes de moto em que se o e se perguntou para o paciente ou pro acompanhante no caso eventualmente se ele estava ou não usando capacete no momento do acidente observou-se que 646 pacientes né não usavam capacete no momento do acidente e 147 usavam capacete dos 793 pacientes
558 não tiveram qualquer trauma craniano enquanto que outros 235 sim apresentaram algum tipo de alteração ou traumatismo craniano numa tabela como essa que é uma tabela 2 por 2 ou seja a variável uso de capacete admite duas respostas ea variável lesão craniana admite tuas respostas então é 2 duas colunas por duas linhas certo numa tabela dessa qual a expectativa de preenchimento desta área interna como ela deveria ser preenchida se o uso do capacete não modifica a ocorrência de lesão eu esperaria que o número de pessoas com lesão que usa capacete e que não usa capacete
né ou o que que tem lesão é que não tem lesão é similar nos dois grupos que usam que não usa capacete de acordo como ver um pouquinho diferente aqui a idéia sempre é possível montar o h 00 ea alternativa né a hipótese nula no caso é a proporção de pessoas que sofre lesão nos usuários de capacete no momento do acidente é igual à proporção de pessoas que sofre lesão dos pacientes que não usavam capacetes a proporção não o número então a proporção de indivíduos é similar nos dois grupos no que usa capacete no que
não usa capacete no caso alternativo quem a proporção dos que sofre lesão é diferente entre os grupos de usuários de capacete tá certo quem use que não usa tem proporções diferentes de ocorrência de lesão craniana então lá eu preciso aqui na primeira etapa verificar essas proporções para que eu saiba para que direção o fenômeno está acontecendo né a probabilidade a proporção na verdade a proporção de sofrer lesão é 235 em 793 ou seja 29,6 por cento ou seja se eu voltar aqui na tabela 235 motociclistas tiveram lesão em 793 acidentes de moto não sofrer lesão
é 558 em 793 ou 70,4 por cento esta proporção é a proporção que me interessa aplicar agora nos grupos de usuários e não usuários de capacete como é que fica essa conta se eu voltar a tabela agora e fizera seguinte à operação eu pego aquela fração né de 235 que sofreram lesão em 793 em múltiplos 147 pacientes que usavam capacete então essa proporção aqui de sofrer lesão nos 147 resulta em 43,6 a minha expectativa de preenchimento da caserna nesse caso é de 43 44 pessoas que teriam que apresentar lesão mas esse aqui é o grupo
que o que usa capacete né deu - o dia 17 então há uma desproporção nenhuma há uma diferença entre o observado e esperado seguindo no cálculo os que não sofreram lesão a expectativa é de 558 793 nos 147 que usavam capacete esta freqüência esperada de 103 que não teriam lesão mas observamos 130 já repararam que tem uma desproporção então quem usa capacete e aparentemente parece que está protegido de ter uma lesão craniana vamos fazer agora pela dica para quem não usa capacete a expectativa de ter a lesão é a mesma daquela do todo né 235
em 793 aplicando essa proporção nos 647 que não usavam capacete a expectativa era de 191 terem lesão 218 tiveram lesão craniana e não estava usando capacete existe uma clara diferença aqui né entre o observado e o esperado finalmente não ter lesão é entre os que não usavam capacete era esperado 454 na verdade foram observados 428 menos do que a expectativa agora eu posso com clock quadrado para um grau de liberdade veja como é que obtém graus de liberdade numa tabela eu multiplica o número de colunas - 1 vezes o número de linhas - um então
2 - 11 vezes um é igual eu só tenho um grau de liberdade já repararam que para ter vários graus de verdade tem que ter tabelas muito maiores do que essa mas na área clínica vai ser muito mais comuns a tabela dois por dois porque eu tenho um fenômeno dessa natureza é presente ausente sim não não é positivo negativo vai ser muito mais comum esse tipo de dado do que tabela 5 por 6 por exemplo que para preencher são muito mais difíceis e requerem um número muito maior de pacientes muito bem agora realizando que quadrado
eu posso ter é o resultado final na tabela dois por 21 pesquisador chamado e propôs que se fizesse uma correção para a continuidade então para poder rodar o que quadrado eu faço aquela conta observado menos esperado em módulo - meio que corrigir na tabela dois por dois para a continuidade e levando ao quadrado sobre o oe que o esperado e somando todos esses valores então e obter o que quadrado corrigido para a continuidade segundo e aqui entra um problema com relação ao aumentar bi ou software militar e não faz a correção de ienes e ela
é uma correção importante já outro software que nós temos para apresentar a vocês que o spss faz a correção de eles então mais tarde mostraremos como se calculou que quadrado para uma tela 2002 para o caso do spss né realizando na mão então nosso nosso quadrado que tem uma tabela 2002 não é difícil nós obtemos um valor de 27,27 na tabela do que quadrado para um grau de liberdade e com alta de 5% o valor de corte do que quadrada 3,84 portanto esse valor é bem maior e nós podemos concluir pela rejeição da igualdade ou
seja há uma desproporção entre a ocorrência de lesão e o uso de capacete não uso de capacete parece favorecer mesmo a dimensão de lesões cranianas ok nós podemos usar o nosso a spss vamos ao fps 15 agora pra vocês vão fazer o quê quadrado no spss utilizando aquele conjunto de recém nascidos e as parturientes do estudo de hepatite b de soro conversão de hepatite b vamos lá a nossa pergunta que é será que a sua conversão está associada à presença de virose será que a proporção de soroconversão é menor entre os indivíduos que apresentam algum
quadro infeccioso por vírus uma pergunta válida né no momento dada a aplicação da vacina para a hepatite b a criança estava desenvolvendo febre e constatou se uma infecção por outro vírus será que a a sua conversão é perturbada será que eu diminua a sua conversão quando tem um outro vírus infecta na criança então nós vamos entrar novo spss que é um outro pacote estatístico bastante interessante com muitas qualidades entre as qualidades das ipss que ele faz cálculos mais é bem corrigidos como esse doente por exemplo o spss nos fornece a possibilidade de além do que
um militar que oferece em termos de qualidade de alguns cálculos no caso do que quadrado para tabela 2 por 2 1 o fps é preferível por conta da correção de direitos então ea realização do do teste é bastante simples eu entro aqui no anuais vai mudar um pouquinho os termos do menu mas isso não deve nos atrapalhar já carreguei anteriormente a planilha excel que o hpv vaccination análise nós vamos realizar aqui uma análise descritiva roupa fazendo o cross teps que a palavra crosta boletim está presente também só que essa por um outro caminho então em
análise descritiva statistics cross tags e aqui no cross tevez eu posso colocar por exemplo a soro conversão aos seis meses de idade que está aqui anti hbs seis meses vamos colocar nas linhas e nas colunas a presença de virose em torno dos seis meses de idade aqui direto é muito semelhante à forma de operação do do pacote mas no caso eu tenho que entrar aqui statistics e pediram que quadrado tem várias estatísticas da tabela dois por dois o que nos interessa neste momento é o que quadrado vamos continuar dando ok ele aparece em uma outra
tela esse é um diferencial do dress ipss o resultado não aparece na tela da planilha a sessão de laudo fica numa tela adicional então tá aqui ó cruzamos a tabela virose sim ou não ou não assim ele também segue a ordem alfabética e positivo negativo tá escrito aqui pra anti hbs a criança tomou vacina ou soro converteu é um não sou converteu e 01 negativo positivo reparem que das 210 das dez crianças que foram bastante com o esquema de três doses para hepatite b as que não tinham virose das que não tinham virose 105 em
152 soro converteram enquanto as que tinham virose apenas 27 em 58 ou seja menos da metade só converteu aqui e aqui em torno de dois terços ou mais com soro converteu parece que há uma desproporção parece que a virose atrapalhou a sua conversão das crianças então onde é que eu vou verificar a significância eu falei que opera de voltar no apê opera de 5% sakineh opa voltando pra nossa análise com o pt 5% eu tenho o valor de que quadrado é dado pelo que quadrado de pirson que está aqui e eu o ps 0,003 portanto
menor do que 5% do que em 0,05 nós temos outras medidas na tabela de dois por dois que estão aqui inclusive o teste saúde fischer que é um outro teste para tabela dois por dois mas que tem indicações e depois eu falo sobre elas neste momento interessa saber que pelo que quadrado o meu valor dp que ele chama aqui de acm totti que significa que o sider da 2b caudal 0,03 menor portanto que o alfa que eu posso concluir a presença de virose interfere na sua conversão para a vacina da hepatite b então essa é
uma constatação importante que recomenda que as crianças não sejam vacinadas na vigência de infecções agudas por outros vírus que aguarde a recuperação ante ser vacinada muito bem resolvido mais eu rodei também pelo que quadrado do mini tab para mostrar que na prática aqui a correção de erros para este n não foi não foi importante para 210 é uma mostra bastante interessante né o valor de pi obtido pelo pelo militar e foi igual ao do spss então aí surge uma série de critérios para a gente optar pelas correções e pela indicação de que quadrado ou pelo
pacote estatístico quando meu n1n1 pequeno e nós vamos ver agora então a questão do pequeno quer dizer o quê no quadrado amostras menores do que 40 menos de 40 indivíduos com duas variáveis cruzadas numa tabela é uma mostra com tela pequena certo se ela tem menos do que 40 preciso respeitar algumas características para poder aplicar o que quadrado e até para poder aplicar a correção direitos né o teste pode ser usado se o número de observações para eliminar 40 for igual a 5 em todas as casas elas as contagens forem iguais a 5 observados em
todas elas ea esperada for maior ou igual a 5 também em todas as casas elas então essa é uma é uma observação importante é um critério e menor que 40 eu tenho que observar se a observar tenho que observar se o preenchimento é maior que cinco em cada casa dela tanto na observação quanto na expectativa se a tabela qualquer tabela l por ser ou seja acima de dois por dois né com graus de liberdade portanto maior do que um se eu tiver uma freqüência esperada inferior a 5 esperada em 20% das casas elas ou menos
eu posso aqui quadrado foi ver entenda bem se eu tiver uma freqüência esperada menor do que 5 em menos do que 20 por cento das casas elas eu posso aqui quadrados com ele menor que 40 se tiver uma freqüência esperada menor que assim quem mais do que 20% das gazelas e não demos ao quadrado o que nós fazemos na prática é reduzir a tabela de três por três por exemplo a tabela 2002 eu diminui o número de categorias para poderá fazer uma análise ainda eventualmente isso é possível em vários estudos reduzir tabelas muito grandes 5
por 6 4 por três tabelas dois por dois essa é uma estratégia de análise eventualmente necessária quando eu não consigo ter um preenchimento adequado no caso de tabelas de de ienes entre 20 e 40 com a tabela com a frequência mas é uma tabela 2 por 2 no caso não é com freqüência esperada menor que cinco estão numa tabela 2 por 2 com ele entre 20 e 40 e uma casa dela menor do que 5 na esperada eu tenho que usar o teste de fischer não posso aqui quadrado e no caso do n ser menor
do que 20 eu tenho que usar é o teste difícil obrigatoriamente mesmo que os preenchimentos sejam todos é maiores não serão mais do que cinco porque o ele é menor que 20 já são pelo menos um trabalho de cinco estão com ele melhor do que 20 eu preciso usar o teste exato de fichas e como é que é o texto exato de fish tanto militar quanto spss calcula o tecido de fischer suponho vocês que eu queira separar as mães afrodescendentes no meu estudo para verificar se a virose interfere com a sua conversão preparadas pra vacina
da hepatite b quando eu separo só as mães afrodescendentes eu fico com 22 parturientes com 22 mais no caso porque a criança acompanhada a partir do parto por seis meses então como eu tenho ele entre 20 e 40 eu preciso verificar o preenchimento das casas elas né como é que eu faço isso vamos lá então para o mini tab no caso aqui ainda é o spss aqui agora tem muita tabela vamos lá as caras são parecidas dos softwares né agora sim pronto então temos aqui disse a planilha daquelas daquele estudo de vacina da hepatite b
e nós vamos separar as mães por etnia então vamos lá no menu deita nós vamos separar a split por grupo étnico então ele vai gerar três planilhas para nós e eu vou pegar a planilha de afrodescendentes que está aqui na praia de afrodescendentes nós temos 22 mães não é isso vinte e duas mães e queremos saber se a sua conversão nas crianças afrodescendentes é afetada pela virose pela presença de virose então basta que a gente entra em estate tables cross tabuleiro chan e nós vamos cruzar a soro conversão sim ou não aos seis meses para
hepatite b com o fato da criança ter ou não virose ter tido uma virose perto da da época de vacinação que testes vamos usar ainda não sei né porque eu tenho 22 pacientes têm que tomar cuidado então entrou aqui em a dell está tce que é a outras estatísticas e já seleciona por cautela o fish que pode ser que o preenchimento não seja adequado não vi ainda tabela mas vou optar pelo fischer e votar pelo que quadra também em simultâneo não tem problema o importante é a interpretação fazer o teste pode né não sei ainda
se eu posso usar ou não e vou optar também por que ele me dê as porcentagens na linha porque na linha eu tenho a sua conversão tá certo então vamos lá com ok rodamos vamos ver como ficou a tabela antes de decidir a tabela tem o seguinte preenchimento aqui observado aqui então as crianças é com viroses em virose estão aqui na coluna não tem virose sim tem virose soronegativo 0 o soropositivo um uma criança sem virose não sou converteu nove crianças com virose não sou converteram sete crianças sem virose soro converteram as cinco crianças com
virose soro converteram se repararam que aqui tem é com o indivíduo é uma uma caserna com menos de 5 e outras com mais de 5 na tabela dois por dois agentes sabe que a indicação para o fischer então que quadrado não tava lendo esse pedro que quadrado aqui não está valendo eu tenho que usar o p definido pelo teste saúde phishers o próprio militar pm alerta que tem duas celas com expectativa menor do que cinco mesmo sem eu ter feito a conta o militar faz e alerta olha not duas células têm valor esperado melhor de
cinco eu já sabia que eu ia usar o ficha mas acabei de confirmar que não dá pra outra desculpa não vou usar o que quadrado vou usar o fischer e aqui já calcula o fischer e vejam que o valor de ip não é nada de fato 00 19 mas é um valor de ip de 0,03 se eu voltar lá pro meu slide agora meu alvo era de 5% portanto esse p de 3% mostra coerentemente com que tinha observado com todas as crianças misturadas que as crianças afrodescendentes também alterem virose na época da vacinação não sou
o convertem adequadamente muito bem e se eu precisar de fischer mais uma decisão mais uma publicação já podem publicar esse resultado também e quando as variáveis são quantitativas nós temos um outro conjunto de técnicas para isso que são as técnicas de 16 pelo próprio pirson só que para estabelecer o coeficiente de correlação agora a gente pode fazer com as quantitativas contínuas após fazer também a com relação à força da associação além de fazer a associação eu faço a força da associação então eu tenho um valor numérico quantitativo contínuo e eu posso é fazer um teste
que me correlacione as variáveis dando uma uma força uma força com relação a essa força ea associação é chamado de coeficiente de correlação e ele é batizado como r o coeficiente de correlação de pirson ou r nada mais é do que a covardia ânsia tas da variável x da variável y dividido pela variância ou pela pelo desvio padrão de da multiplicação delas separadamente então r sai diretamente desta deste cálculo a covariância esta conta que a anotada pra vocês a somatória da diferença de cada observação x - a média de x modificada pela variação de cada
y - a média de y tudo isso dividido pelo n - um montão isso é a cor variando se mude o padrão nós já sabemos calcular cálculos praxes e pra y&r acordo com a relação tem uma propriedade bem interessantes qual seja o r assumir valores entre - 1 e 1 a associação negativa é dada pelo valor - um essa associação negativa perfeita ou seja quando uma variável cresce a outra decresce exatamente na mesma proporção quando r e isso aqui então quer dizer quando x aumenta o y diminui e vice versa uma variável quando r gual
a 0 quando o coeficiente de correlação é igual a zero eu tenho a ausência da associação linear ou seja não existe qualquer correlação entre as variáveis e quando é igual a um ou mais um eu tenho uma associação de ganhar positiva forte o que implica de que quando os x aumenta o y aumenta exatamente na mesma proporção muito bem vocês sabem que menos 10 e onde dificilmente serão obtidas sempre haverá um número entre -1 e 1 e dificilmente será zero será 0,1 uma coisa menos 0,1 alguma coisa por isso é preciso testar estatisticamente essa esse
coeficiente de correlação syed se existe a associação significativa antes porém vamos mostrar o exemplo gráfico de como é o rb igual a um dos pontos observados estão perfeitamente numa linha relação perfeita ou r igual a mais 0,8 existiu mas um desalinhamento né por aqui passa uma reta mas ela não é alinhada pelos pontos é uma reta média o ego a 0 não consigo traçar uma reta que mostra qualquer tendência aqui talvez uma reta que passa aqui ó em paralelo menos 0,8 quando o x aumenta o y diminui mas também não estão alinhados e uma relação
inversa perfeita é igual a menos um os pontos estão todos alinhados relação perfeita mais investimento proporcional eu disse para vocês a um teste de hipóteses necessário para ver se há coisa de correlação é significativo ou não para isso a gente faz um teste em que a gazel faz o rn igual a zero não existe a associação ou alternativamente o r diferente de zero ele é um teste de caudal para atestar o começo de uma relação linear a gente usa o tst na seguinte formulação usando o valor de r musical pela raiz quadrada dinheiro - 2
sobre um menos r ao quadrado para uma avaliação por exemplo de tênis - 2° liberdade quando eu tenho uma variável coritiba continua eu posso fazer a associação da equação da reta eu posso como é computar o valor de y a partir do valor de x usando a equação da reta e pra ter aqui uma reta preciso do inter certo é que são os padrinhos da reta o inter septo onde a reta cruza o eixo y e o valor do coeficiente anular a inclinação da reta este ângulo à tangente deste ângulo será colocada aqui pra modificar
o x então intercepta é uma constante o bb1 também o curso regular uma constante que modifica o valor de y em relação à x a técnica pra esse é um dos meninos quadrados em que eu vou tentar aproximar a reta ideal diminuindo esses essa distância entre os pontos observados então isso aqui é uma técnica que leva em consideração a distância ao quadrado dos pontos observados da reta ideal para isso é preciso otimizar essa relação à somatória dessa relação os meninos quadrados podem ser obtidos por essa formulação que ninguém faz a mão mais hoje em dia
e nem calculadora usa diretamente um software estatístico pra isso né para calcular b1 e quem tem o coeficiente angular consegue calcular o inter certo aplicando reversamente valor para a média de y ea média de x então podemos utilizar a reta média para calcular os parâmetros necessários basta e resta para nós agora definirmos mais um coeficiente que é o coaching determinação que nada mais é do que o r ao quadrado o erro quadrado conhecer determinação me diz quanto do fenômeno que estou estudando é explicado pela reta ou é explicado pelo modelo que eu assumi e significa
o seguinte 1º r vai arrancar quadrado varia de zero a um cio r variava de -1 ao quadrado varia de zero a um o que significa então ocorrer sem determinação se o r quadrado e 0,9 quer dizer que 90 por cento da variação de y pode ser explicado pelo x e como vocês sabem muitos filmes não são dependentes um do outro apenas eu tenho para uma um y eu tenho vários outros outras variáveis para computar e nós veremos na semana que vem na análise multivariada como fazer isso hoje é bem variada então ficamos conhece qualquer
determinação alguns cuidados são necessários e aplicar com relação à agressão primeiro é preciso verificar se o fenômeno que estou estudando pode ser representado por uma reta vejo aqui por exemplo aqui eu tenho um é igual a zero mas a própria a própria diagrama dispersão o gráfico xy mostra que eu não deveria ter aplicado uma reta já não sei deveria nem ter começado fazendo por um modelo por uma reta aqui eu tenho uma outra um outro conjunto de dados que tem um r muito bom né 0,9 mas reparem que ele não é uma reta ele perceba
que ele faz uma uma curva que estaciona um certo valor satura então aqui um deveria aplicar reta também apesar do rc bom então é importante ter cuidado que a correlação em regressão é muito usada indevidamente porque os pesquisadores não olham para os professores é um deles eu preciso fazer um gráfico de inspeção antes de começar a fazer uma relação uma uma regressão especialmente a correlação até posso fazer mas a regressão não enquanto não souber se a reta de time b o fenômeno e correlação não implica em relação causa efeito nós vamos falar sobre isso no
final da aula de hoje suponha um outro problema que se eu aplicar uma reta nesse modelo eu vou obter de novo r muito bom mas e se esse modelo é um modelo de dose resposta que é melhor definido por um modelo não linear por uma curva exponencial por exemplo então a regressão que deveria fazer aqui não é linear e sim uma regressão e exponencial ea métodos para isso também tá certo por último como técnica e tática de hoje nós vamos mostrar uma variação da correlação que foi desenvolvida pelo espírito humano charles é doado esperma que
foi contemporâneo do próprio kalpson o espírita notou que as variáveis qualitativas originais não poderiam ser se servir de uma análise bem variada do tipo de correlação de pirson seria necessário aplicar uma análise não paramétrica porque elas têm uma uma natureza não pagamento ou seja são qualitativas originais então eu posso na verdade estabelecer postos como qualquer variável com e qualitativa original e aí rodar o coeficiente de correlação mas para os postos e não para a notação da variável original vamos ver como é que fica isso para vai para modificar um pouco a nomenclatura ao invés de
usar r nós vamos usar a letra grega ou então no teste de hipóteses a correlação ro se não houver correlação é igual a zero se o coeficiente de spear marrom foi diferente de zero ele indica que a correlação entre as variáveis por incrível que pareça o teste de correlação de espírito humano usa também o teste t para rodar a significância do teste então o ro na mesma fórmula para r aparece para um teste ter com ele - 2° liberdade interessante que expira eo pirson eram contemporâneos operação desenvolveu dele para correlação e regressão o espírito notou
que as variáveis qualitativas ficaram de fora e bolou fazer isso propostos o pessoal nunca perdoou espigão por isso por ele ter usado para a própria técnica mas de uma maneira um pouco diferente que acabou levando o nome do irmão na no caso né então vejam que a técnica continua sendo pirson mas usando postos e não a variação da prova na própria unidade né algumas questões relacionadas ao piauí esquema e elkeson né reparem aqui nesses dois gráficos nós temos no caso um conjunto de dados perfeitamente alinhado que dá uma variação um coeficiente de correlação igual a
um de pirson e um curso de spiro igual afinal de contas quando eu fizer isso aqui impostos também estará perfeitamente alinhada agora nesse outro conjunto de dados eu tenho uma certa um certo alinhamento aqui mais um dado a ele completamente fora da curva reparem que apesar de estar fora da curva está em uma posição crescente ainda que respeita uma posição ascendente o rd pirson o curso de correlação de pechão de 0,84 e o rhodes pirmann ocorrendo com relação de irmão de um porque ele levou em consideração as posições relativas e não o valor da variável
em si então se já repararam que o espírito não consegue detectar correlações boas porque usa as posições relativas os postos mas ele não consegue definir uma reta é importante saber da limitação do esquema o esquema não pode traçar uma reta para os seus dados não se deve obter a reta ideal para os dados quando usar esperma então fica aqui anotada essa diferenciação entre os dois afinal mesmo falar de causa e efeito para que estabeleça causa e efeito é preciso seguir à risca dez critérios que não são suficientes e não para uma regressão e na correlação
o primeiro critério é a existência a associação entre as variáveis para saber se existe causa e efeito e comércio testando a associação mas não é suficiente é preciso saber a intensidade dessa associação significativa aprendemos a fazer isso agora mas é preciso verificar a consistência dessa dessa associação se ela é reprodutível se eu faço em diferentes momentos diferentes situações se ela se a causa produz o efeito se ela tem especificidade ou seja se um único fator produz um único efeito o que é muito difícil de demonstrar porque em medicina os fenômenos são geralmente multi causais então
um certo efeito tem várias causas então a especificidade é um fenômeno difícil de demonstrar a temporalidade a causa tem que perceber o efeito um gradiente biológico do tipo dose resposta quando o aumento a variável que causa o efeito esse maior também profissionalmente né numa relação dose-resposta a plausibilidade da relação causa-efeito se ela concorda com outros conhecimentos obtidos na literatura por outros dias né por outro tipo de experimento se a concordância dessa ocorrência dessa causa com efeito se a o conhecimento específico gerado é coerente concordante se nós temos evidências experimentais além das evidências clínicas né se
eu consigo produzir experimentos com animais por exemplo que mostram a relação causa e efeito e finalmente se eu posso fazer analogias por similaridade da variação do efeito por pela causa então esses critérios aqui tem que ser atendidos para que eu possa definir causa e efeito na aula de hoje nós ficamos aqui nesses primeiros dois quesitos muito bem era o que eu tinha para mostrar pra vocês hoje é uma aula exaustiva longa espero que vocês não assistam todo de uma vez que possam fazer intervalos e treinem com os pacotes estatísticos ao mesmo tempo que vão fazendo
a aula os as planilhas estão disponíveis pra vocês baixarem e fazer os exercícios com mini tarde e quem tiver acesso a spss poder usar o spss também obrigado e até a próxima oportunidade