Regressão Logística Binária no SPSS (Aula 13 - Parte 2)

45.75k views2972 WordsCopy TextShare
Fernanda Peres
Nesse vídeo veremos como fazer uma regressão logística binária (com a variável dependente da regress...
Video Transcript:
a regressão há gente que vai abrir essa saída e vejam que a gente tem aqui uma primeira tabela mostrando um resumo do caso está mostrando que 70 indivíduos foram incluídos na área de ou seja 100% da minha amostra ele mostra também aqui uma tabela com o código de cada uma das categorias da minha variável dependente então não para a chance é zero em para câncer é um e ele mostra também como foi categorizado hábito de fumar tendo te não para o hábito de fumar é zero encarar o ato de fumar é um e vejam que
eu tenho na mostra 29 pessoas que não fumam e 41 que fumam como hábito de fumar é mais freqüente do que não fumar ele vai ter a categoria 1 é de referência então ele vai ser usado como categoria de referência de sendo aqui a gente vê o bloco 0 então esse bloco 0 todos os todas às três tabelas que estão dentro desse bloco 0 elas são tabelas referentes ao modelo sem nenhuma variável independentes ou seja sem o hábito de fumar e sem o stress o modelo sem pagar nenhuma das variáveis independentes vai considerar que todos
os indivíduos estão dentro da categoria de maior freqüência nesse caso como na minha amostra 39 pessoas têm câncer e 31 não têm o modelo vai prever que todo mundo tem câncer fazendo isso ele vai acertar em 55% dos casos uma vez que vai acertar 0% dos que não têm câncer e 100% dos que tem ele vai acertar em 55 por cento dos casos esse é o modelo sem nenhuma variável independente aqui e essa segunda tabela me mostra informações como a constante desse modelo sem nada pra casa eu queira montar e interessante é aqui é só
uma tabela na qual está indicada as variáveis que não foram incluídas nesse modelo que no caso a gente tem aqui o hábito de fumar ea gente tem essa linha mostrando aqui o próprio técnico estatística global é essa aí é essa tabela que é importante transmitir gays algumas das variáveis que não foram inseridas no modelo seriam relevantes para esse modelo caso p dessa linha o rosto tercek for menor do que realizar cinco e significa que uma das variáveis que não foram inseridas no modelo é relevante por esse modelo o que eu não deveria pagar aí eu
deveria construir um modelo mais complexo que descendo a gente vê aqui as informações para o bloco 1 então lembrando quando eu programei o programme que o bloco 1 ser um bloco contendo a variável independente hábito de fumar ea variável independente estressa seria inserida no bloco 2 portanto fazendo aqui uma regressão e hierárquica essa primeira tabela do bloco nem mostra a qualidade do modelo então eu tenho aqui um valor de quadrado eo valor de peito quadrado que aparece nessa favela onde dos testes em um quadrado que tem como hipótese nula que o ajuste do modelo sem
nenhum provedor é igual ao ajuste do modelo construído no bloco 1 ou seja neste caso que eu estou comparando tenho como hipótese de lula que o ajuste do modelo incluindo o hábito de fumar é igual ao ajuste do modelo sem nenhum previsor ou seja o hábito de fumar não melhorou não dou a previsão é seguir toca se numa ea hipótese alternativa seria que modelo contendo o hábito de fumar que ajuda os dados de forma diferente do modelo sem nenhum previsor nesse caso como ter menor que 0 05 eu vou considerar a hipótese alternativa ou seja
o modelo contendo o ácido de fumar como revisor eles têm um ajuste diferente o modelo tem um previsor vejo que ele oferece três linhas de resultado uma referente ao modelo que é exatamente essa comparação que eu acabei de dizer eu estou acompanhando o modelo com o hábito de fumar com o modelo tem nenhum previsor eu tenho aqui também malinha de referente ao bloco então isso é importante pra comparar ela me mostra a comparação entre o modelo atual eo modelo realizado no bloco anterior que no caso do álbum anterior era do bloco 0 era um modelo
sem previsões nenhum por isso resultado é o mesmo da linha de baixo e essa primeira linha e mostra é essa mesma análise para aquele espaço então para análises que são passo a passo essa linha é importante para comparar os diferentes espaços para comparar os diferentes modelos então nesse caso concluímos que modelos incluindo a de fumar é melhor do que o modelo é sem nenhum previsor e então vou descer para analisar as outras informações resumo do modelo que oferece que me mostra que esse valor de -2 obras light cut que é a mera semelhança log esse
valor quanto maior pior o modelo é uma vez que ele representa o quanto de informação não é explicada pelo modelo então esse valor aqui é importante quando a gente está comparando modelos para decidir qual modelo é mais adequado além disso eu tenho aqui dois ex quadrados lembrando que esses agentes quadrados tem uma interpretação semelhante ao da regressão linear mas não exatamente igual eles não são tão precisos por isso mesmo eles são chamados de seu sangue quadrados e o sss calcula automaticamente ou aí quadrado de cox israel eo r quadrado de negócio sendo que um é
enquadrado de campos neo praticamente nunca atingir o valor máximo de 1 então ele não é um valor que está no intervalo entre deve um valor máximo dele geralmente apef d 75 enquanto que o ney do crack é uma modificação ajuste desse r quadrado de cofre israel para que ele atinja o valor base de 1 então sempre o valor de r quadrado de médio alcance vai ser maior do que o valor de r quadrado de cofres não você pode postar qualquer um deles conta que você coloque qual deles você está reportando vencendo a gente tem essa
tabela do teste de rosa neves ao só que vejam que o ss não conseguiu calcular nada inclusive que tem um ponto no valor de ser isso porque o teste de osmar lembra que tal ele não é calculado por eu ter uma única variável independente ela é de econômica o que é o nosso caso eu venho aqui só uma variável independente nesse modelo que é o hábito de fumar e ele é uma variável de cotovelo é uma variável que não dão um pouquinho a gente tem a dança clássica table que mostra quantos dos casos foram classificados
de forma adequada pelo modelo e vejam que no total ele informa que é bem melhor já que o modelo tem nenhum então que essa tabela que é a mais importante da regressão logística que a tabela que fornece os coeficientes ea última vez que a tabela verbo e depois então mostra quais são as variáveis que estão na situação e faz parámetros dessas variáveis então vejam que eu tenho aqui uma linha que representa a constante do modelo aquele de zero que é correspondente ao inter sexo na regressão linear e uma linha que mostrando o hábito de fumar
ele coloque entre parênteses um pra dizer que essa foi utilizada como a categoria de referência à categoria fim para hábito de fumar eu tenho então uma coluna com o valor de o valor do coeficiente de cada um é dessa cada uma dessas variáveis tanto o hábito de fumar conta constante esses são os valores que serão inseridos então caso a gente deseja montá lá então eu tenho um erro padrão para ele com esse cliente e aqui nessa parte da tabela eu tenho a estatística de molde que seria equivalente ao tst na regressão linear a estatística de
loja que ela tem como hipótese de lula que o conheci quente é igual a zero e hipótese alternativa que o coeficiente é diferente de zero lembrando que esse coeficiente foi igual a zero e significa que aquela variável independente não vai ter um peso na equação então não vai ter um peso para o modelo então eu espero que variáveis significativa tenham o pv não quiser 05 de fato sejam tim para o hábito de fumar o que 60 00 mostrando que ele foi menor de 0 05 que o hábito de fumar de fato tem um coeficiente que
é diferente de zero ea constante ele também terminou às 07 00 cinco dos 13 que esse coeficiente acontecer também de série de 0 continuando a gente tem essa coluna do sbt que nada mais é do que a hóstia isso a razão de chances é eu tenho também o intervalo de confiança para essa razão de chan como é tradição o trecho nesse caso vejam que eu tenho aqui para o hábito de fumar maior trecho de 15,8 na verdade lembrando que aqui eu escolhi como como referência a categoria assim para fumar não é só deixo indica que
indivíduos que pertencem à categoria sim do hábito de fumar tem uma chance de pertencer à categoria e sim do desenvolvimento de câncer 15 vezes maior do que os indivíduos que pertencem à categoria não do ato de fumar então é assim que a gente interpreta razão de chances é uma comparação das chances de pertencer a uma determinada categoria da variável dependente tendo com base na sua categoria na variável e independente se o valor fosse menor do que 1 isso indicaria que pertencerá à categoria sim do ato de fumar implica em uma chance menor do que pertencer
à categoria não com relação ao desenvolvimento de câncer de pulmão e vejo que o intervalo de confiança vai de 4,8 e 51,7 então sempre tendo bem maior do que um quer dizer que de fato pertencia às categorias inglaterra de fumar em que têm um risco aumentado de desenvolver câncer de pulmão defendo um pouco a gente tem esse gráfico aqui que ele mostra como mostra o quanto ele a ser de forma gráfica de forma visual quanto ele acertou na previsão da categoria cada um desses s n na verdade representa 15 indivíduos eu sei disso porque ele
escreveu isso aqui para mim cada símbolo representa cinco casas então a questão à direita são aqueles que foram classificados como sim e os símbolos que estão esquerda são aqueles que foram classificados como dão então vejam que aqui a esquerda ele classificou de forma adequada 12345 símbolo e ou não e no lado direito ele classificou de forma adequada 123456 símbolo e dois não então podemos dizer que ele classificou de forma adequada 30 pessoas seja 5 e não consigam de forma adequada 10 pessoas enquanto te do lado do leão ele classificou de forma adequada 25 pessoas e
não consigam de forma adequada tipo de som é uma representação visual que a gente vai ver que uma variável contínua como vai a independente esperaria se o congresso em forma de o ideal é um gráfico em forma de ou seja com alta freqüência que das pontas e baixas frequências no meio e ele a representação visual daquela tabela de classificação que a gente ande um pouco mais a gente encontra resultado do bloco 2 lembrando o meu bloco único e apenas largue de fumar no bloco 2 mil incluindo estréia então bloco 2 no bloco 2 enxergando um
modelo que contém tanto o hábito de fumar quanto o stress vejam que o modelo em si ele é significativa e tem um terminal de 2005 que indica aqui esse modelo é um modelo melhor que o modelo sem nenhum previsor lembrando que esse quadrado do ônibus teste tem como hipótese de lula que o ajuste do modelo é igual ao ajuste do modelo de empreendedorismo e pós em alternativa que o ajuste do modelo é diferente do ajuste do modelo sempre victor e de sato então aqui eu posso escolher a hipótese alternativa no entanto vejam essas duas linhas
anteriores que estão aqui que voltaram não o modelo de televisor mas com o modelo do bloco anterior um valor menor desde 2005 indicando então o modelo desse bloco não é melhor que o modelo do bloco anterior então já poderia parar de analisar aqui quer dizer que o modelo do bloco anterior ele é superior e melhor aqui eu teria os valores de logo a equipe de roth e é enquadrado para esse modelo eu queria ter bem aqui o teste de roger é metal lembrando que esse teste tem como hipótese nua as categorias previstas correspondem às categorias
a observados e fotos alternativa que as categorias previstas são diferentes das categorias observadas então nesse caso eu espero te o meu desejo maior de 0 05 espero que o modelo esteja presente usado de forma adequada e eu posso escolher porta de lula de fato é o que acontece aqui então eu teria um modelo significativo e sendo um pouco mais a gente tem essa tabela de classificação ele o modelo continua acertando em 80% dos casos e na tabela mas o baixo teria que as variáveis na equação com seus respectivos coeficientes o teste de vaud molde e
oakley chan e vejam que desfaça esse modelo não é superior porque a variável stress têm um coeficiente de 00 30 e oi que é o coeficiente que não é estatisticamente diferente de zero então ele não é um coeficiente relevante preparação eu ainda teria que o gráfico para esse modelo é vejo que se formava aproximadamente em 1 e descendo um pouco tenho que me interessa aqui ele mostra se esse que nessa tabela case mais lynch e mostra caso que tenham sido discrepantes valores discrepantes não quero falar para que dois casos do caso 5768 que foram discrepantes
no entanto o resíduo padronizado desses dois casos ainda que tenha sido superior a dois é inferior a 3 o que já não seria tão preocupante mas não é o que me interessa uma vez que o modelo do bloco foi superior ao modelo do bloco 2 eu vou considerar apenas possíveis out lá eles do modelo do bloco 2 pra fazer isso eu vou voltar e na janela da regressão logística analisá a regressão logística binária e eu vou retirar o espécies aqui do bloco 2 vou manter a minha reeleição com um único bloco incluindo apenas o hábito
de fumar ou seja vou testar o efeito no meu modelo de sasha e eu poderia inclusive tirar algumas dessas opções a gente já viu tudo isso é a única coisa que vai me interessar é essa listagem de resíduos e vou ficar aqui em ok ele vai gerar toda aquela nariz e aquelas tabelas de novo mas eu vou agora me interessa é só essa última tabela que é mostrado salt lá eles vejam que quando a gente sabe é o modelo apenas quatro de fumar ele me dá uma tabela vazia ele disse que não porque nenhum outlight
encontrado então ok essa minha é essa minha regressão não apresento outline atendeu a esse pré requisito que a ausência de antilla ele treinar como descrever esses resultados eu preciso contar primeiro qual foi meu raciocínio de organização modelo depois esse modelo foi bom não foi para isso vou mostrá la as estatísticas do que quadrado que mostram que o modelo foi melhor que o modelo sem televisor nenhum e também e aí eu vou contar quais são as variáveis foram inseridos eu vou contar quais são as variáveis que foram inseridas na equação quais os seus coeficientes e qual
sua obra de brecht am eu posso ainda mostrar como ficaria a equação com as variáveis inseridas então começar aqui olhando para a tabela do que quadrado que a primeira é a primeira que começará a ser realizado uma regressão logística binária para verificar se o hábito de fumar de stress são 13 dores do desenvolvimento de câncer de pulmão a primeira frase esquerda e qual foi o objetivo da análise estatística e qual o teste usei dizer que o modelo contendo ácido de fumar ele foi significativo e vou colocar os valores que me fazem ter certeza que ele
foi significativo que no caso são que quadrado em 6 0 33% e de colocar na frente do símbolo do quadrado os graus de liberdade neste caso o grau de liberdade é um eu sei disso inclusive porque aparece na coluna df 001 e reportar 10 quadrados e vou colocar r quadrado de neide o corte dizendo que ele foi 0,11 é 417 então que o hábito de fumar foi um prejuízo significativo e trazer isso eu vou de 6 ou dar as informações do cliente o marido eu vou dizer que o ato de fumar foi um empreendedor significativo
entre parentes vão colocar o valor da hora de oeste então 15 mil oitocentos e doze e vou colocar o intervalo de confiança que para às vezes vai de fato de ver 1835 a 51 e 27 10 o estresse não foi um prejuízo significativo ao final desse estudo colocar a equação que descreve essa relação então lembrando que a equação da regressão logística ela envolve aquela constante dioy ler né que é a base do avaí time italiano é uma regressão não tão bonitinha visualmente não tão agradável mas eu poderia colocar a inflação do jeito que tais então
substituindo valor de zero pelo valor da constante o bebê era constante o bê 11 pelo coeficiente do hábito de fumar e trocando a variável independente x por hábito de fumar vamos colocar aí você poderia ter feito é muito comum que as pessoas escrevam e regressões logísticas lineares com uma tabela então isso também é comum vale dar uma olhada como as pessoas das áreas descrevem é isso até a próxima
Copyright © 2025. Made with ♥ in London by YTScribe.com