oi oi pessoal hoje nós vamos falar sobre teste de hipóteses nós vamos falar sobre p-valor nós vamos falar sobre o nível de significância nós vamos falar também sobre aquelas legendas que nós colocamos lá na tabela para indicar o nível de significância o que que significa que ele um asterias os dois asteriscos parece coisas simples mas são erros frequentes que eu vejo em bancas de mestrado bancas de defesa de doutorado então vale muito a pena a gente presta bastante atenção no vídeo vamos lá e bom então pessoal vamos imaginar um exemplo exemplo bem simples vamos imaginar que nós estamos medindo a altura de todos os alunos em nossa sala de aula o nosso objetivo é saber se a altura desses alunos ele é maior ou igual à média nacional então nós temos é que os nossos alunos vão imaginar que são pés alguns né a média dos nossos alunos foi de 1. 75 mm e a gente sabe que a média nacional de autor de homens né 1,72 a gente quer saber se a gente pode afirmar estatisticamente que a altura dos nossos alunos ele é maior do que a média nacional então vamos definir as nossas hipóteses né em vídeos anteriores nós já falamos que a gente sempre terá uma hipótese nula e não importa se alternativa a hipótese nula é de ausência de efeitos ele bota alternativa importe de contestação a hipótese nua que pode se manifestar de diferentes formas mas vamos lá nossa e nua né seria não há diferença entre as médias de altura dos alunos e a média nacional é o nosso hipótese alternativa vai ser que a média de altura dos alunos ela é maior do que a média nacional observe então que são teste unilateral mas ao final da apresentação nós vamos mostrar um exemplo de um teste bilateral mas não entendem o que que de fato é esse teste de portas a gente faz o nosso teste pode sente que é rejeitar ou não é hipótese nula se eu não rejeita a hipótese nula eu admito que ela é verdade que realmente não há diferença entre as médias de altura dos nossos alunos a mente nacional se eu ver jeito a gazelle que nós vamos admitir que a média de altura nossos alunos é maior do que a média nacional então vamos dar a possibilidade nós rejeitamos h0e a possibilidade de nós não rejeitarmos a 0 é essa daqui são as nossas decisões mas sempre existe aquela triste e pura realidade né mas seria uma realidade na realidade a nossa hipótese nula ela pode ser verdadeira e elas hipótese nula na pode ser falso então se a gente tem a decisão de rejeitar h0 sendo ela é verdadeira nós vamos só cometemos erros mas não chamar de erro do tipo eu não rejeito a graziele a nossa ideia é falsa gente tá cometendo um erro que a gente possa chama de erro do tipo 12 se eu rejeito a gazela e ela realmente é falsa eu não sei o teste é poderoso né ele tem poder de discernimento então nossa mais aqui de poder do teste e se nós não rejeitarmos h0e nossa casa é verdadeira então nosso teste lei confiável poxa mãe daqui de nível de confiança então nós temos dois erros o erro de tipo 1 e tipo 2 é mais perigoso que nós temos o erro do tipo um porque quando eu rejeito h0 admito que há uma diferença entre os nossos acabamento entre as nossas metodologias uma entre os nossos equipamentos nós estamos propondo uma mudança de todo o sistema produtivo mas só você pode ser verdadeiro e não há diferença entre esses tratamento essas metodologias vai esses equipamentos então vou ter a vão mudar no sistema produtivo né de uma forma desnecessária e nós vamos ter apenas prejuízos e perdas aí nesse processo então eu não tipo ela mais perigoso e todos os testes estatísticos eles são feitos para o controlar esse erro do tipo 1 então quando a gente vai fazer um teste de hipótese estabelece o nível de significância na geralmente é de cinco por céu quando eu falo que eu na minha pesquisa eu tô utilizando nível de significância de cinco porcento isso quer dizer que eu estou e preste expondo a comer o erro do tipo uma probabilidade de no máximo cinco porcento pode ser uma probabilidade menor mas no máximo cinco porcento vocês podem perguntar alcinei porque que a gente não utilize então nível de significância tem menor tipo 0. 000001 por cento né a minha probabilidade do mesmo tipo 1c bem embaixo a gente não faz isso porque o erro do tipo um ele é inversamente proporcional ao erro de tipo 2 eles não são complementares não é porque eu não tipo um assim por cento pelo tipo 2 e noventa e cinco porcento mas eles são inversamente proporcionais à medida que a gente diminui muito eu do tipo o erro do tipo 2 aumenta muito desse cinco porcento um valor que era utilizado por ele deixar né o erro do tipo um erro de tipo 2 balanceado vamos dizer assim né pois é do tipo 2 não ser muito ao então é que baseio nosso teste de portas o nosso teste de hipótese então ele é feito pra gente rejeitar ou não rejeitar h0 então a primeira coisa que nós precisamos fazer é obter uma distribuição da nossa hipótese nula né o que seria este era só isso daqui seria distribuição da nossa hipótese nula para nossa altura nacional né numa situação como essa quanto mais próximo nós tivermos aqui ó da média que é 1.
72 nós nos encontramos mais pessoas com essa altura à medida que se a gente for aumentou conforme tentando altura probabilidade de pessoas com essa altura vai diminuindo né é é a mesma forma né seu po diminuindo a altura essa probabilidade aquela também vai diminuindo então a gente consegue representar esse tipo de coisa esse tipo de comportamento pela distribuição normal esse caso específico a gente está trabalhando e mostra não conjunto limitado de indivíduos a gente tem que trabalhar com a distribuição ter né tanques tribuição te era uma generalização da distribuição normal para quando nós temos um número reduzido de indivíduos numa mostra ao passo que se nós aumentamos muito nosso tamanho amostral né nossa moça ela por cima muito a nossa população as diferenças que nós fazemos para nossa morte é muito próximos aos parâmetros populacionais nossos numa situação como essa então né do tamanho amostral muito a nossa distribuição e ela vai se convergir a nossa distribuição normal né então fiz algumas manipulações algébricas aqui a fundo gente tempo essa distribuição que a distribuição ter né considerando o nosso tamanho amostral aqui de terras indivíduos e a variância desses indivíduos nós vamos ver qualquer daqui a pouco né o que importa é que a gente conseguiu aqui chegar nessa figura o que é que nós vamos fazer nós vamos bem limitar que uma região onde nós temos cinco por cento da área né então nós vamos procurar um valor tabelado que vai delimitar essa região aqui nós vamos chamar de região de rejeição da ga0es valor tabelado também fiz algumas manipulações algébricas né de forma que eu cheguei aqui nesse 1. 749 que que você quer dizer isso quer dizer que se a média dos nossos alunos for maior do que essa messi valor tabelado a gente tá na região da rejeição da gazela observe então né que quanto maior for a nossa média amostral mas um provável isso é considerando essa distribuição normal aí que tá né o raciocínio envolvido com terno de hipóteses se e outra a gente ele quer ver quanto é um provável obtenção de uma determinada estimativa dado que a nossa hipótese nula é verdadeiro então se a nossa média amostral ela é maior do que o nosso valor tabelado ou seja se a nossa média mostra era caiu aqui na região de rejeição da hipótese nula nós podemos admitir que a média dos nossos alunos ela é maior do que a média nacional eu posso estar cometendo o erro de tipo um rejeitando a gazela após está cometendo um erro do tipo um mas qual que é a probabilidade que isso acontecesse uma probabilidade de no máximo cinco porcento não se a nossa média de alunos for maior ou igual preste atenção nesse igual ao nosso valor tabelado a gente reagir que a gazela se o nossa média de altura dos nossos alunos foi menor do que a média a ser esse valor tabelado a gente não rejeitar h0 tô nesse caso aqui a gente consegue ver né a gente pode rejeitar h0 a gente sabe que 1. 75 é maior do que 1.
749 então a gente rejeitar h0 a gente foi considerado duas caixas de cima a gente vai pior x tabelado igual com 75 e a nossa altura de alunos também 1,75 né que que eu quero dizer eu quero dizer que se altura dos alunos foram igual ao o nosso valor tabelado a gente rejeitar h0 ok então sempre presta atenção nesse igual aqui porque isso é uma coisa que muitas pessoas confundem e acabam fazendo pequenos erros na em artigos dissertações de mestrado e teses de doutorado como nós vamos falar a seguir é mas é só a gente tem uma outra forma da gente também fazer esse teste de hipótese né essa daqui aquela mesma figura anterior mas o que a gente poderia fazer então gente pode vir aqui estabelecer né a partir esse 1. 75 qual que é a área que a gente tem abaixo da culpa se nós fizermos isso nós vamos achar o valor de quatro quando 51 né eu consegui achei esse valor aqui utilizando software r então quê que é o pé valor em valor é probabilidade gente obter uma estimativa calculada né maior ou igual àquela que nós obtivemos na nossa pesquisa considerando a nossa hipótese nula como sendo verdadeiro se esse nosso pervaleo ele é muito baixo quer dizer então que é muito improvável a gente acha que ter mais resultados né é considerando a obra do acaso né ou seja realmente a diferença entre os nossos tratamentos o ar uma das nossas médias né ao passo que se caso o nosso p-value for muito grande então tem gente tempo então a não rejeitar h0 ou seja muito pouco improvável que os nossos tratamentos sejam diferentes nossas médias populacionais sejam diferentes né então a gente consegue fazer uns interpretação assim se o nosso p-valor ele é maior do que sinto por cento isso quer dizer o que se fosse a área que ela foi maior do que 5 porcento quer dizer que o nosso valor estimado ele estaria na nossa região de não rejeição de h0 né então a gente não rejeitar h0 mas se o nosso pé valor ele for menor ou igual a 5 porcento isso quer dizer que o nosso valor estimado ele vai estar dentro da região de rejeição da gaze ano então a gente rejeita a hipótese nula então assim que a gente faz a interpretação do p-valor o trânsito igual agora tá nesse caso aqui de região de rejeição da gazela mas por menor ou igual assim por cento a gente rejeitar h0 então vamos ver como que te fato nós faríamos essa análise né uma forma mais simples é nós temos aqui é autora dos nossos dez alunos é primeiro nós precisamos calcular uma medida de dispersão é a variância amostral a variância amostral nós temos essa fórmula que né hoje nós temos aqui é a soma dos quadrados dos desvios como sendo o numerador e o nosso grau de liberdade que sim ele - o conselho no denominador né de forma que nós temos então aqui a nossa média geral se eu fizer a média de todos os nossos indivíduos que a gente tem 1. 75 não nosso desvio de cada uma dá e os nossos dez anos relação essa merda a gente tem nessa coluna aqui nós pegamos esse desejo você levar o quadrado nós estamos beijinhos ao quadrado se nossa somarmos esses dentes de alto padrão uma peça soma de quadrados dizias que essa parte de cima desse estimador que foi de 0.
025 agora basta dividir isso pelo nosso número de graus de liberdade se nós temos 10 antivírus nosso número de graus de liberdade é nove então esse valor aqui dividido por 9 a gente chega a variância de 0. 0025 né após fazermos isso nós vamos então obter um valor de t calculado que acontece para facilitar né os nossos testes estatísticos gente pode recorrer a valores tabelados e esse nossos valores tabelados se considera uma média igual a zero um desvio padrão igual a um a gente precisa fazer essa conversão para os nossos dados amostrais né onde nós vamos então pegar nossa média dos alunos menos a média nacional né que é o efeito que a gente quer testar significativo ou não e para a gente vai dividir isso pelo erro padrão da média né que a raiz quadrada da variância dividido pelo tamanho amostral fazendo isso então nós vamos ter uma 1. 75 - 1.
72 dividido pela raiz quadrada de 0. 25 / 10 para os dar o valor de um ponto 8974 sem que a gente obtém o nosso valor de ter calculado e depois nós vamos obter o valor dp tabelado então vamos lembrar aqui que nossa teste o teste unicaudal né nossa pode alternativa aí pode ser maior do que a média nacional não nós vamos considerar aqui né no unicaudal valor 0. 05 nosso nível de significância nosso 19 o nosso grau de liberdade né gente tem 10 indivíduos estão nas causas liberdade é 9 o nosso valor tabelado vai ser 1.
8 33 esse valor é o valor que vai nos separar né a região a partir da qual nós vamos ter uma área de cinco porcento para nossa região de rejeição de h0 o que nós vamos fazer nós vamos verificar se o nosso valor de pegar outro lado ela é maior ou é menor do que esse nosso valor de ter tabelado para gente digitar uma h0 a sua dois têm procurado como a gente acabou de ver foi 1. 7 1. 8 97 4 né então se um laço agora que ter calculado ele for menor do que nossos valores tenta pelado tiver do lado de cá gente não rejeitar h0 se meu bagulho ter calculado e for maior ou igual é o valor de ser tabelado a gente tem jeito h0 outra forma de fazer nosso teste de hipótese que também dá sempre o mesmo resultado quer considerando que o valor que nós vamos vir aqui nós vamos ver qualquer área abaixo da curva acima do nosso guarulhos ter calculado a nossa área foi 4.
51 né a gente consegue achei esse valor aqui com auxílio doer tanto nosso pebadu nessessario o maior do que sim você é isso quer dizer que nosso tem calcular ele tá caindo na nossa região de não rejeição da zero ao passo que se o nosso p-valor foi menor ou igual assim por cento isso quer dizer que nosso ter calculado ele tá caindo aqui na nossa região de rejeição da gazela e isso para um teste unilateral né qual seria então um teste bilateral para o teste bilateral e nas hipóteses um novo a seguir então não há diferença entre essas médias e aqui nós temos a nossa porta alternativa que um teste bem legal seria a diferença entre a média dos alunos e a média nacional é só o diferença pode ser uma diferença positiva né mexe no salão pode ser maior que a nacional e pode ser também uma diferença negativa né essa média é menor do que a média nacional então no caso como esse nosso valor de ter calculado ele vai ser o mesmo que o anteriormente isso não muda né o que muda nosso valor de tabela água nós vamos vir aqui no teste de né vamos procurar um valor tabelado equivale a um nível de significância que assim por cento mas pro teste bi-caudal né nesse caso aqui o nosso valor tabelado vai ser de dois pontos 262 então aqui ó na nossa distribuição te 2. 62 ele vai indicar uma área parte da o avô ter 2,5 por cento do lado de cá e menos 2. 62 automático 2,5 sendo bate lá só manda essas duas áreas gente vai ter aqui então uma região de cinco porcento essas duas regiões são nossas regiões de rejeição da h0 eu sou o nosso valor de ter calculado km entre esses dois valores aqui nós não rejeitamos a zero se ele tiver mais para cá e o menor do que o nosso a gostei papelada gente rejeita h0t calculado podia 1.
89 né 1. 89 ele tá aqui na região de não rejeição de h0 é então como que é o nosso até hoje eu posso sim o nosso tempo calculado em modo menor que o nosso tá pelado a gente não rejeitar h0 vai cair nessa região aqui se o nosso valores ter calculado for maior ou igual nossos valores de tabelado significa então que nós vamos rejeitar h0 então a gente pode ver que nessa situação a que a gente não rejeitar h0 veja que essa informação é que essa conclusão diferente daquela que a gente obter no nosso teste unilateral então dependendo da hipótese alternativa que a gente pode escolher a gente pode ou não rejeitar a hipótese nula é aquele caso da gente dizer e não rejeitou o que quer dizer isso quer dizer que é muito importante nós definimos bem a nossa hipótese alternativa e mais do que isso sempre quando a gente utilizar um software e ele soltar para a gente a significância dos nossos coeficientes ou então né ele faz um teste qualquer a gente tem que ter certeza de qual hipótese alternativa que ele está considerando se aquele pote despeje alternativa aquela que mais está de acordo com os objetivos do nosso trabalho os objetivos de nossa pesquisa ok e como que seria então obter o p-valor né o pedalou nós vamos considerar aqui então o nosso valor tabelado que é um ponto 8974 vamos ver a região a partir esse valor né que foi uma região de 4. 51 por cento é o mesmo valor que a gente achou lá anteriormente mas qualquer diferença nós vamos considerar o valor que a gente tem acima de si a 39 e a região que a gente tem abaixo de - 1.
89 então 4. 51 mais quatro quando 51 ele vai dar o nosso pelo valor que foi de 9. 02 e super valor for maior que cinco porcento a gente não rejeitar h0 isso quer dizer que o nosso valor de ter calculado iria cair aqui na nossa região que não rejeição da gazela pronto lados o nosso ter valor e com menor do que 5 porcento aí sim a gente rejeita h0 vamos ver aqui no outro exemplo onde nós temos a significância de alguns coeficientes de regressão né vamos concentrar que a pena coeficiente angular da reta onde a gente tem que ir um asterisco dois asteristicos aqui o inss né esse asteriscos esse cms daquilo indica a significância que cada um desses pacientes têm então se nós fossemos colocar uma legenda e segura nós poderíamos colocar que dois asteriscos é significativo o nemo de um por cento um asterisco ao nível de cinco porcento do inss ele não significativo pelo teste t respectivamente e para discutir esses resultados nós poderíamos falar que esse por ciência aquele foi significativo e na frente coloquei menor ou igual a zero ponto 05 então pra gente discutir esse coeficiente espécie quando você descer a gente pode falar que eu significativo assim por cento e colocar aqui ó para ele o p menor ou igual a zero ponto 05 que a gente sabe que bala louco ele foi menor ou igual a zero ponto 05 ok quando a gente for discutir aqui esse coisinho que a gente pode falar aqui ele foi significativo colocar entre parentes per menor ou igual a zero ponto zero um dica não foi significativa ele não por cento seguinte câncer depois falar do ponto de vista prático o que que significa o clube ms né a gente coloca que eu consciente angular da reta foi não significativo abre parênteses bem maior do que 0.