[Música] o [Música] olá na aula de hoje falaremos sobre a correlação de nea ea regressão linear nessa aula o nós vamos ver os principais tópicos é relacionado sas análise de regressão ea correlação do enem nós iremos calcular a o quanto uma variável tem a ver com uma outra variável isso ajuda nas tomadas de decisões então a definição de correlação lhe neta uma correlação é uma relação entre duas variáveis os dados podem ser representados por paris ordenados x e y onde x é a variável independente y é a variável dependente esses essas análises de regressão elas
são muito utilizadas é em algumas aplicações como por exemplo pediatra que tem interesse em estabelecer uma relação funcional entre o peso ea altura dos bebês o economista que busca uma função que explique o comportamento das vendas em função do preço o administrador que precisa de uma função que descreva os custos de um produto quando as quantidades variam o engenheiro que quer saber a relação entre a resistência do concreto ea razão água e cimento ou seja sempre que precisamos verificar o que acontece com duas variáveis diferentes vamos primeiro falar do diagrama de dispersão o diagrama de
dispersão é um gráfico onde nós teremos duas variáveis e neste gráfico nós iremos ver o quanto uma variável é dispersa uma da outra né se sim ou não nessas são dispersas um não esse exemplo que está na tela nós temos é uma amostra aleatória formada por 10 dos 98 alunos de uma classe de uma faculdade a e pelas notas obtidas por eles em matemática e estatística então aqui gente que analisar se as notas dos alunos em relação à matemática e estatística tem alguma relação ou seja se o aluno que vai bem em matemática vai bem
estatística ou vice versa ok então neste gráfico nós temos aqui a primeira que a variável x que são as notas de matemática é no gráfico nós iremos representar noé chukchis ea variável y que representa as notas de estatística iremos representar no eixo y do gráfico é cada pontinho no gráfico representa um para o ordenado então não primeiro aqui por exemplo o primeiro indivíduo ele tirou 5 e matemática e 6 e estatística no gráfico o ponto que representa esse para o ordenado nós temos aqui o x5 eo y é seis então o ponto que representa esse
padre ordenado é esse pontinho é como por exemplo o seguinte aqui ó de tiro oito e matemática e 9 estatística então 8 e matemática e 9 estatística nós temos aqui o ponto que representa esse para ordenada assim a gente consegue ter em todos os pontos de todas as amostras né de todos os padres ordenados neste gráfico nós podemos a e visualizar que esses pontos eles estão é próximos um do outro se a gente perceber nós não temos pontos muito dispersos eles estão quase que alinhados né então ele só olhando gráfica a gente já consegue perceber
que uma variável tem relação com a outra mas para isso nós precisamos quantificar o quanto uma relação uma variável têm relação à outra para quantificar isso nós iremos utilizar o coeficiente de correlação linear iremos utilizar esta fórmula para calcular esse coeficiente então s coeficiente ele pode ser porcentagem ou não se for em porcentagem queremos multiplicar por sempre a transformar em porcentagem e se ele foi porcentagem nós teremos aí como é com relação sempre um valor entre -100% ou 100% o sinal aí dodô coeficiente de correlação indica se as variáveis são crescentes ou decrescente em relação
à x e y então no caso aqui nós temos também as classificações né então quando nós temos o r igual a zero nós temos aí uma indicação de ausência de correlação ou seja uma variável não tem nada a ver com a outra quando nós temos uma relação menor do que 50% e nós temos uma correlação fraca maior que 50% uma correlação forte e se for igual a 100% uma correlação perfeita isso serve tanto para os valores positivos como os os negativos um exemplo das notas de matemática estatística nós iremos aqui calcular os valores é o
valor do coeficiente de correlação ou seja o r para isso nós vamos usar ea fórmula do coeficiente de correlação então nessa forma nós temos a primeira letrinha na primeira variável 1 m então qual é esse é o n é o número de para ordenados que nós temos no nosso caso nós estudamos as notas de 10 alunos então nós temos aqui 10 para os ordenados estão meu ne10 logo em seguida nós temos aqui a soma de x vezes y então nós iremos multiplicar a os valores de x e y e aí nós teremos aqui a coluna
x vezes y ea soma é o que vai na nossa forma nem os 473 logo em seguida nós temos aqui a soma de x é a soma de y queremos somar a coluna d x iremos somar a coluna y é no denominador nós temos aí a raiz o n novamente que é o 10 logo em seguida a soma de x ao quadrado então iremos fazer aqui uma coluna chamada x ao quadrado e vamos elevar ao quadrado todos os valores de x e fazer a soma deles depois nós temos a soma de x ao quadrado nesse
caso é a soma mesmo de x elevada ao quadrado total 65 ao quadrado x n é o dez vezes a soma de y ao quadrado faremos também uma coluna chamada y ao quadrado e vamos elevar os valores de y também ao quadrado e somar 6 475 é a soma do y ao quadrado depois - a soma de y ao quadrado então essa soma de y são os valores de 65 também então a soma do y elevado ao quadrado substituímos vamos aos cálculos né primeiro as multiplicações as potências depois em seguida subtrações ok ainda aqui nós
temos uma multiplicação aqui no denominador dentro da raiz numa de cada país e aí depois a gente vai fazer a divisão na divisão fazemos direto 505 dividido pela raiz de 307 mil 125 e o resultado multiplicamos por 100 pra transformar em porcentagem então a correlação não é o r de um valor de 91 1,12 por cento ou seja temos uma correlação forte calculado aí o coeficiente de correlação nós vamos ver agora a reta de regressão linear então essa reta de regressão dna é uma função do primeiro grau e essa função vai nos ajudar na tomada
de decisões então nós temos lá as notas dos alunos dos 10 alunos de matemática e estatística e com essa função do primeiro grau nós podemos fazer algumas previsões então por meio das pesquisas feitas a gente consegue fazer a uma função é um modelo matemático que explique o comportamento daquelas duas variáveis e pra calcular e se conhecer essa essa reta de regressão essa função do primeiro grau nós precisamos do coeficiente angular e do coeficiente linear tão coeficiente angular que é o a nós vamos calcular usando essa primeira forma e para calcular o coeficiente linear que a
ou b nós iremos utilizar essa segunda forma a então vamos não é mais um exemplo pra é ficar mais claro utilizando os dados abaixo dos custos de produção da empresa alfa aonde nós temos aqui a quantidade que é são as variáveis x e os custos que são as variáveis y e vamos determinar a equação do ajustamento dos dados por uma reta então pra isso nós vamos completar a tabela novamente então aqui nós temos os valores de xis aqui os valores egípcia para determinar o coeficiente angular que a ua nós precisamos novamente do n no caso
n são os números de paris ordenado estão no nosso caso nós temos as seis padres ordenados estão n é seis depois nós temos a soma de x vezes e y vamos fazer aqui a coluna de x e y e fazer a soma o que são esses 9421 depois - a soma de x vezes a soma de y então a soma de x vezes a soma de y são 75 vezes 742 no denominador nós temos o nd novo que é o 6 a soma dos izao quadrado então nós temos aqui a coluna do x ao quadrado
que são todos os valores de x e levados ao quadrado e aí a soma da 955 esse valor aqui - a soma de x ao quadrado novamente os 75 ao quadro resolvemos as multiplicações em seguida a subtrações e por último a divisão tão coeficente angular é 8,346 calculamos o a agora nós iremos calcular o bê que é o coeficiente linear na fórmula do coeficiente linear nós temos a soma de y mede vivido pelo enem que aos 6 - o a ua é esse valor vem aqui que a gente cálculo antes vezes a soma de x
dividido pelo n novamente que é o 6 então nós temos aí o valor de 19,339 portanto a equação de ajustamento da reta vai ser o y é igual a 8 obrigou 343/x mais 19,339 é vocês podem estar se perguntando porque o y tem esse chapeuzinho nesses indo em cima do y porque aqui nós estamos fazendo aproximações princípio não é um valor exato é um valor aproximado é uma estimativa por isso esse símbolo em cima do y tendo e safo essa função nós podemos por exemplo né querer saber qual é o custo estimado para 18 unidades
do artigo ou 100 unidades ou mil unidades a e dependendo da quantidade que a gente precisa saber então se eu já tenho a função y e eu quero saber qual é o valor do custo com um determinado valor de x que no caso desse exemplo é o 18 nós vamos substituir no lugar do x os 18 né e aí vamos multiplicar por último somar temos o valor de y uma estimativa em tão logo o custo para 18 unidades será aproximadamente 169 55 então isso serve pra gente fazer as estimativas dependendo da nossa função das nossas
variáveis bom então na aula de hoje nós vimos a análise de regressão e um coeficiente de correlação dna e aguardamos vocês pra próxima [Música] [Música]