Diagrama de Dispersão (Ferramenta da Qualidade): Teoria Exemplo no Excel

109.88k views2811 WordsCopy TextShare
Aprendendo Gestão
Aprenda neste vídeo o que é e como construir um diagrama de dispersão. Um exemplo é resolvido e come...
Video Transcript:
olá neste vídeo ou foto de uma importante ferramenta da qualidade que é o diagrama de dispersão primeiro nós vamos falar sobre a teoria dessa ferramenta depois a gente vai resolver um exemplo e por fim eu vou ensinar a utilizar o excel para montar um diagrama de dispersão muito bem quando a gente utiliza um diagrama de dispersão a gente tá a gente deseja na verdade analisar se existe correlação entre duas variáveis então diagrama dispersão ele é utilizado quando a gente desconfia que uma variável está correlacionada com a outra isso significa dizer que a gente acha que
as mudanças na variável y dependem das mudanças nos valores da variável x por exemplo aumentar a velocidade da máquina pode aumentar a quantidade de defeitos então se a gente em coletar os dados e consegui mostrar essa relação pode ser que a gente tem encontrado uma das razões do aumento dos defeitos por isso que eu sempre falo quando a gente acha que existe uma relação de causa e efeito entre duas variáveis a gente não pode é simplesmente ficar achando que essa correlação existe e já assume que ela é verdadeira a gente precisa coletar dados e comprovar
se ela realmente existe ou não por exemplo vamos ver essa frase aqui o nível de satisfação dos clientes impacta o número de clientes na loja parece muito óbvio isso né a gente poderia inclusive achar que isso daqui é verdade e já assume que a razão do aumento de clientes na loja é torná los satisfeitos mas e se depois ao descobrir que a satisfação dos clientes no impacto em nada no número de clientes na loja e sim era o preço dos produtos que aumentava o número de clientes na loja então eu teria gasto recursos e tempo
tentando melhorar uma variável que não aumenta o número de clientes vamos ver esse outro exemplo aqui o tempo de espera na fila em um banco afeta a nota dada pelos clientes com relação ao serviço estados então a gente vê que esses exemplos eles não são afirmações já concretas que a gente tem certeza que elas são verdadeiras a gente precisa coletar dados e analisar para tomar uma decisão final se essa relação realmente existe quando a gente estuda a correlação entre duas variáveis a gente na verdade está assumindo um modelo hipotético tem esse formato aqui ó é
como se a gente tivesse uma variável o y que depende das variações de x então a gente fala que y é uma variável dependente e x é a variável independente é a mesma coisa que falar assim ó a epsilon é uma função de x ou seja y varia como uma função de x vamos só dar uma olhada que num exemplo para ficar mais claro né por exemplo o número de defeitos por ano em uma operação de costura pode ser uma função dos meses de experiência do funcionário então a gente está achando que um funcionário com
mais experiência provavelmente produz menos peças com defeitos então a gente pode coletar dados a gente vai vendo vários funcionários e analisamos analisando quantas peças com defeitos eles produziram por ano ea gente vai dando uma olhada aqui nessa correlação ea gente queria que os meses de experiência na medida em que eles aumentam parece que a quantidade de defeitos diminui então parece realmente haver uma correlação a gente disse que meses de experiência é a variável independente que parece que é a causa da redução dos defeitos nessa operação neste vídeo a gente vai usar o seguinte exemplo o
gerente de uma agência bancária deseja determinar quais são os fatores que influenciam a satisfação de seus clientes ele acredita que o tempo de permanência na fila de espera afeta negativamente a satisfação dos clientes para testar essa correlação o gerente passou a solicitar aos clientes que ao saírem da gente registrasse uma nota geral de 0 a 10 para a sua satisfação com os serviços prestados adicionalmente cada cliente que entra no banco recebe uma ficha indicando a hora que ele entrou no banco com a qual é possível determinar qual foi o tempo de espera até lhe ser
atendido foram coletados dados de 30 clientes os quais podem ser vistos no slide a seguir aqui nós temos os dados coletados dos 30 clientes nesse nosso modelo a gente acha que o tempo de espera na fila causa a nota recebida pelo atendimento nós achamos isso é uma hipótese inclusive a gente nem sabe se realmente ela existe a gente precisa analisar esses dados antes de afirmar isso a gente está dizendo assim aqui a nossa variável independente que a nossa causa é o tempo de espera na fila a nossa variável dependente que a y é a nota
recebida pelo atendimento e vamos dar uma olhada aqui nos dados mesmo né primeiro de tudo são 30 clientes e eu coloquei aqui ó de 11 a 15 tempo nota é depois eu coloquei do 16 ao 30 tempo e nota recebida eu coloquei aqui um do lado do outro só para caber no slide quando a gente foi fazer no excel as 30 avaliações vão estar todas umas abaixo das outras a gente construiu o diagrama dispersão o primeiro passo é desenhar nos eixos a gente desenha o eixo x que nós já vimos que é o tempo de
espera que a gente acha que é a nossa causa da nota netão o tempo de espera está aqui no eixo x a onu eixo y a gente coloca a nu as notas recebidas e o que nós temos que fazer como que a gente coloca aqueles pontos neste gráfico para cada cliente a gente tem um par de valores que é o tempo que ele ficou na fila e a nota então a gente tem que encontrar o cruzamento entre os valores de tempo e nota aqui no nosso gráfico vamos lá para o cliente um olha o que
aconteceu nosso cliente 11 ficou 14 minutos na fila e deu nota 8 então a gente precisa encontrar aqui o tempo 14 anotar oito ea gente coloca um ponto aqui o cliente 2 ficou 22 minutos na fila e deu nota 7 a gente tem um outro ponto aqui o que a gente tem que fazer portanto é lotar todos os pontos dos 30 clientes o único problema é que fazer isso manualmente é muito trabalhoso imagina se a gente tivesse coletado dados de 200 clientes nem fazer isso manualmente é muito trabalhoso infelizmente a gente tem o excel para
fazer isso então a gente vai ver agora o diagrama de dispersão completo com todos os 30 dados aqui nós temos o diagrama dispersão completo e aparentemente olhando aqui os nossos pontos a gente tem uma relação mesmo entre o tempo de espera ea nota de atendimento parece que na medida em que o tempo de espera aumenta a nota recebida diminui por exemplo aqui há tempos entre cérebro e 10 minutos as notas parecem ser bem maiores do que as notas recebidas quando o cliente espera entre 25 e 35 minutos então realmente parece que existe uma correlação e
essa correlação edita ser negativa porque quanto maior o tempo de espera é menor a nota de atendimento uma coisa interessante que pode acontecer quando vocês estiverem construindo diagramas de dispersão é se depararem com altmann ers que são os pontos fora da curva então vamos dar uma olhada aqui no nosso diagrama estão vendo aqui que parece ter 11 out lá e aqui no nosso dia a grande dispersão que que é esse outline é um cliente que se comporta de maneira inesperada olha só ela esperou um tempão na fila e deu nota 10 pelo atendimento aí a
gente poderia buscar a razão disso porque provavelmente a um cliente que apesar de ter esperado bastante tempo na fila ele um problema muito complexo para ser resolvido e como ele foi resolvido ele deu nota dez para atendimento independente do tempo que ele esperou na fila então a gente tem que tomar cuidado com esses softwares porque geralmente há uma explicação especial para esse comportamento tão diferente agora a gente vai falar sobre o outro aspecto do diagrama dispersão que é a linha de tendência a gente pode pegar os nossos dados do diagrama de expressão e traçar essa
reta essa linha de tendência que é uma equação linear que mostra o comportamento dos dados esse modelo na verdade é um modelo matemático que é obtido por meio da regressão linear ele tem esse formato aac y igual a b x mas a a gente pode ver aqui ó que o excel pode ser utilizado para obter essa equação que representa os dados vamos dá só uma olhada aqui um detalhe esse coeficiente a rtp ter sessão no nosso exemplo a intercessão 8,94 22 e esse b que no nosso exemplo é menos 0,11 38 é chamado de inclinação
esse modelo aqui pode ser utilizado para fazer previsões de notas dado um tempo de espera de algum cliente ou de um conjunto de clientes outra coisa interessante é que esse é real quadrado que é o coeficiente de determinação ele é uma medida de quão distante os pontos estão da reta de regressão se os pontos estiverem muito distantes esse é o quadrado vai dar próximo de zero se os pontos estivessem perfeitamente distribuídos sobre a linha de regressão esse é o quadrado daria um tá daqui a pouco a gente vai falar mais sobre ele antes vamos falar
um pouco mais sobre a linha de tendência no nosso exemplo a equação da regressão era essa daqui a gente pode utilizar essa equação para encontrar valores de notas dado algum tempo de permanência na fila por exemplo vamos supor que eu queria saber o valor esperado da nota se um cliente ficar 15 minutos na fila o tempo na fila é o nosso x então a gente pega x igual a 15 e coloca na equação ea gente descobre que para clientes que ficam 15 minutos na fila a nota esperada é 7,24 não quer dizer que todo cliente
que fica a 15 minutos na fila vai dar essa nota pra mim alguns clientes que ficarem 15 minutos vão dar notas maiores outros vão dar notas menores mas na média o valor esperado é 7,24 se eu considerar vários clientes agora vamos falar mais um pouquinho sobre o erro ao quadrado como já disse é um valor que varia entre 0 e 1 sendo que um é quando os pontos estão perfeitamente em cima da reta de regressão quando a gente analisa se é o quadrado é comum a gente pensar que existe um valor mínimo para que o
nosso modelo seja aceitável na verdade pessoal isso é um erro comum que as pessoas cometem em achar que o é o quadrado tem que ser alto para o nosso modelo ser válido na verdade não existe um valor mínimo por é o quadrado para que nosso modelo seja aceitável isso não existe o é o quadrado só significa que se ele for muito baixo essa nossa previsão aqui está sujeita a uma alta variabilidade porque apesar de eu ter essa previsão de 7,24 eu sei que cada cliente individualmente vai dar uma nota maior ou menor do que essa
bastante dispersa se o réu quadrado fosse próximo de um significa que essa previsão aqui seria uma boa estimativa da média e as notas individuais de cada cliente não estariam muito distante dessa média é isso que o é o quadrado significa bom agora a gente vai pro céu para resolver esse mesmo exemplo então aqui nós temos os dados dos 30 clientes então a gente tem aqui os clientes o tempo ea nota ea gente vê que são os 30 valores 11 dos outros primeiro nós vamos fazer o diagrama de dispersão para isso é muito simples a gente
só precisa selecionar essa coluna ea coluna do lado só tome cuidado para selecionar sempre primeiro a coluna da variável x porque o excel vai assumir que a primeira coluna que você selecionou é a coluna do eixo x agora a gente vem inserir aqui em cima e vai ter essa opção aqui de gráfico de dispersão dentre todas essas opções a gente vai pegar essa primeira aqui que é o de dispersão básico colocando ele aqui a gente tem essa primeira versão do gráfico vou tirar esse título aumentar o gráfico aqui pra ficar mais fácil de enxergar agora
a gente vai fazer alguns ajustes primeiro vou colocar o título dos eixos clique aqui nesse mais e clique em título dos eixos aí eu vim aqui e eu posso escrever por exemplo tempo de espera seria nossa variável x e aí eu coloco aqui nota recebida que é o y a gente tem agora os eixos vamos só colocar eles aqui também em agora a gente vai colocar a linha de tendência ea equação para isso a gente clique em cima de qualquer um dos pontos com o botão esquerdo e depois clicar com o botão direito também em
cima dos pontos ea gente vai ter essa opção adicionar linha de tendência aplicando essa opção vai aparecer esse quadro de opções ea gente vai utilizar a regressão linear de sendo aqui a gente tem as duas opções de exibir a equação no gráfico e exibir o r quadrado no gráfico que é o coeficiente de determinação eu vou gastar essa equação para cabo fechar essa janela gente pode haver aqui em cima e aumentar o tamanho da fonte eu vou colocar 14 para ficar mais fácil de enxergar e aqui a gente tem o nosso gráfico pronto no diagrama
dispersão pronto eu vou fazer só agora algumas coisas mais avançadas a gente vai trabalhar no modelo de previsão agora é só colocar o gráfico pra cá vamos escrever aqui o modelo de previsão a gente vai colocar aqui coeficiente a coeficiente b a gente vai colocar aqui o r quadrado vamos colocar aqui também o tempo x e anota prevista y só reformata aqui pra gente poder enxergar melhor então a gente tem aqui todo formatado e que eu tô fazendo na verdade eu querendo extrair esses valores dessa equação e colocar aqui para construir um modelo de previsão
eu poderia simplesmente copiar que menos 0,11 38 e colocar o 8,94 dois aliás lembrando que no nosso modelo a gente isso daqui ó y é igual a b x mais a qual é o valor de b no nosso modelo - 0,88 word a r 8,94 22 eu poderia vir aqui copiar a 8,94 22 mas isso aqui é muito automatizado é diferente a gente utilizar a seguinte função aqui é igual a intercepção ou seja ele vai com essa essa função intercepção ele encontra o valor da conta do coeficiente a modelo de regressão linear a gente seleciona
primeiro os simpsons que a gente tem em inglês não quais são os y os conhecidos então a gente seleciona que todos os y sons ponto e vírgula os valores x selecionei os simpsons depois do x e ele vai encontrar pra mim o coeficiente a olha só que deu igualzinho o da nossa equação é legal fazer isso porque depois se mudarem os valores aqui nos dados é a gente colocar outros dados aqui o coeficiente atualizado automaticamente quando sente bem a mesma coisa vai utilizar a seguinte função igual a inclinação porque a inclinação da reta a gente
seleciona y ponto e vírgula selecionou os x e da enter não vai dar exatamente o mesmo valor que a gente tem aqui o erre o quadrado a gente vai usar a função r quadro de é quadrado e de novo seleciona os simpsons e os x fecha parênteses em ter a gente tem aqui o nosso r quadrado para fazer previsão vamos fazer a mesma previsão que a gente vê nos slides para 15 minutos como que eu encontro a nota esperada não é igual à de vezes x mais a é o que a gente viu no modelo
anterior lá no slide da enter a gente vê que a nota esperada é 7,24 quando o tempo for 15 minutos de espera a gente pode usar esse modelo de previsão para qualquer tempo na verdade poderia colocar aqui 20 minutos e descobrir a nota média poderia colocar aqui cinco minutos e descobrir a nota média a gente vê que esse modelo de previsão é muito útil porque ele é flexível eu posso testar pra qualquer valor de x e um y obtido toque pessoal os dados que eu utilizei nesse exemplo estão linkados aí na descrição do vídeo então
baixe e tentem fazer esse exemplo vocês mesmos ok até mais
Copyright © 2024. Made with ♥ in London by YTScribe.com