O desvio padrão e o erro padrão são dois conceitos importantes da estatística. Eles têm relevância direta em como você interpreta os dados de forma segura e mais próxima da realidade. São conhecidos como medidas de variabilidade que nos ajudam a entender as características de espalhamento dos dados.
No vídeo de hoje vamos falar sobre desvio padrão e erro padrão, como eles desempenham um papel fundamental na hora de entender o que os dados estão nos dizendo, e como calcular essas medidas. Para entender melhor esses conceitos, vamos começar com um exemplo. Suponha que um restaurante encomende sucos de laranja de uma cooperativa e sucos de uva de outra cooperativa.
Ambas fornecem os sucos em garrafas com capacidade de 500 ml. Então o dono do restaurante começa a receber reclamações de seus clientes, alegando que a garrafa de suco consumida tinha menos líquido que o informado. Com isso, ele decide verificar se as cooperativas estão realmente entregando a quantidade correta de suco nas garrafas.
Pede que um de seus colaboradores selecione dez unidades de cada suco e verifique o volume usando um medidor. Após a verificação, ele observa que as garrafas de ambas cooperativas tinha uma em média 500 ml de suco. Ele então supõe que o problema esteja na variabilidade das garrafas, ou seja, umas devem ter mais e outras menos suco.
Sendo assim, decide medir a variabilidade da quantidade de suco nas garrafas de cada cooperativa. Como fazer então a análise de variação da quantidade de suco nas garrafas? É nesse ponto que entra em questão o cálculo do desvio-padrão.
Pesquisando sobre como medir o grau de variação entre as amostras, o colaborador descobre que da mesma forma que existem medidas de tendência central, como a média e a mediana, existem medidas que podem ser utilizadas para detectar a variabilidade de um conjunto de dados, como a amplitude e o desvio padrão. O desvio padrão é uma medida que indica a dispersão dos dados dentro de uma mostra com relação à média. Assim, quando se calcula o desvio-padrão com a média de diferentes grupos, obtemos mais informações para avaliar e diferenciar seus comportamentos.
Assim, o colaborador decidi calcular o desvio padrão das amostras de suco de laranja e de uva. Mas como fazer isso? Para calcular o desvio padrão você precisa primeiro calcular a variância em relação à média.
Outra importante medida de dispersão com muitas aplicações na estatística e na teoria da probabilidade. Para calcular é preciso subtrair cada uma das medidas individuais pela média e elevar os resultados obtidos ao quadrado. Em seguida, você deverá somar todos os resultados e dividir pelo tamanho da amostra menos um.
Pronto, já temos a variância! Para chegar ao desvio padrão basta calcular a raiz quadrada desse resultado. Após calcular o desvio padrão das amostras de suco, o colaborador apresenta para o dono do restaurante os resultados obtidos.
Mas o que significa um esses valores de 52,7 e 6? Ao interpretar o desvio padrão é importante ter em conta que ele assume a mesma medida da unidade amostral, nesse caso mililitros. Assim, o desvio-padrão do conteúdo das garrafas de suco de laranja é de 52,7 ml e nas de uva, 6 ml.
Um desvio padrão grande significa que os valores amostrais estão bem distribuídos em torno da Média. E um desvio padrão pequeno indica que eles estão condensados próximos da média. Em poucas palavras, quanto menor o desvio padrão mais homogênea é a amostra.
Sendo assim, o dono do restaurante tem uma medida de dispersão capaz de mostrar que o volume nas garrafas de suco de laranja, varia mais do que os de suco de uva. Mas se o colaborador tivesse selecionado uma outra amostra de garrafas de suco de laranja e outra amostra de sucos de uva, a média seria a mesma? Ou a média poderia variar de acordo com a amostra selecionada?
Para resolver essa dúvida temos que analisar o erro padrão da média e vamos te mostrar como. O erro padrão é uma medida de variação de uma média amostral em relação à média da população. É uma medida que ajuda a verificar a confiabilidade da Média amostral calculada.
Para obter uma estimativa de erro padrão basta dividir o desvio padrão pela raiz quadrada do tamanho amostral. O resultado obtido também estará na mesma unidade de medida do valor amostral. Seguindo nosso exemplo com as 10 amostras de cada suco o erro padrão calculado do volume de suco de laranja nas garrafas, foi de 16,7 ml e do volume de suco de uva foi de 1,9 ml.
Através do erro padrão, pode-se estimar um intervalo de confiança para a média populacional a partir da média amostral calculada. Neste contexto, o colaborador não precisa abrir centenas de garrafas para verificar como as médias de diferentes amostras podem variar. Ele pode utilizar o erro padrão e o nível de significância.
Como um nível de significância de 5% por exemplo, podemos construir um intervalo de confiança que terá 95% de probabilidade de conter a média real de líquido presente nas garrafas de suco de laranja. Para calcular o intervalo de confiança, basta multiplicar o erro padrão pelo percentil associado ao nível de significância observado em uma distribuição normal padrão. Ou seja, que apresenta média 0 e desvio padrão igual a 1.
Para o nível de significância de 5% esse valor é de 1,96. Portanto, o dono do restaurante pode ter em conta que existe a probabilidade de 95% do intervalo de 467, 4 a 532,6 ml conter a média do volume das garrafas de suco de laranja. Da mesma forma, pode afirmar que o intervalo entre 496,3 e 503,7 ml, tem probabilidade de 95% de conter a média do suco de uva presente nas garrafas.
É muito frequente a confusão entre os conceitos de erro padrão e desvio padrão. Apesar de ambos tratarem sobre a variação da média, são conceitos bem diferentes entre si. O desvio padrão como vimos, trata de um índice de dispersão da amostra em relação à média.
Enquanto o erro padrão é uma medida que ajuda a avaliar a confiabilidade da média calculada. Agora que você já é capaz de diferenciar desvio padrão de erro padrão, não deixe de se inscrever no nosso canal. Caso tenha ficado com alguma dúvida deixa aqui nos comentários.