Pesquisa · Mapa mental

Desvio padrão

Em probabilidade, o desvio padrão ou desvio padrão populacional é uma medida de dispersão em torno da média populacional de uma variável aleatória. O termo possui também uma acepção específica no campo da estatística, na qual também é chamado de desvio padrão amostral e indica uma medida de dispersão dos dados em torno de média amostral. Um baixo desvio padrão indica que os pontos dos dados tendem a estar próximos da média ou do valor esperado. Um alto desvio padrão indica que os pontos dos dados estão espalhados por uma ampla gama de valores. O desvio padrão populacional ou amostral é a raiz quadrada da variância populacional ou amostral correspondente, de modo a ser uma medida de dispersão que seja um número não negativo e que use a mesma unidade de medida dos dados fornecidos.

Fonte: Wikipédia (pt)Atualizado em 29/06/2026

O desvio padrão é uma grandeza que remete ao século XIX, no contexto do desenvolvimento da estatística no Reino Unido. Enquanto o conceito de medida de dispersão foi criado por Abraham de Moivre e usado em seu livro The Doctrine of Chances em 1718, o termo desvio padrão foi pontualmente usado pela primeira vez por Karl Pearson em 1894, em substituição a termos anteriores como erro médio, utilizado por Carl Friedrich Gauss. O símbolo σ {\displaystyle \sigma } também foi utilizado pela primeira vez por Karl Pearson para representar o desvio padrão. Em 1908, William Gosset (mais conhecido sob o pseudônimo Student) definiu o desvio padrão empírico de uma amostra e mostrou que a distinção entre o desvio padrão amostral e o desvio padrão populacional é importante. Somente em 1918, Ronald Aylmer Fisher definiu a noção da variância no texto The Correlation between Relatives on the Supposition of Mendelian Inheritance.

Definição

Seja X {\displaystyle X} uma variável aleatória com média μ {\displaystyle \mu } e valor esperado E [ X ] = μ {\displaystyle E[X]=\mu } . Então, o desvio padrão de X {\displaystyle X} pela definição é a raiz quadrada da variância de X {\displaystyle X} ou a raiz quadrada do valor médio de ( X − μ ) 2 {\displaystyle (X-\mu )^{2}} σ := V a r [ X ] = E ⁡ [ ( X − μ ) 2 ] = E ⁡ [ X 2 ] + E ⁡ [ − 2 μ X ] + E ⁡ [ μ 2 ] = E ⁡ [ X 2 ] − 2 μ E ⁡ [ X ] + μ 2 = E ⁡ [ X 2 ] − 2 μ 2 + μ 2 = E ⁡ [ X 2 ] − μ 2 = E ⁡ [ X 2 ] − ( E ⁡ [ X ] ) 2 . {\displaystyle {\begin{aligned}\sigma &:={\sqrt {{\rm {Var}}[X]}}={\sqrt {\operatorname {E} [(X-\mu )^{2}]}}\\&={\sqrt {\operatorname {E} [X^{2}]+\operatorname {E} [-2\mu X]+\operatorname {E} [\mu ^{2}]}}&={\sqrt {\operatorname {E} [X^{2}]-2\mu \operatorname {E} [X]+\mu ^{2}}}\\&={\sqrt {\operatorname {E} [X^{2}]-2\mu ^{2}+\mu ^{2}}}&={\sqrt {\operatorname {E} [X^{2}]-\mu ^{2}}}\\&={\sqrt {\operatorname {E} [X^{2}]-(\operatorname {E} [X])^{2}}}.\end{aligned}}}

Desvio padrão de uma variável aleatória discreta

Quando X {\displaystyle X} é uma variável aleatória de um conjunto de dados finito x 1 , x 2 , … , x N {\displaystyle x_{1},x_{2},\dots ,x_{N}} , com cada valor tendo a mesma probabilidade 1 N {\displaystyle {\frac {1}{N}}} , o desvio padrão é: σ = 1 N ∑ i = 1 N ( x i − μ ) 2 {\displaystyle \sigma ={\sqrt {{\frac {1}{N}}\sum _{i=1}^{N}(x_{i}-\mu )^{2}}}} , em que μ {\displaystyle \mu } é a esperança da variável X {\displaystyle X} , sendo μ = E [ X ] = 1 N ∑ i = 1 N x i {\displaystyle \mu ={\rm {E}}[X]={\frac {1}{N}}\sum _{i=1}^{N}x_{i}} . Se os valores tiverem probabilidades diferentes em vez de probabilidade iguais (se x 1 {\displaystyle x_{1}} tiver probabilidade p 1 {\displaystyle p_{1}} , se x 2 {\displaystyle x_{2}} tiver probabilidade p 2 {\displaystyle p_{2}} , ... , se x N {\displaystyle x_{N}} tiver probabilidade p N {\displaystyle p_{N}} ), o desvio padrão é:

Desvio padrão de uma variável aleatória contínua

O desvio padrão de uma variável aleatória contínua X {\displaystyle X} com função densidade p ( x ) {\displaystyle p(x)} é: σ = ∫ R ( x − μ ) 2 p ( x ) d x {\displaystyle \sigma ={\sqrt {\int _{\mathbb {R} }(x-\mu )^{2}\,p(x)\,{\rm {d}}x}}} , em que μ = E [ X ] = ∫ R x p ( x ) d x {\displaystyle \mu ={\rm {E}}[X]=\int _{\mathbb {R} }x\,p(x)\,{\rm {d}}x} . No caso de uma família paramétrica de uma distribuição, o desvio padrão pode ser expresso em termos de parâmetros. Por exemplo, no caso da distribuição log–normal com parâmetros μ {\displaystyle \mu } e σ 2 {\displaystyle \sigma ^{2}} , com ln ⁡ X {\displaystyle \ln X} com distribuição normal com parâmetros μ {\displaystyle \mu } e σ 2 {\displaystyle \sigma ^{2}} , o desvio padrão é [ ( exp ⁡ ( σ 2 ) − 1 ) exp ⁡ ( 2 μ + σ 2 ) ] 1 2 {\displaystyle {\bigl [}(\exp(\sigma ^{2})-1)\exp(2\mu +\sigma ^{2}){\bigr ]}^{\frac {1}{2}}} .

Desvio padrão de distribuições de probabilidade conhecidas

O desvio padrão de uma distribuição de probabilidade univariada é igual ao desvio padrão de uma variável aleatória com a mesma distribuição. Nem todas as variáveis aleatórias possuem desvio padrão, uma vez que os valores esperados podem não existir. Por exemplo, o desvio padrão de uma variável que segue uma distribuição de Cauchy é indefinido porque seu valor esperado é indefinido.

Usos

Em probabilidade, o desvio padrão compara as variáveis ou as suas distribuições. Se X {\displaystyle X} é uma variável aleatória com desvio padrão não nulo, é possível fazê–la corresponder à variável aleatória centrada reduzida Z = X − X ¯ σ {\displaystyle Z={\frac {X-{\bar {X}}}{\sigma }}} . Duas variáveis aleatórias centradas e reduzidas Z 1 {\displaystyle Z_{1}} e Z 2 {\displaystyle Z_{2}} são fáceis de comparar, uma vez que E ( Z i ) = 0 {\displaystyle E(Z_{i})=0} e σ Z i = 1 {\displaystyle \sigma _{Z_{i}}=1} . O teorema central do limite é o limite de uma sequência de variáveis aleatórias centradas reduzidas, os coeficientes de assimetria e a curtose de uma densidade de probabilidade E [ Z 3 ] {\displaystyle E[Z^{3}]} e E [ Z 4 ] {\displaystyle E[Z^{4}]} são usados para comparar diferentes distribuições.

Para uma população finita e relativamente pequena, o cálculo do desvio padrão é puramente algébrico sem referência à probabilidade. A estatística utiliza o desvio padrão empírico definido por s = 1 n ∑ i = 1 n ( x i − x ¯ ) 2 {\displaystyle s={\sqrt {{\frac {1}{n}}\sum _{i=1}^{n}(x_{i}-{\overline {x}})^{2}}}} . Em estatística, a população é geralmente muito importante em número (não é possível conhecer todos os valores da população). Entre os recursos utilizados em amostragem e estimativa para avaliar os valores está o desvio padrão. O conceito de desvio padrão elevado não tem sentido isoladamente. Ele não indica uma dispersão forte que se torna o valor adimensional quando dividido pela média. Um desvio padrão elevado possivelmente pode indicar a existência de um outlier. Um critério consiste em rejeitar os valores que diferem da média em mais de três vezes o desvio padrão, o qual está sob a distribuição normal de uma probabilidade de exceder de 3 1000 {\displaystyle {\frac {3}{1000}}} .

Interpretação

Um grande desvio padrão indica que os pontos dos dados estão espalhados longe da média e um pequeno desvio padrão indica que os pontos dos dados estão agrupados perto da média. Por exemplo, cada uma das três populações {0, 0, 14, 14}, {0, 6, 8, 14} e {6, 6, 8, 8} possui média 7. Os desvios padrões são 7, 5 e 1, respectivamente. A terceira população tem um desvio padrão menor porque seus valores são próximos de 7. O desvio padrão tem a mesma unidade dos dados. Um exemplo, o conjunto de dados {0, 6, 8, 14} representa as idades de uma população de quatro irmãos em anos. A média é de 7 anos e o desvio padrão é de 5 anos. Outro exemplo, o conjunto de dados {1000, 1006, 1008, 1014} representa as distâncias percorridas por quatro atletas em metros. A média é de 1007 metros e o desvio padrão é de 5 metros.

Exemplos

Imagem 1: É construída a frequência da distribuição. Para um conjunto de dados finito, o desvio padrão é calculado a partir da raiz quadrada da média dos desvios entre os valores e a média dos valores dos dados elevado ao quadrado. Sejam as notas de 8 estudantes ( n = 8 {\displaystyle n=8} ) 2, 4, 4, 4, 5, 5, 7, 9. A média das notas dos 8 estudantes é: 2 + 4 + 4 + 4 + 5 + 5 + 7 + 9 8 = 5 {\displaystyle {\frac {2+4+4+4+5+5+7+9}{8}}=5} . Os desvios entre as notas e a média das notas elevados ao quadrado são: ( 2 − 5 ) 2 = ( − 3 ) 2 = 9 ( 5 − 5 ) 2 = 0 2 = 0 ( 4 − 5 ) 2 = ( − 1 ) 2 = 1 ( 5 − 5 ) 2 = 0 2 = 0 ( 4 − 5 ) 2 = ( − 1 ) 2 = 1 ( 7 − 5 ) 2 = 2 2 = 4 ( 4 − 5 ) 2 = ( − 1 ) 2 = 1 ( 9 − 5 ) 2 = 4 2 = 16. {\displaystyle {\begin{array}{lll}(2-5)^{2}=(-3)^{2}=9&&(5-5)^{2}=0^{2}=0\\(4-5)^{2}=(-1)^{2}=1&&(5-5)^{2}=0^{2}=0\\(4-5)^{2}=(-1)^{2}=1&&(7-5)^{2}=2^{2}=4\\(4-5)^{2}=(-1)^{2}=1&&(9-5)^{2}=4^{2}=16.\\\end{array}}}

Estimadores

Um estimador é uma função que aproxima–se de um parâmetro de uma população por meio de uma amostra aleatória. Dois estimadores do desvio padrão são geralmente utilizados. Os estimadores S n {\displaystyle S_{n}} ou S {\displaystyle S} e S n − 1 {\displaystyle {S_{n-1}}} ou S ′ {\displaystyle S'} são expressos em função dos valores da amostra por S n = 1 n ∑ i = 1 n ( X i − X ¯ ) 2 {\displaystyle S_{n}={\sqrt {{\frac {1}{n}}\sum _{i=1}^{n}(X_{i}-{\overline {X}})^{2}}}} e S n − 1 = 1 n − 1 ∑ i = 1 n ( X i − X ¯ ) 2 = n n − 1 ⋅ S n {\displaystyle S_{n-1}={\sqrt {{\frac {1}{n-1}}\sum _{i=1}^{n}(X_{i}-{\overline {X}})^{2}}}={\sqrt {\frac {n}{n-1}}}\cdot S_{n}} .

Propriedades dos estimadores

Duas propriedades importantes dos estimadores são a convergência e a falta de viés. Se θ ^ {\displaystyle {\hat {\theta }}} é um estimador do parâmetro θ {\displaystyle \theta } , o viés será a quantidade E [ θ ^ ] − θ {\displaystyle E[{\hat {\theta }}]-\theta } . Se o valor for diferente de zero, significa que θ ^ {\displaystyle {\hat {\theta }}} está posicionado em torno de E [ θ ^ ] {\displaystyle E[{\hat {\theta }}]} em vez de θ {\displaystyle \theta } . O estimador θ ^ {\displaystyle {\hat {\theta }}} é contaminado pelo erro. Um bom estimador não tem viés. O estimador S n − 1 {\displaystyle S_{n-1}} do desvio padrão é enviesado, mas o viés é aceitável.

Desvio padrão da média

A média e o desvio padrão de um conjunto de dados são estatísticas descritivas geralmente reportadas em conjunto. De uma certa maneira, o desvio padrão é uma medida natural de dispersão estatística se o centro dos dados for medido em relação à média. Isto porque o desvio padrão a partir da média é menor que o desvio padrão a partir de qualquer outro ponto. Sendo x 1 , … , x n {\displaystyle x_{1},\dots ,x_{n}} números reais, define–se a função σ ( r ) = 1 n − 1 ∑ i = 1 n ( x i − r ) 2 . {\displaystyle \sigma (r)={\sqrt {{\frac {1}{n-1}}\sum _{i=1}^{n}(x_{i}-r)^{2}}}.} Usando cálculo ou completamento de quadrado, é possível mostrar que σ ( r ) {\displaystyle \sigma (r)} tem um mínimo único na média r = x ¯ . {\displaystyle r={\overline {x}}.\,}

Desvio padrão de desvio padrão empírico

Em geral, é muito difícil calcular a distribuição de probabilidade de desvio padrão empírico. Porém se X n {\displaystyle X_{n}} é uma sequência de variáveis aleatórias distribuídas de acordo com a distribuição normal N ( μ , σ 2 ) {\displaystyle N(\mu ,\sigma ^{2})} , então n S n 2 σ 2 {\displaystyle n{\frac {S_{n}^{2}}{\sigma ^{2}}}} segue uma distribuição de χ 2 {\displaystyle \chi ^{2}} a n {\displaystyle n} graus de liberdade. Esta lei é o desvio padrão 2 n {\displaystyle {\sqrt {2n}}} . Portanto, o desvio padrão da distribuição das variações das variáveis normais é expresso por σ S n 2 = σ 2 2 n {\displaystyle \sigma _{S_{n}^{2}}=\sigma ^{2}{\sqrt {\frac {2}{n}}}} .

O cálculo do desvio padrão para um programa de computador pode resultar em dados inconsistentes quando não se utiliza um algoritmo adequado, como quando se utiliza o algoritmo que opera diretamente a fórmula de grandes amostras de valores entre 0 e 1. Um dos melhores algoritmos é chamado B.P. Welford, descrito por Donald Knuth em seu livro The Art of Computer Programming Vol. 2. Uma aproximação do desvio padrão da direção do vento é dada pelo algoritmo de Yamartino, que é usado em anemômetros modernos.

Métodos de cálculos rápidos

As duas fórmulas seguintes podem representar um desvio padrão repetidamente atualizado. Um conjunto de duas somas de potências s 1 {\displaystyle s_{1}} e s 2 {\displaystyle s_{2}} são calculadas sobre um conjunto de n {\displaystyle n} valores de x {\displaystyle x} denotados como x 1 , … , x n {\displaystyle x_{1},\dots ,x_{n}} , s j = ∑ k = 1 n x k j . {\displaystyle \ s_{j}=\sum _{k=1}^{n}{x_{k}^{j}}.} Dados os resultados das duas somas, os valores s 1 {\displaystyle s_{1}} , s 2 {\displaystyle s_{2}} e n {\displaystyle n} podem ser usados a qualquer hora para calcular o valor atual do desvio padrão σ = n s 2 − s 1 2 n {\displaystyle \sigma ={\frac {\sqrt {ns_{2}-s_{1}^{2}}}{n}}} , em que n {\displaystyle n} é o tamanho do conjunto de valores (também pode ser denotado como s 0 {\displaystyle s_{0}} ), como mencionado acima. Similarmente para o desvio padrão s = n s 2 − s 1 2 n ( n − 1 ) . {\displaystyle s={\sqrt {\frac {ns_{2}-s_{1}^{2}}{n(n-1)}}}.}

Cálculo ponderado

Quando os valores x i {\displaystyle x_{i}} são ponderados com pesos desiguais w i {\displaystyle w_{i}} , as somas de potências s 0 {\displaystyle s_{0}} , s 1 {\displaystyle s_{1}} e s 2 {\displaystyle s_{2}} são calculadas como s j = ∑ k = 1 n w k x k j . {\displaystyle \ s_{j}=\sum _{k=1}^{n}{w_{k}x_{k}^{j}}.\,} As equações de desvio padrão continuam inalteradas, com a diferença de que s 0 {\displaystyle s_{0}} passa a ser a soma dos pesos em vez do número de observações n {\displaystyle n} . O método incremental com erros de arredondamento reduzidos também pode ser aplicado, com alguma complexidade adicional. Uma soma de pesos deve ser computada para cada k {\displaystyle k} , de 1 até n {\displaystyle n} .

O desvio padrão é usado como medida de dispersão de um conjunto de dados. Quanto menor o desvio padrão, mais os valores são agrupados em torno da média. Seja a distribuição de notas entre os estudantes de uma sala de aula. Quanto menor o desvio padrão, mais homogêneas serão as notas. Quanto maior o desvio padrão, menos homogêneas serão as notas. Se as notas forem classificadas de 0 a 20, o desvio padrão mínimo será 0 (se todas as notas forem idênticas) e o desvio padrão máximo será 5 (se metade da classe tirar 0 e metade da classe tirar 20). Se n {\displaystyle n} estudantes tirarem 0 e n {\displaystyle n} estudantes tirarem 10, de modo que a amostra contenha n {\displaystyle n} vezes a nota 0 e n {\displaystyle n} vezes a nota 10, então a média será n × 20 n + n {\displaystyle {\frac {n\times 20}{n+n}}} ou X ¯ = 10 {\displaystyle {\bar {X}}=10} e X ¯ 2 = 100 {\displaystyle {\bar {X}}^{2}=100} . Os valores quadrados X 2 {\displaystyle X^{2}} são n × 400 {\displaystyle n\times 400} e n × 0 {\displaystyle n\times 0} . A média de X 2 {\displaystyle X^{2}} é X ¯ 2 = 200 {\displaystyle {\bar {X}}^{2}=200} . Portanto, a variância é 100 e o desvio padrão é 10.

Testes experimentais, industriais e de hipóteses

Na indústria, o desvio padrão é usado para calcular o índice de fidelidade de um aparelho de medida ou o índice de qualidade de um produto. Por exemplo, os pesos dos produtos de uma linha de produção precisam cumprir um valor exigido legalmente. Pesando uma fração dos produtos, é possível calcular o peso médio que sempre será um pouco diferente da média de longo prazo. Usando o desvio padrão, é possível encontrar um valor máximo e um valor mínimo para que o peso médio esteja dentro de uma porcentagem muito alta de tempo (igual ou maior que 99,9%). Se o desvio padrão ficar fora do intervalo, então o processo de produção precisa ser corrigido. Estes testes estatísticos são particularmente importantes quando o teste é relativamente caro.

Finanças

Em finanças, o desvio padrão da taxa de retorno de investimento é uma medida da volatilidade do investimento, ou uma medida de risco associada às flutuações de preço de um determinado ativo ou ao risco de uma carteira de ativos. O risco é um fator importante para gerenciar efetivamente uma carteira de investimentos porque ele determina a variação dos retornos sobre ativos e / ou sobre carteiras de ativos e fornece aos investidores uma base matemática para decisões de investimentos (teoria moderna do portfólio). O risco é medido pelo desvio padrão do retorno esperado sobre os preços de acordo com o modelo de precificação de ativos financeiros de Harry Markowitz. Em análise técnica dos preços das ações, o desvio padrão fornece uma estimativa quantificada da incerteza dos retornos futuros. Quanto maior o retorno esperado sobre o investimento, maior o risco. Em outras palavras, investidores devem estimar o retorno esperado e a incerteza de retornos futuros.

Tempo

Sejam as temperaturas máximas médias diárias de duas cidades, uma no continente e outra na costa. O intervalo das temperaturas máximas diárias das cidades perto da costa é menor que as temperaturas máximas diárias das cidades no continente. Portanto, enquanto cada uma das duas cidades pode ter a mesma temperatura máxima média, o desvio padrão da temperatura máxima diária da cidade da costa será muito menor que a temperatura máxima diária da cidade no continente. Em qualquer dia particular, é mais provável que a temperatura máxima real seja mais afastada da temperatura máxima média da cidade no continente que da temperatura máxima média da cidade na costa.