Pesquisa · Mapa mental

Coeficiente de variação

Em teoria das probabilidades e estatística, o coeficiente de variação (CV), também conhecido como desvio padrão relativo (DPR), é uma medida padronizada de dispersão de uma distribuição de probabilidade ou de uma distribuição de frequências. É frequentemente expresso como uma porcentagem, sendo definido como a razão do desvio padrão pela média . O CV ou DPR é amplamente usado em química analítica para expressar a precisão e a repetitividade de um ensaio. Também é comumente usado em campos como engenharia e física quando se fazem estudos de garantia de qualidade e avaliações de repetitividade e reprodutibilidade. O CV também é usado por economistas e investidores em modelos econômicos e na determinação da volatilidade de um valor mobiliário.

Fonte: Wikipédia (pt)Atualizado em 03/07/2026

Imagem: Senado Federal · BY-NC · Openverse

O coeficiente de variação (CV) é definido como a razão do desvio padrão σ {\displaystyle \sigma } pela média μ {\displaystyle \mu } : Ele mostra a extensão da variabilidade em relação à média da população. O coeficiente de variação deve ser computado apenas para dados medidos em uma escala de razão, já que estas são as medições que podem assumir apenas valores não negativos. O coeficiente de variação pode não ter qualquer significado para dados em uma escala intervalar. Por exemplo, a maioria das escalas de temperatura (como Celsius e Fahrenheit) são escalas intervalares que podem assumir tanto valores positivos, como valores negativos, enquanto a temperatura em Kelvin nunca pode ser menor que zero, que é a ausência completa de energia térmica. Assim, a escala Kelvin é uma escala de razão. Mesmo que o desvio padrão (DP) possa ser derivado tanto na escala Kelvin, como na escala Celsius (com ambas levando aos mesmos DPs), o CV é apenas relevante como uma medida de variabilidade relativa da escala Kelvin.

Um conjunto de dados [ 100 , 100 , 100 ] {\displaystyle [100,100,100]} tem valores constantes. Seu desvio padrão é 0 e sua média é 100, dando o seguinte coeficiente de variação: Um conjunto de dados [ 90 , 100 , 110 ] {\displaystyle [90,100,110]} tem maior variabilidade. Seu desvio padrão é 8,165 e sua média 100, dando o seguinte coeficiente de variação: Um conjunto de dados [ 1 , 5 , 6 , 8 , 10 , 40 , 65 , 88 ] {\displaystyle [1,5,6,8,10,40,65,88]} tem variabilidade maior ainda. Seu desvio padrão é 30,78 e sua média é 27,785, dando o seguinte coeficiente de variação: Considere duas classes de estudantes (classe azul e classe verde) que foram fazer um exame. Calculou-se, para cada uma, a média e o desvio padrão. Repare que o desvio padrão na segunda distribuição tem um peso muito mais significativo do que na primeira e, no entanto, este é igual em ambas. Ao determinar o coeficiente de variação, é possível saber de que forma o desvio padrão está para a média.

Comparar coeficientes de variação entre parâmetros que usam unidades relativas pode resultar em diferenças que podem não ser reais. Se compararmos o mesmo conjunto de temperaturas em Celsius e Fahrenheit (ambas unidades relativas, em que Kelvin e Rankine são seus valores absolutos associados): Celsius: [ 0 , 10 , 20 , 30 , 40 ] ; {\displaystyle [0,10,20,30,40];} Fahrenheit: [ 32 , 50 , 68 , 86 , 104 ] . {\displaystyle [32,50,68,86,104].} Os desvios padrão amostrais são 15,81 e 28,46 respectivamente. O CV do primeiro conjunto é 15 , 81 / 20 = 0 , 79 {\displaystyle 15,81/20=0,79} . Para o segundo conjunto (composto pelas mesmas temperaturas), o CV é 28 , 46 / 68 = 0 , 42 {\displaystyle 28,46/68=0,42} . Se, por exemplo, os conjuntos de dados forem leituras de temperatura de dois diferentes sensores (um sensor Celsius e um sensor Fahrenheit) e quisermos saber qualquer sensor é melhor escolhendo o que tiver a menor variância, seremos enganados se usarmos CV. O problema aqui é que dividimos por um valor relativo, em vez de um valor absoluto.

Quando apenas uma amostra dos dados de uma população está disponível, o CV da população pode ser estimado usando a razão do desvio padrão amostral s {\displaystyle s} pela média amostral x ¯ {\displaystyle {\bar {x}}} : No entanto, este estimador tende a ser muito baixo quando aplicado a um amostra de tamanho pequeno ou mediano, ou seja, é um estimador viesado. Para dados normalmente distribuídos, um estimador não viesado para uma amostra de tamanho n {\displaystyle n} é:

Dados log-normais

Em muitas aplicações, pode-se assumir que os dados são log-normalmente distribuídos (o que é evidenciado pela presença de obliquidade nos dados amostrados). Em tais casos, uma estimativa mais precisa, derivada a partir das propriedades da distribuição log-normal, é definida como: em que s l n {\displaystyle {s_{\rm {ln}}}} é o desvio padrão amostral dos dados depois de uma transformação log natural. No caso em que as medições são registradas usando qualquer outra base logarítmica b {\displaystyle b} , seu desvio padrão s b {\displaystyle s_{b}} é convertido à base e {\displaystyle e} usando s l n = s b ln ⁡ ( b ) {\displaystyle s_{\rm {ln}}=s_{b}\ln(b)} e a fórmula para c v ^ l n {\displaystyle {\widehat {c_{\rm {v}}}}_{\rm {ln}}} permanece a mesma. Esta estimativa é às vezes chamada de "CV geométrico" a fim de distinguir esta da estimativa acima. Entretanto, o "coeficiente de variação geométrico" também foi definido por Thomas B. L. Kirkwood como:

Vantagens

O coeficiente de variação é útil porque o desvio padrão dos dados deve ser sempre compreendido no contexto da média dos dados. Em contraste, o valor real do CV é independente da unidade em que a medição foi feita, então é um número adimensional. Para comparação entre conjuntos de dados com diferentes unidades ou médias muito diferentes, deve-se usar o coeficiente de variação em vez do desvio padrão.

O coeficiente de variação também é comum em campos de probabilidade aplicada como teoria da renovação, teoria das filas e teoria da confiabilidade. Nestes campos, a distribuição exponencial é frequentemente mais importante do que a distribuição normal. O desvio padrão de uma distribuição exponencial é igual a sua média, logo, seu coeficiente de variação é igual a 1. Distribuições com CV menor que 1 (tal como a distribuição de Erlang) são consideradas de variância baixa, enquanto aquelas com CV maior que 1 (tal como a distribuição hiperexponencial) são consideradas de variância alta. Algumas fórmulas nestes campos são expressas usando o coeficiente quadrático de variação, frequentemente abreviado como CQV. Em modelagem, uma variação do CV é o coeficiente de variação da raiz do erro quadrático médio, abreviado como CV(REQM). Na essência, o CV(REQM) substitui o termo do desvio padrão com a raiz do erro quadrático médio (REQM). Ainda que muitos processos naturais mostrem de fato uma correlação entre o valor da média e a quantidade de variação em seu entorno, dispositivos com sensores precisos precisam ser projetados de forma que o coeficiente de variação seja próximo de zero, isto é, produzindo um erro absoluto constante ao longo do intervalo de trabalho.

Medidas laboratoriais de coeficientes de variação intra-ensaios e inter-ensaios

Medidas de CV são frequentemente usadas como controles de qualidade para ensaios laboratoriais quantitativos. Ainda que se possa assumir que CVs intra-ensaios e inter-ensaios são calculados simplesmente fazendo a média dos valores de CV ao longo dos valores de CV para múltiplas amostras no interior de um ensaio ou fazendo a média de múltiplos estimados de CV inter-ensaios, tem sido sugerido que estas práticas são incorretas e que um processo computacional mais complexo é necessário. Tem sido notado que valores de CV não são um índice ideal da certeza de uma medição quando o número de replicados varia ao longo das amostras — neste caso, sugere-se que o erro padrão em porcentagem é superior. Se as medições não têm um ponto zero natural, então, o CV não é uma medição válida e medidas alternativas, como o coeficiente de correlação intraclasse, são recomendadas.

Medida de desigualdade econômica

O coeficiente de variação preenche as exigências para uma medida de desigualdade econômica. Se x {\displaystyle x} (com entradas x i {\displaystyle x_{i}} ) for uma lista de valores de um indicador econômico (por exemplo, riqueza), sendo x i {\displaystyle x_{i}} a riqueza do agente i {\displaystyle i} , os seguintes requisitos são atendidos: O c v {\displaystyle c_{v}} assume seu valor mínimo de zero para igualdade completa (todos os x i {\displaystyle x_{i}} são iguais). Sua desvantagem mais notável é que não é limitado acima, logo, não pode ser normalizado de modo a permanecer no interior de um intervalo fixo, como o coeficiente de Gini, que sempre está entre 0 e 1. No entanto, é matematicamente mais tratável do que o coeficiente de Gini.

Se os valores negativos e positivos pequenos da média amostral ocorrerem com frequência negligenciável, a distribuição de probabilidade do coeficiente de variação para uma amostra de tamanho n {\displaystyle n} foi mostrado por Walter A. Hendricks e Kate W. Robey como sendo: em que o símbolo ∑ ∑ ′ {\displaystyle \sideset {}{^{\prime }}\sum } indica que a somatória é apenas sobre valores pares de n − 1 − i {\displaystyle n-1-i} , isto é, se n {\displaystyle n} for ímpar, soma-se sobre os valores pares de i {\displaystyle i} e, se n {\displaystyle n} for par, soma-se apenas sobre os valores ímpares de i {\displaystyle i} . Isto é útil, por exemplo, na construção de testes de hipóteses ou intervalos de confiança. A inferência estatística para o coeficiente da variação em dados normalmente distribuídos é frequentemente baseada na aproximação qui-quadrado de McKay para o coeficiente de variação.

Alternativa

De acordo com Shuang Liu e Erich L. Lehmann, há uma alternativa ao CV também derivada da distribuição amostral do CV a fim de dar um método exato para a construção de um intervalo de confiança para o CV, baseada em uma distribuição t não central.

Momentos padronizados são razões semelhantes μ k / σ k {\displaystyle \mu _{k}/\sigma ^{k}} , em que μ k {\displaystyle \mu _{k}} é o k {\displaystyle k} -ésimo momento sobre a média, também adimensionais e invariantes à escala. A razão da variância pela média, σ 2 / μ {\displaystyle \sigma ^{2}/\mu } , é outra razão semelhante, mas não é adimensional e, por isso, também não é invariante à escala. Em processamento de sinal, particularmente em processamento de imagem, a razão recíproca μ / σ {\displaystyle \mu /\sigma } é referida como razão do sinal pelo ruído. Outras razões semelhantes são: