Distribuição normal
Em probabilidade e estatística, a distribuição normal é uma das distribuições de probabilidade mais utilizadas para modelar fenômenos naturais. Isso se deve ao fato de que um grande número de fenômenos naturais apresenta sua distribuição de probabilidade tão proximamente normal, que a ela pode ser com sucesso referida, e, portanto, com adequado acerto por ela representada como se normal fosse. A distribuição normal é ligada a vários conceitos matemáticos como movimento browniano, ruído branco, entre outros. A distribuição normal também é chamada distribuição gaussiana, distribuição de Gauss ou distribuição de Laplace–Gauss, em referência aos matemáticos, físicos e astrônomos francês Pierre–Simon Laplace e alemão Carl Friedrich Gauss.
Uma das primeiras aparições da distribuição normal ocorreu em 1733 com Abraham de Moivre com o aprofundamento do estudo de fatorial n ! {\displaystyle n!} quando considerado um jogo de cara ou coroa. Em 1756, ele publicou A Doutrina das Chances, em que a distribuição normal aparece como o limite de uma distribuição binomial, o que originaria o teorema central do limite. Em 1777, Pierre-Simon Laplace retomou o trabalho e obteve uma boa aproximação do erro entre a distribuição normal e a distribuição binomial em razão da função gama de Euler. Em seu livro publicado em 1781, Laplace publica uma primeira tabela da distribuição normal. Em 1809, Carl Friedrich Gauss assimila os erros da observação na astronomia à curva, erros da densidade da distribuição normal. A distribuição normal é totalmente definida quando o primeiro teorema central do limite (chamado então teorema de Laplace) é elaborado por Laplace em 1821. O nome normal é dado por Henri Poincaré no fim do século XIX. A distribuição normal também pode ser chamada de distribuição de Gauss ou distribuição de Laplace–Gauss, de acordo com sua autoria. A denominação segunda distribuição de Laplace também é usada ocasionalmente.
Existe uma infinidade de distribuições normais, cada uma com sua própria média e desvio padrão. A distribuição normal com média 0 e desvio padrão 1 é chamada de distribuição normal padrão. Ela é uma distribuição de probabilidade (uma medida N {\displaystyle N} , de massa total unitária) unidimensional (com suporte real R {\displaystyle \scriptstyle \mathbb {R} } ). É uma distribuição absolutamente contínua (a medida é absolutamente contínua em relação à medida de Lebesgue). Em outras palavras, existe uma densidade de probabilidade muitas vezes denotada como φ {\displaystyle \varphi } para a distribuição normal padrão tal que: N ( d x ) = φ ( x ) d x {\displaystyle N(dx)=\varphi (x)dx} . É generalizada para a distribuição normal multivariada. A distribuição normal padrão também pode ser chamada de distribuição normal centrada e reduzida. A escala horizontal do gráfico da distribuição normal padrão corresponde ao escore-z que é uma medida de posição que indica o número de desvios padrão em que um valor se encontra a partir da média. Podemos transformar um valor x {\displaystyle x} em escore-z usando a fórmula:
Definição pela função densidade
A densidade da distribuição normal padrão é dada pela função φ : R → R + {\displaystyle \varphi :\mathbb {R} \to \mathbb {R} _{+}} definida por φ ( t ) = 1 2 π e − 1 2 t 2 {\displaystyle \varphi (t)={\frac {1}{\sqrt {2\;\pi }}}\;\;\mathrm {e} ^{-{\frac {1}{2}}t^{2}}} , para todo t ∈ R {\displaystyle t\in \mathbb {R} } . Esta distribuição é chamada centrada porque o valor do seu momento de ordem 1 (esperança) é 0 e reduzida porque o valor do seu momento de ordem 2 (variância) é 1, assim como o seu desvio padrão. O gráfico da densidade φ {\displaystyle \varphi } é chamado função gaussiana, curva de Gauss ou curva em forma de sino. A distribuição normal é denotada pela letra N {\displaystyle N} . Uma variável aleatória X {\displaystyle X} que segue uma distribuição normal padrão é denotada como X ∼ N ( 0 , 1 ) {\displaystyle X\sim N(0,1)} .
Definição pela função distribuição
Historicamente a distribuição normal aparece como a distribuição limite no teorema central do limite, usando a função de distribuição cumulativa. A distribuição normal é a distribuição de probabilidade, em que a função de distribuição é dada por Φ : R → R + {\displaystyle \Phi :\mathbb {R} \to \mathbb {R} _{+}} , definida por Φ ( x ) = 1 2 π ∫ − ∞ x e − 1 2 t 2 d t {\displaystyle \Phi (x)={\frac {1}{\sqrt {2\;\pi }}}\int _{-\infty }^{x}\mathrm {e} ^{-{\frac {1}{2}}t^{2}}\mathrm {d} t} , para todo x ∈ R {\displaystyle x\in \mathbb {R} } . Ela fornece a probabilidade de uma variável aleatória de distribuição normal pertencer a um intervalo fechado [ a , b ] {\displaystyle [a,b]} , P ( X ∈ [ a , b ] ) = Φ ( b ) − Φ ( a ) {\displaystyle \mathbb {P} (X\in [a,b])=\Phi (b)-\Phi (a)} .
Definição pela função característica
A caracterização da distribuição normal pela função característica tem o objetivo de demonstrar certas propriedades como a estabilidade da soma e o teorema central do limite. A função característica de distribuição normal padrão é dada por ϕ : R → R + {\displaystyle \phi :\mathbb {R} \to \mathbb {R} _{+}} e definida por ϕ ( t ) = e − t 2 2 {\displaystyle \phi (t)={\rm {e}}^{-{\frac {t^{2}}{2}}}} , para todo t ∈ R {\displaystyle t\in \mathbb {R} } . Em grego existem duas variações para a letra phi minúscula. O ϕ {\displaystyle \phi } utilizado agora é diferente do φ {\displaystyle \varphi } utilizado no início do texto. Isto é, são duas notações diferentes para phi minúsculo.
Definição pela função geradora de momentos
Uma outra maneira de definir a distribuição normal padrão é pela utilização da função geradora de momentos. É a distribuição de probabilidade, em que a função geradora de momentos é dada por M : R → R + {\displaystyle M:\mathbb {R} \to \mathbb {R} _{+}} e definida por M ( t ) = e t 2 2 {\displaystyle M(t)={\rm {e}}^{\frac {t^{2}}{2}}} , para todo t ∈ R {\displaystyle t\in \mathbb {R} } . O objetivo é calcular os momentos da distribuição normal. Seguem algumas propriedades sobre a função geradora de momentos:
Definição
Mais usualmente que a distribuição normal padrão, a distribuição normal não centrada e não reduzida é a distribuição de probabilidade absolutamente contínua, na qual um dos quatros pontos seguintes podem ser verificados. Para σ = 0 {\displaystyle \sigma =0} , as funções de densidade e de distribuição não são definidas. Este caso corresponde a um comportamento degenerado da distribuição normal, às vezes chamada de distribuição normal imprópria. Isto é a medida de Dirac no ponto μ {\displaystyle \mu } . O valor μ {\displaystyle \mu } é a média da distribuição, σ {\displaystyle \sigma } é o desvio padrão e σ 2 {\displaystyle \sigma ^{2}} é a variância. Esta distribuição é denotada por N {\displaystyle N} , uma variável aleatória X {\displaystyle X} que segue a distribuição normal com a média μ {\displaystyle \mu } e variância σ 2 {\displaystyle \sigma ^{2}} é denotada por X ∼ N ( μ , σ 2 ) {\displaystyle X\sim N(\mu ,\sigma ^{2})} .
De acordo com a seção anterior, é útil saber a função de distribuição Φ {\displaystyle \Phi } para aplicações numéricas. Então, tabelas de valores foram calculadas para a função de distribuição e também para o inverso da função de distribuição, que permitem obter os quantis e os intervalos de confiança para um limiar de tolerância fixo. Os valores da primeira linha fornecem a primeira parte da variável. Os valores da primeira coluna fornecem a segunda parte da variável. Então, a célula na segunda linha e na terceira coluna fornece Φ ( 0 , 12 ) = 0 , 54776 {\displaystyle \Phi (0,12)=0,54776} . Os valores da primeira linha fornecem a primeira parte da variável. Os valores da primeira coluna fornecem a segunda parte da variável. Então, a célula na segunda linha e na terceira coluna fornece q 0 , 62 = Φ − 1 ( 0 , 62 ) = 0 , 3055 {\displaystyle q_{0,62}=\Phi ^{-1}(0,62)=0,3055} . Esta tabela fornece os valores dos quantis para os valores maiores de p {\displaystyle p} .
Outras caracterizações
Em adição à densidade de probabilidade, à função de distribuição, à função característica e à função geradora de momentos, existem outras caracterizações da distribuição normal.
Momentos
O momento de ordem 1 é chamado média ( μ {\displaystyle \mu } ) e é dado como parâmetro da distribuição normal N ( μ , σ 2 ) {\displaystyle N(\mu ,\sigma ^{2})} . O segundo parâmetro é o desvio padrão ( σ {\displaystyle \sigma } ). Isto é, a raiz quadrada da variância σ 2 {\displaystyle \sigma ^{2}} , que é, por definição, a média dos quadrados dos desvios da média, ou segundo momento central. Os momentos centrais da distribuição normal são dados por { μ 2 k = E [ ( X − μ ) 2 k ] = ( 2 k ) ! 2 k k ! σ 2 k μ 2 k + 1 = E [ ( X − μ ) 2 k + 1 ] = 0 {\displaystyle {\begin{cases}\mu _{2k}=\mathbb {E} [(X-\mu )^{2k}]={\frac {(2\,k)!}{2^{k}k!}}\sigma ^{2k}\\\mu _{2k+1}=\mathbb {E} [(X-\mu )^{2k+1}]=0\end{cases}}} ,
Teoremas da convergência
A primeira versão do teorema central do limite (teorema de Moivre–Laplace) foi estabelecido para as variáveis aleatórias da distribuição de Bernoulli. De maneira mais geral, se X 1 , X 2 , … , X n {\displaystyle X_{1},X_{2},\dots ,X_{n}} são variáveis aleatórias independentes e igualmente distribuídas com variância finita e se a soma é denotada como S n = X 1 + X 2 + ⋯ + X n {\displaystyle S_{n}=X_{1}+X_{2}+\dots +X_{n}} , então lim n → + ∞ P ( a ≤ S n − E [ S n ] V a r ( S n ) ≤ b ) = ∫ a b φ ( x ) d x {\displaystyle \lim _{n\rightarrow +\infty }\mathbb {P} \left(a\leq {\frac {S_{n}-\mathbb {E} [S_{n}]}{\sqrt {Var(S_{n})}}}\leq b\right)=\int _{a}^{b}\varphi (x)\mathrm {d} x} , para todo a < b {\displaystyle a<b} , em que φ {\displaystyle \varphi } é a densidade de probabilidade da distribuição normal padrão.
Estabilidade e família normal
A distribuição normal é estável pela adição. Isto é, a soma de duas variáveis aleatórias independentes com distribuição normal é em si uma variável aleatória com distribuição normal. Mais explicitamente, se X 1 ∼ N ( μ 1 , σ 1 2 ) {\displaystyle X_{1}\sim N(\mu _{1},\sigma _{1}^{2})} , X 2 ∼ N ( μ 2 , σ 2 2 ) {\displaystyle X_{2}\sim N(\mu _{2},\sigma _{2}^{2})} e X 1 {\displaystyle X_{1}} e X 2 {\displaystyle X_{2}} são independentes, então a variável aleatória X 1 + X 2 {\displaystyle X_{1}+X_{2}} segue a distribuição normal N ( μ 1 + μ 2 , σ 1 2 + σ 2 2 ) {\displaystyle N(\mu _{1}+\mu _{2},\sigma _{1}^{2}+\sigma _{2}^{2})} . Esta propriedade é generalizada por n {\displaystyle n} variáveis, isto é, se para todo i ∈ { 1 , 2 , … , n } {\displaystyle i\in \{1,2,\dots ,n\}} as variáveis aleatórias X i {\displaystyle X_{i}} seguem a distribuição normal N ( μ i , σ i 2 ) {\displaystyle N(\mu _{i},\sigma _{i}^{2})} e são independentes, então a soma X 1 + X 2 + ⋯ + X n {\displaystyle X_{1}+X_{2}+\dots +X_{n}} segue a distribuição normal N ( μ 1 + μ 2 + ⋯ + μ n , σ 1 2 + σ 2 2 + ⋯ + σ n 2 ) {\displaystyle N(\mu _{1}+\mu _{2}+\dots +\mu _{n},\sigma _{1}^{2}+\sigma _{2}^{2}+\dots +\sigma _{n}^{2})} .
Entropia e quantidade de informação
A entropia de Shannon de uma distribuição de probabilidade absolutamente contínua de densidade dada por f {\displaystyle f} para medir a quantidade de informação é definida por H = − ∫ − ∞ + ∞ f ( x ) ln f ( x ) d x . {\displaystyle H=-\int _{-\infty }^{+\infty }f(x)\ln f(x)\mathrm {d} x.} No conjuntos das distribuições absolutamente contínuas de variância σ 2 {\displaystyle \sigma ^{2}} fixa, as distribuições normais N ( ⋅ , σ 2 ) {\displaystyle N(\cdot ,\sigma ^{2})} fornece entropia máxima. A entropia para uma distribuição normal é dada por H = ln ( σ 2 π e ) {\displaystyle H=\ln \left(\sigma {\sqrt {2\pi e}}\right)} . Há também uma ligação entre a convergência de sequências de distribuições de probabilidade com distribuição normal e o aumento da entropia, tornando–se uma ferramenta importante na teoria da informação.
Aproximação da função de distribuição
Não existe expressão analítica para a função de distribuição Φ {\displaystyle \Phi } da distribuição normal padrão. Isto é, não existe uma fórmula simples entre a função de distribuição e as funções convencionais como as funções polinomiais, exponenciais, logarítmicas, trigonométricas, entre outras. Entretanto, a função de distribuição é aplicada a vários resultados e é importante compreende–la melhor. Diferentes notações como séries ou frações contínuas generalizadas são possíveis. Para 0 < x ≪ 1 {\displaystyle 0<x\ll 1} , a função de distribuição da distribuição normal padrão é escrita na forma Φ ( x ) = 1 2 + 1 2 π ∑ n = 0 ∞ ( − 1 ) n n ! 2 n ( 2 n + 1 ) x 2 n + 1 = 1 2 + 1 2 π ( x − x 3 6 + x 5 40 + … ) {\displaystyle \Phi (x)={\frac {1}{2}}+{\frac {1}{\sqrt {2\pi }}}\sum _{n=0}^{\infty }{\frac {(-1)^{n}}{n!2^{n}(2n+1)}}x^{2n+1}={\frac {1}{2}}+{\frac {1}{\sqrt {2\pi }}}\left(x-{\frac {x^{3}}{6}}+{\frac {x^{5}}{40}}+\dots \right)} ou na forma Φ ( x ) = 1 2 + φ ( x ) ∑ n = 0 ∞ 1 1 ⋅ 3 ⋅ 5 … ( 2 n + 1 ) x 2 n + 1 = 1 2 + φ ( x ) ( x + x 3 3 + x 5 15 + … ) . {\displaystyle \Phi (x)={\frac {1}{2}}+\varphi (x)\sum _{n=0}^{\infty }{\frac {1}{1\cdot 3\cdot 5\dots (2n+1)}}x^{2n+1}={\frac {1}{2}}+\varphi (x)\left(x+{\frac {x^{3}}{3}}+{\frac {x^{5}}{15}}+\dots \right).}
Com papel central entre as distribuições de probabilidade e suas aplicações, a distribuição normal tem muitas ligações com outras distribuições. Certas distribuições ainda são formadas a partir da distribuição normal para melhor corresponder às suas aplicações.
Distribuições usuais
Nota–se que a distribuição gaussiana inversa e a distribuição gaussiana inversa generalizada não têm ligação com uma fórmula simplesmente criada a partir de variáveis da distribuição normal, mas tem relação com o movimento browniano.
Distribuições normais generalizadas
Várias generalizações da distribuição normal foram introduzidas para mudar sua forma, sua assimetria, seu suporte, entre outros. Um novo parâmetro de forma β > 0 {\displaystyle \beta >0} foi introduzido à distribuição normal para obter uma distribuição normal generalizada. Esta família de distribuição contém a distribuição normal como é o caso para β = 2 {\displaystyle \beta =2} e também para a distribuição de Laplace para β = 1 {\displaystyle \beta =1} . A nova densidade de probabilidade é dada por f ( x ) = β 2 α Γ ( 1 / β ) e − ( | x − μ | σ ) β . {\displaystyle f(x)={\frac {\beta }{2\alpha \Gamma (1/\beta )}}\;\;{\rm {e}}^{-{\bigl (}{\frac {|x-\mu |}{\sigma }}{\bigr )}^{\beta }}.}
Construções a partir da distribuição normal
Uma mistura gaussiana é uma distribuição de probabilidade, cuja densidade é definida por uma combinação linear de duas densidades de distribuições normais. Se nota–se f 1 {\displaystyle f_{1}} a densidade de N ( μ 1 , σ 1 2 ) {\displaystyle N(\mu _{1},\sigma _{1}^{2})} e f 2 {\displaystyle f_{2}} a densidade de N ( μ 2 , σ 2 2 ) {\displaystyle N(\mu _{2},\sigma _{2}^{2})} , então λ f 1 + ( 1 − λ ) f 2 {\displaystyle \lambda f_{1}+(1-\lambda )f_{2}} é a densidade de uma distribuição de probabilidade chamada de mistura gaussiana. Os modos das duas distribuições normais são dados por μ 1 {\displaystyle \mu _{1}} e μ 2 {\displaystyle \mu _{2}} , então a combinação gaussiana é uma distribuição bimodal. Se os máximos locais são valores próximos e não iguais aos valores μ 1 {\displaystyle \mu _{1}} e μ 2 {\displaystyle \mu _{2}} .
Historicamente a distribuição normal é introduzida em estudos sobre os corpos celestes ou em jogos de azar. Ela é estudada, generalizada matematicamente e usada em muitas aplicações em matemática, em outras ciências exatas, em outras ciências mais aplicadas ou em ciências humanas e sociais. Segue uma seleção de exemplos.
Balística
No século XIX, para melhorar a precisão da artilharia de fogo muitos tiros de canhão eram disparados. Observou–se que a direção e o alcance eram semelhantes às distribuições normais. Esta compreensão permitiu melhor treinar os servos para ajustar os disparos. Esta distribuição normal proveniente de diferentes fatores como as condições climáticas e também o uso do equipamento militar. A dispersão dos pontos de impacto e, portanto, da distribuição, fornece informações sobre o estado do material e sobre o possível número de disparos anormais. O ajuste à distribuição normal é feito pelo teste de Lhoste em uma série de 200 tiros. O matemático Jules Haag aplica o método para 2 680 tiros de diferentes escopos e diferentes direções.
Quociente de inteligência
O quociente de inteligência (QI) visa dar um valor numérico à inteligência humana. Em 1939, David Wechsler deu uma definição estatística ao quociente de inteligência. 100 pontos são dados à média dos valores obtidos de uma população com idade similar e 15 pontos são deduzidos de um intervalo igual ao desvio padrão obtidos a partir dos valores da população testada. Por esta razão, a curva de distribuição do QI é modelada a curva em forma de sino da distribuição normal padrão em 100 e com desvio padrão 15, N ( 100 , 15 2 ) {\displaystyle N(100,15^{2})} . Entretanto, este modelo é questionado por alguns cientistas. Em efeito, os resultados dos testes são dependentes das classes sociais da população, a população deixaria de ser homogênea. Isto é, a propriedade de independência dos indivíduos não seria verificada. Então, o QI seria apenas uma medida de aproximação da inteligência humana com erro desconhecido.
Anatomia humana
Uma característica observável e mensurável de uma população de indivíduos comparáveis muitas vezes tem uma frequência modelada por uma distribuição normal. É o exemplo da altura humana em uma determinada idade (separados entre homens e mulheres) ou o tamanho do bico de uma população de aves como os pássaros estudados por Charles Darwin. Mais precisamente, uma característica mensurável de uma população pode ser modelada por uma distribuição normal se ela for codificada geneticamente por vários alelos ou por vários locus ou se a característica depende de um grande número de efeitos do meio ambiente. As curvas de crescimento apresentadas pela Organização Mundial da Saúde (OMS), presentes em cadernetas de saúde, por exemplo, são derivadas de modelagem pela distribuição normal. Por meio de um estudo detalhado dos percentis medidos em uma população com idade fixa e por meio de testes estatísticos de adequação, as distribuições dos pesos e das alturas por faixa etária foram modeladas por distribuições de probabilidade. Estas distribuições incluem a distribuição normal, a distribuição normal de Box–Cox (generalização da distribuição normal), a distribuição Student de Box–Cox (generalização da distribuição normal de Box–Cox) e ainda a distribuição exponencial com potência Box–Cox. Graficamente, para cada idade ou para cada eixo vertical, a mediana m {\displaystyle m} é representada (linha central) e os dois valores de m + σ {\displaystyle m+\sigma } e m − σ {\displaystyle m-\sigma } , em que σ {\displaystyle \sigma } é o desvio padrão, dão as curvas e, assim, representam a evolução de um intervalo de confiança.
Sinais e medições físicas
Quando um sinal é transmitido, ocorre uma perda de informação devido aos meios de transmissão ou à decodificação do sinal. Quando uma medição física é efetuada, uma incerteza no resultado pode ser proveniente de uma imprecisão do aparelho de medida ou de uma incapacidade de obter o valor teórico. Um método para modelar tais fenômenos é considerar um modelo determinista (não aleatório) para o sinal ou para a medição e adicionar ou multiplicar um termo aleatório que represente a perturbação aleatória, às vezes chamadas de erro ou de ruído. Em muitos casos, este erro é assumido como distribuição normal ou como distribuição log–normal em casos de multiplicação. É o caso, por exemplo, da transmissão de um sinal através de um cabo elétrico. Quando o processo depende do tempo, o sinal ou a medição é modelada por um ruído branco. Então, a suavização de imagem com um filtro gaussiano é utilizada.
Economia
Os preços de algumas commodities são determinadas por uma bolsa de valores, como é o caso do trigo, do algodão e do ouro. No tempo t {\displaystyle t} , o preço Z ( t ) {\displaystyle Z(t)} evolui até o momento t + T {\displaystyle t+T} , aumentando Z ( t + T ) − Z ( t ) {\displaystyle Z(t+T)-Z(t)} . Em 1900, Louis Bachelier postulou que este aumento segue uma distribuição normal de média nula, cuja variância depende de t {\displaystyle t} em T {\displaystyle T} . Entretanto, este modelo satisfaz apenas ao mercado financeiro. Então, outros matemáticos propuseram melhorar este modelo, assumindo que é o aumento ln Z ( t + T ) − ln Z ( t ) {\displaystyle \ln Z(t+T)-\ln Z(t)} que segue a distribuição normal, o que quer dizer que o aumento dos preços segue uma distribuição log–normal. Esta hipótese é a base do modelo e da fórmula de Black–Scholes utilizado massivamente pela indústria financeira.
Matemática
A distribuição normal é utilizada em muitas áreas da matemática. O ruído branco gaussiano é um processo estocástico de tal modo que em qualquer ponto o processo é uma variável aleatória com distribuição normal independente do processo de outros pontos. O movimento browniano ( B ( t ) , t ≥ 0 ) {\displaystyle (B(t),t\geq 0)} é um processo estocástico, cujos aumentos são independentes, estacionários e com distribuição normal. Incluindo um valor t > 0 {\displaystyle t>0} fixo, a variável aleatória B ( t ) {\displaystyle B(t)} segue a distribuição normal N ( 0 , t ) {\displaystyle N(0,t)} . Este processo aleatório tem muitas aplicações. Ele faz uma ligação entre a equação do calor e a distribuição normal. Quando a extremidade de uma haste de metal é aquecida em um curto espaço de tempo, o calor se propaga ao longo da barra na forma de uma curva em forma de sino.
Critérios de normalidade
É importante saber se os valores são distribuídos de acordo com a distribuição normal. Quatro critérios podem ser estudados antes de realizar um teste estatístico. O primeiro critério (o critério mais simples) consiste em traçar um diagrama em barras da distribuição e verificar visualmente se o diagrama é em forma de sino. Entretanto, este critério subjetivo permite eliminar uma parte das distribuições quando consideradas não gaussianas. De maneira mais precisa, a utilização das faixas de normalidade permite comparar com as frequências observadas facilmente calculáveis. O critério consiste em utilizar as faixas de normalidade ou os intervalos de confiança. Quando os valores são normalmente distribuídos, 68% deles estão no intervalo [ x ¯ − σ ; x ¯ + σ ] {\displaystyle [{\overline {x}}-\sigma \,;\,{\overline {x}}+\sigma ]} , 95% deles estão no intervalo [ x ¯ − 2 σ ; x ¯ + 2 σ ] {\displaystyle [{\overline {x}}-2\,\sigma \,;\,{\overline {x}}+2\,\sigma ]} e 99,7% deles estão no intervalo [ x ¯ − 3 σ ; x ¯ + 3 σ ] {\displaystyle [{\overline {x}}-3\,\sigma \,;\,{\overline {x}}+3\,\sigma ]} .
Testes de normalidade
Com seu papel no teorema central do limite, a distribuição normal é encontrada em muitos dos testes estatísticos chamados gaussianos ou assintoticamente gaussianos. O pressuposto de normalidade é feito sobre uma distribuição a priori em um teste de aderência para indicar que esta distribuição segue aproximadamente uma distribuição normal. Existem vários testes de normalidade.
Estimativa dos parâmetros
Quando um fenômeno aleatório é observado e considera–se que ele pode ser modelado por uma distribuição normal, uma das perguntas que podem ser feitas é quanto valem os parâmetros μ {\displaystyle \mu } e σ {\displaystyle \sigma } da distribuição normal N ( μ , σ 2 ) {\displaystyle N(\mu ,\sigma ^{2})} ? Então, é realizada uma estimativa. As observações coletadas durante a observação do fenômenos são notadas para as variáveis aleatórias X 1 , X 2 , … , X n {\displaystyle X_{1},X_{2},\dots ,X_{n}} . As notações da média aritmética e da média quadrada também são úteis: S ¯ n = 1 n ( X 1 + X 2 + ⋯ + X n ) {\displaystyle {\bar {S}}_{n}={\frac {1}{n}}(X_{1}+X_{2}+\dots +X_{n})} e T n − 1 2 = 1 n − 1 ∑ k = 1 n ( X k − S ¯ n ) 2 {\displaystyle T_{n-1}^{2}={\frac {1}{n-1}}\sum _{k=1}^{n}(X_{k}-{\bar {S}}_{n})^{2}} .
Para estudar um fenômeno aleatório que envolve uma variável normal, cujos parâmetros são conhecidos ou estimados, uma abordagem analítica muitas vezes é muito complexa para ser desenvolvida. Neste caso, é possível utilizar um método de simulação. Particularmente, o método de Monte Carlo que consiste em gerar uma amostra artificial de valores independentes de uma variável com um computador. Geralmente softwares ou linguagens de programação tem um gerador de números pseudoaleatórios com uma distribuição uniforme em ] 0 , 1 [ {\displaystyle ]0,1[} . Então, transforma–se esta variável de distribuição U ( ] 0 , 1 [ ) {\displaystyle U(]0,1[)} em uma variável N ( 0 , 1 ) {\displaystyle N(0,1)} (adaptação de outros valores dos parâmetros não representa qualquer problema).
A distribuição normal foi incorporada em vários softwares de computação.
Planilhas
As planilhas em Microsoft Excel, OpenOffice.org Calc e LibreOffice Calc fornecem as seguintes funções:
Linguagem de programação estatística S
A linguagem S, implementada no software R e S–PLUS, fornece as seguintes funções:
Por sua ampla utilização nas ciências, a distribuição normal, muitas vezes pela utilização da curva em forma de sino, é destacada em diferentes contextos e é utilizada para representar a universalidade da uma distribuição estatística, entre outros. Francis Galton menciona a distribuição normal em seu trabalho Natural Inheritance de 1889: Em 1989, foi feita uma homenagem à Carl Friedrich Gauss com a impressão de um bilhete com seu rosto e a curva em forma de sino (pedras suportam a curva de sino, e o caso de alguns matemáticos). THE NORMAL LAW OF ERROR STANDS OUT IN THE EXPERIENCE OF MANKIND AS ONE OF THE BROADEST GENERALIZATIONS OF NATURAL PHILOSOPHY ♦ IT SERVES AS THE GUIDING INSTRUMENT IN RESEARCHES IN THE PHYSICAL AND SOCIAL SCIENCES AND IN MEDICINE AGRICULTURE AND ENGINEERING ♦ IT IS AN INDISPENSABLE TOOL FOR THE ANALYSIS AND THE INTERPRETATION OF THE BASIC DATA OBTAINED BY OBSERVATION AND EXPERIMENT


