Pesquisa · Mapa mental

Diagrama de caixa

Em estatística descritiva, diagrama de caixa, diagrama de extremos e quartis, boxplot ou box plot é uma ferramenta gráfica para representar a variação de dados observados de uma variável numérica por meio de quartis. O box plot tem uma reta que estende–se verticalmente ou horizontalmente a partir da caixa, indicando a variabilidade fora do quartil superior e do quartil inferior. Os valores atípicos ou outliers podem ser plotados como pontos individuais. O diagrama de caixa não é paramétrico, apresentando a variação em amostras de uma população estatística sem fazer qualquer suposição da distribuição estatística subjacente. Os espaços entre as diferentes partes da caixa indicam o grau de dispersão, a obliquidade nos dados e os outliers. O box plot também permite estimar visualmente vários estimadores como amplitude interquartil, midhinge, range, mid-range, e trimean. Em resumo, o diagrama identifica onde estão localizados 50% dos valores mais prováveis, a mediana e os valores extremos.

Fonte: Wikipédia (pt)Atualizado em 05/07/2026
01

História

Na história da civilização, as imagens sempre foram fundamentais para contar histórias e compartilhar ideias. Na matemática, os primeiros casos de uso de imagem para representar números datam de antes de 300 AC na Grécia Antiga. Mais tarde, os matemáticos desenvolveram o uso de gráficos para ajudar em cálculos mais complexos. Depois de mais de 100 anos desde A Geometria, publicado por René Descartes em 1637, em que o filósofo e matemático francês introduziu o sistema de coordenadas cartesianas, cientistas e matemáticos passaram a usar gráficos para informar e educar com a criação de diferentes tipos de gráficos (gráfico de linha, gráfico de barras e gráfico de pizza) e infográficos. Um dos primeiros registros de uso de gráficos na educação vem do matemático Joseph Priestley (1733 – 1804), que usou gráficos semelhantes ao diagrama de Gantt para ajudar a lecionar história na Warrington Academy. Enquanto que um dos primeiros registros de uso de gráficos na informação vem da enfermeira Florence Nightingale (1820 – 1910), que utilizou gráficos polares para mostrar o número de mortes dentro do exercito britânico.

02

Construção de um diagrama de caixa

A construção do diagrama inclui os seguintes procedimentos (representando os valores de variável no eixo vertical como nas figuras 2 e 3 por exemplo): O diagrama é uma forma rápida de examinar um ou mais conjuntos de dados graficamente. Embora pareça mais primitivo que o histograma ou a estimativa de densidade kernel, o boxplot apresenta vantagens sobre esses por prover mais dados além da mediana e/ou a média. A escolha do número e da largura das barras pode influenciar muito na aparência do histograma e da estimativa de densidade kernel, o que não acontece com o boxplot. De fato, a largura do diagrama de extremos pode até ser usada como uma medida de informação dos dados, representando em alguma proporção o tamanho do conjunto de dados. Uma comparação (figura 4) entre o gráfico e uma função densidade de probabilidade (histograma teórico) mostra explicitamente a quantidade de informações que essa ferramenta possui.

03

Exemplo prático

Imagem: Ederporto · BY-SA · Openverse

População dos estados

Em 2016, o Instituto Brasileiro de Geografia e Estatística (IBGE) contabilizou a população dos estados brasileiros. O box plot acima mostra a importância do cuidado com os outliers em análise de dados. A população de São Paulo é maior que a população dos demais estados brasileiros e isso não é um erro. Isto significa que nem sempre o outlier corresponde a um erro de arredondamento ou a um erro de observação.

04

Variações

Imagem: Arnaugir · BY-SA · Openverse

Desde que o matemático John W. Tukey introduziu este tipo de representação visual de dados em 1969, variações do boxplot tradicional têm sido descritas. Duas das mais comuns são os boxplots com largura variável e os boxplots entalhados (figura 6).

Diagrama de caixa com largura variável

Os boxplots com largura variável (variable width box plots) ilustram o tamanho de cada grupo, cujos dados estão sendo plotados tornando a largura da caixa proporcional ao tamanho do grupo. Uma convenção popular é tornar a largura da caixa proporcional à raiz quadrada do tamanho do grupo.

Diagrama de caixa entalhado

Os boxplots entalhados (notched box plots) aplicam um entalhe ou um estreitamento da caixa em torno da mediana. Os diagramas de caixa entalhados são úteis para oferecer um guia aproximado para a significância da diferença entre medianas. Se o entalhe de duas caixa não se sobrepuserem, isto oferece evidência de uma diferença estatisticamente significante entre as medianas. A largura dos entalhes é proporcional à amplitude interquartil da amostra e inversamente proporcional à raiz quadrada do tamanho da amostra. Entretanto, há incerteza sobre o multiplicador mais apropriados (isto pode variar dependendo da similaridade das variâncias das amostras).

Diagrama de caixa ajustado

Os boxplots ajustados (variable width notched box plots) são destinados às distribuições distorcidas, baseando—se na estatística medcouple de distorção. Para um valor medcouple de MC, os comprimentos dos fio de bigodes superiores e inferiores são respectivamente definidos por: 1.5 I Q R ⋅ e 3 M C , 1.5 I Q R ⋅ e − 4 M C se M C ≥ 0 1.5 I Q R ⋅ e 4 M C , 1.5 I Q R ⋅ e − 3 M C se M C ≤ 0 {\displaystyle {\begin{matrix}1.5IQR\cdot e^{3MC},&1.5IQR\cdot e^{-4MC}{\text{ se }}MC\geq 0\\1.5IQR\cdot e^{4MC},&1.5IQR\cdot e^{-3MC}{\text{ se }}MC\leq 0\end{matrix}}} Observa–se que para distribuições simétricas, o medcouple será 0. Isto reduz o bloxplot de Tukey como igual comprimento dos fio de bigodes, de amplitude interquartil de 1,5 para ambos os fio de bigodes.

05

Comparação de diferentes conjuntos

Com o diagrama de extremos, é possível visualizar se existe ou não existe equivalência em conjuntos de dados. A figura 7 mostra que de fato não se trata de um único conjunto, mas de dois grupos A e B distintos. Esta evidência é destacada caso os dados experimentais sejam plotados, em dot plot ou em gráficos de pontos, em conjunto com os diagramas de caixa. Por exemplo, ao analisar uma variável quantitativa como a renda (salário) de trabalhadores que pode ser expressa (plotada) em dot plot ou box plot, é notado um único gráfico. No entanto, trabalhadores são compostos por gêneros, sendo possível diferenciar entre dois grupos (gêneros) que são homem e mulher. Portanto, ao analisar o diagrama Renda de trabalhadores, se observa dois diagramas de caixa diferentes tratando a mesma variável quantitativa: renda.

Vídeos recomendados

Fontes consultadas

Continue pesquisando