A tendência central é uma medida de valores numa amostra que identifica os diferentes pontos centrais nos dados, muitas vezes referidos coloquialmente como “médias”. As medidas mais comuns de tendência central são a média, a mediana e a moda. A identificação do valor central permite que outros valores sejam comparados a ele, mostrando a dispersão ou o agrupamento da amostra, o que é conhecido como dispersão ou distribuição. Estas medidas de dispersão são categorizadas em 2 grupos: medidas de dispersão baseadas em percentis e medidas de dispersão baseadas na média (que é frequentemente conhecida como desvio padrão). A análise da distribuição dos dados determina se os dados têm uma tendência central forte ou fraca com base na sua dispersão. Quando a distribuição dos dados é simétrica e a média = mediana = moda, diz-se que os dados têm uma distribuição normal. Também são possíveis outros tipos de distribuições, e são conhecidas como distribuições não normais.
Última atualização: Jul 28, 2022
Medidas de tendência central são valores únicos que tentam descrever um conjunto de dados identificando o valor central ou “típico” desse conjunto de dados.
Definição:
A média é a soma de todas as medições num conjunto de dados dividida pelo número de medições nesse conjunto de dados.
Equação:
$$ Média = \frac{Soma\ de\ todos\ os\ valores\ no\ conjunto\ de\ dados}{Número\ total\ de\ valores\ no\ conjunto\ de\ dados} $$ $$ Média = \frac{x_{1}+x_{2}+x_{3}+…+x_{n}}{n} $$Exemplo:
Encontre a média do seguinte conjunto de dados: 1, 1, 1, 3, 5, 5, 7, 19.
Resposta: Existem 8 números neste conjunto de dados. Para calcular a média, some todos os números e divida por 8:
$$ Média = \frac{1+1+1+3+5+5+7+19}{8}=\frac{42}{8}=5,25 $$Definição:
Depois de organizar os dados do menor para o maior, a mediana é o valor do meio, separando a metade inferior da metade superior do conjunto de dados.
Equação:
Para encontrar a mediana, organize os valores do menor para o maior e, de seguida, use a seguinte equação para determinar qual a “posição” na ordem que representa a mediana:
$$ Mediana = \left \{ \frac{(n+1)}{2} \right \} $$onde n = o número de valores no conjunto de dados.
Exemplo:
Encontre a mediana do seguinte conjunto de dados: 1, 5, 1, 19, 3, 1, 7, 5.
Resposta: Existem 8 números neste conjunto de dados. Para encontrar a mediana, primeiro organize os números por ordem: 1, 1, 1, 3, 5, 5, 7, 19. De seguida, determine qual a “posição” que representa a mediana. Para fazer isto, use a fórmula ( n + 1) / 2. Existem 8 números neste conjunto de dados, então n = 8. Portanto, a mediana será: (8 + 1) / 2 = 4,5. A mediana está entre o 4º e o 5º números, que são 3 e 5 (visualmente: 1, 1, 1, 3, 5 , 5, 7, 19). Portanto, a mediana neste conjunto de dados é 4.
Definição:
A moda é o valor que ocorre com mais frequência no conjunto de dados.
Exemplo:
Encontre a moda do seguinte conjunto de dados: 1, 5, 1, 19, 3, 1, 7, 5.
Resposta: Identifique o número que aparece com mais frequência. Isto pode ser feito completando uma tabela de frequências:
Ponto de dados | Frequência (com que frequência o ponto de dados ocorre na amostra) |
---|---|
1 | 3 |
3 | 1 |
5 | 2 |
7 | 1 |
19 | 1 |
Mnemónica:
MOde is the value that is in the set MOst often (a moda é o valor que está no conjunto mais frequentemente).
Tipo | Descrição | Exemplo | Resultado |
---|---|---|---|
Média | Soma total de números dividida pelo número de valores | (8 + 4 + 10 + 4 + 4 + 5 + 4 + 5 + 6) / 9 | 5,5 |
Mediana | Valor médio que separa a metade superior da metade inferior | 4, 4, 4, 4, 5 , 5, 6, 8, 10 | 5 |
Moda | Número mais frequente | 4, 4, 4, 4, 5, 5, 6, 8, 10 | 4 |
A dispersão é o tamanho da distribuição de valores num conjunto de dados. Várias medidas de dispersão incluem um intervalo, quantis (por exemplo, quartis ou percentis) e desvios padrão.
Definição: O desvio padrão (DP) é uma medida de quão longe cada valor observado está da média num conjunto de dados.
Equação:
Matematicamente, o DP pode ser calculado usando a seguinte equação:
$$ \sigma = \sqrt{\frac{\sum (\chi _{i}-\mu )^{2}}{N}} $$σ = desvio padrão da população
Ν = tamanho da população
χ ᵢ = cada valor da população
µ = média da população
Cálculo (usando a equação):
A distribuição de dados descreve como os seus dados se agrupam (ou não se agrupam). Os dados tendem a agrupar-se em determinados padrões, conhecidos como padrões de distribuição. Existe um padrão de distribuição “normal” e vários padrões não normais. São usados testes estatísticos diferentes para padrões de distribuição diferentes.
As distribuições normais diferem de acordo com a sua média e variância, mas partilham as seguintes características:
Muitos processos seguem uma distribuição não normal, que se pode dever a variações naturais ou a erros nos dados.
Distribuições comuns:
Razões pelas quais os dados podem ter uma distribuição não normal: