TESTES NÃO - PARAMÉTRICOS
Testes de Aderência
hipótese de que a distribuição da variável seja
descrita por certo modelo
boa ou má aderência dos dados ao modelo hipotético
tipos de testes
Qui-quadrado (X²)
X² = Σ^k [(Oi² / Ei ] - n
Oi = frequência observada
Ei = frequência esperada
n = número de elementos da amostra
k = número de valores considerados
se Ei ≥ 5 e modelo testado for verdadeiro
estatística de teste X²v com v = k - 1 -m
k = número de parcelas somadas
m = número de parâmetros estimados
Ei = n*pi
n = nº de elementos amostra
pi = probabilidade de se obter um valor da variável na classe
teste unilateral
se X² > X²crítico
hipótese H0 rejeitada
Kolmogorov - Smimov
variável de teste (d) é a maior diferença observada entre função ditribuição
acumulada do modelo (FDA) e a da amostra
FDA = F(x) = P (X ≥ x)
FDA amostra = gráfico de frequências relativas acumuladas = G(x)
comparação d d com valor crítico tabelado
d > valor crítico
rejeita H0
Gráfico
processo simplificado e aproximado
pouca exigência de rigor
papel de probabilidade normal
uma das escalas dividas conforme os percentis de diastribuição normal e a outra linear
se hipótese de normalidade for verdadeira
gráfico = reta
Comparação de duas populações
Teste de Sequências
série de observações sim/não
n1 = obervações de um tipo
n2 = observações de outro tipo
sequência (u) = conjunto de observações consecutivas de mesmo tipo
analisar se sequências ocorrem ou não ao acaso
hipótese verdadeira: sequências são aleatórias
número número de sequências não pode ser nem
muito grande nem muito pequeno
u crítico tabelado
se n1 ≥ 10 e n2 ≥ 10
distribuição de probabilidade de u aproximada pela normal
média (u) = [(2*n1*n2) / (n1 + n2)] + 1
desvio padrão (u) = {[2*n1*n2(2*n1*n2 - n1 - n2)] / [(n1 + n2)² * (n1 + n2 -1)]}^1/2
hipótese de aleatoriadade z = (u - média (u)) / desvio padrão (u)
comparação de populações
ordena-se o conjunto total de valores das duas amostras
testa aleatoriedade das sequências formadas or valores da mesma amostra
se número de sequências for baixo
rejeição da identidade entre populações
Tabelas de Contingência
representação tabular daas frequências observadas de duas
ou mais variáveis qualitativas de interesse
H0: variáveis independentes
H1: variáveis não independentes
usar teste X²
Eij = n * pij
pij = probabilidade de ocorrer observação na célula considerada (pi * pj)
pi = probabilidade marginal linha i
pj = probabilidade marginal coluna j
frequências esperadas = (total da linha * total da coluna) / frequência total
probabilidade marginais estimada atavés das frequências relativas