Estatística

Áreas

Estatística Descritiva

r

Parte inicial, quando tomamos contato com os dados – para tirar conclusões de modo informal e rápido, observando os valores escolhidos (tarefa pode não ser simples – muitos dados).É um conjunto de técnicas destinadas a a descrever e resumir os dados a fim de tirar conclusões a respeito de características e interesses.

Consistência dos dados

Interpretações iniciais

Probabilidade

r

Teoria Matemática utilizada para se estudar a incerteza oriunda de fenômenos de caráter aleatório.

Auto-contida Logicamente

Algumas poucas regras pra se calcular probabilidades

Uma resposta correta

Inferência Estatística

r

Técnicas que possibilitam a extrapolação, a um grande conjunto de dados, das informações e conclusões obtidas a partir de um subconjunto de valores, de dimensão muito menor.

Estimação de quantidades desconhecidas

Extrapolação dos resultados

Teste de hipótese

Definições

População

r

É o grande conjunto de dados que temos interesse,´é o alvo. Ex.: População de SP, Número de lâmpadas produzidas, todo o sangue do corpo de uma pessoa.Às vezes podemos acessar toda a informação, às vezes não ( razões econômicas, éticas, incontornáveis

Amostra

Selecionando uma amostra

Tabela de Dados Brutos

r

É o conjunto de informações disponíveis, após tabulação. Contém os dados da maneira que forma coletados.

Variáveis

Quantitativas (Numéricas)

Discretas (Enumerados)

r

São resultante de contagem assumem, em geral, valores inteiros (conjunto finito e enumerável)Ex. Número de irmãos: (0,1,2,...) Número de defeitos: (0,1,2,000)

Contínuas (Mensurados)

r

Assumem valores em intervalos de números reais, provenientes de uma mensuração. Ex. Peso, Altura

Qualitativas (Não Numéricas)

Ordinais (Ordenados)

r

Têm uma ordenação natural, indicando intensidade crescente de realização:Ex. Tamanho: pequeno, médio, grande Classe social: baixa, média, alta

Nominais (Sem Ordenação)

r

Quando não contém ordenação.Ex. Turma: A ou B Sexo: M ou F

Tabelas de Frequência

Frequência Acumulada

r

Para variáveis cujos valores possuem ordenação natural faz sentido incluirmos as frequências acumuladas ( fac ).A frequência acumulada até um certo valor é obtida pela soma de todos os valores da variável, menores ou igual ao valor considerado.UTILIDADE: ajuda a estabelecer pontos de corte

Mediana

Quartis

25% - Q1

50% - Q2 (ou Mediana)

75% - Q3

Organização dos Dados

Como extrair informações de interesse?

Tabelas de Frequências

Gráficos

r

Muitas vezes as informações contidas nas tabelas são mais facilmente visualizadas através de gráficos.Os meios de comunicação usam diariamentegráficos dos + variados formatos para auxiliar na apresentação da informação.Órgãos públicos e empresas usam gráficos e tabelas em documentos internos de atividades e desempenho

Disco (ou Pizza)

r

A tabela de frequências consiste em listar os valores possíveis das variáveis, numéricos ou não e fazer a contagem na tabela de dados brutos do número de suas ocorrências. • • Seja ηi a frequência do valor i e por n a frequência total.Para comparar com outros grupos ou conjuntos de dados devemos colocar uma coluna na tabela de frequência contendo a frequência relativa: fi = ηi/nEx. Tabela de Frequências para a variável SexoSEXO ηi fiF 37 0,74M 13 0,26Total N= 50 1

Barras

r

Plano cartesiano com os valores das variáveis no eixo das abcissas e as frequências no eixo das ordenadas.Para cada valor da variávelDesenha-se uma barra comAltura igual à frequência.Esse tipo de gráfico se adapta Bem a variáveis discretas ou Qualitativas ordinais.

Histogramas

r

Retângulos contíguos com base nas faixas de valores da variável e com área igual à frequência relativa da respectiva faixa.

Data Science

Distribuições de Probabilidade

Significância Estatística

Testes de Hipóteses

Regressão

Análise Exploratória

Manipulações

Visualizações

Sumarizações