DATA SCIENCE

Visualização de Dados

visualização de dados avançados

Apresentação Ferramentas no mercado para visualização e tomada de decisão.

Power BI

Dashboards dinâmicos

relatórios interativos

gráficos

Tableau

Inteligência de Negócios para Big Data

Análisar Informações

Big data

conjunto de software

Conjunto de algoritmos

Computação em nuvem

Introdução à computação em nuvem

Modelos de computação em nuvem

Azure

Segurança e confiança de funcionamento na nuvem

Virtualização de recursos

Gestão de recursos em ambiente de nuvem

Armazenamento de dados na nuvem

Frameworks de programação na nuvem

Estudos de casos

Aspetos legais e éticos da computação em nuvem

IoT

Conceitos Básicos, definição e arquitetura

Cadeia de valor

Aplicações de
IoT

ambiente industrial

carro conectado

Big data

Modelo de informação na IoT

modelo de entidade

modelo de recurso

Processamento de Grandes Volumes de Dados
(Big Data, Hadoop e MapReduce)

Apresentar as características, problemas e principais soluções

Entender o que são grandes volumes de dados

Bancos de Dados para Big Data (NoSQL)

Entender os modelos de
armazenamentos dos dados.

Estudo de Tecnologias

Hadoop

MongoDB

Cassandra

Sistema de Recuperação

Banco de Dados não Relacionais

Linguagem SQL

Data Mining

Abordar os aspectos teóricos e práticos da descoberta de conhecimento em bancos de dados

Técnica

Tarefas

Ferramentas computacionais de suporte às diversas etapas do KDD

mineração de dados e suas principais derivações

web mining

text mining

process mining

music
mining

Introdução à Data Science

Principais conceitos

BIG DATA

IA

aprendizado de máquina

Variáveis, populações e amostras

preparação de dados

Ferramentas do Cientista de Dados

Construção de um modelo preditivo

SPSS Modeler

Python para Data Science

Anaconda

biblioteca
Pandas

mineração de dados com SciKit Learn

Transformação e carga de dados

Análise de Dados

Estatística para Data Science I (Linguagem R)

Experimentos Estatísticos

Análise Exploratória de Dados

Distribuições

Introdução a linguagem R

Estatística para Data Science II (Linguagem R)

Modelos de classificação

KNN

Árvore de decisão

Random Forest

Modelos de regressão

Linear

Logistica

Aprendizado não supervisionado

K-Means Clustering

Clustering Hierárquico

Gerência de Dados e Ingestão

Ambientes Distribuídos

cloud

ampliação da disponibilidade

Escalabilidade

Ingestão de Dados

Integração de Dados Estruturados

Extração

Enriquecimento

Construção de Aplicações ETL

Recuperação Inteligente de Informações

Dados, Informações, Conhecimento

Principais tipos de dados em recuperação de informação

Principais tarefas em recuperação de informação

Modelos formais utilizados

Modelos booleanos

vetorial

probabilísticos

Avaliação das tarefas de Recuperação de Informação

Consultas, Consultas estruturadas, Expansão da consulta

Textos, Medidas de Informação, Compressão de dados

Indexação e busca Índice invertido e algoritmos de busca

Técnicas de Inteligência Artificial

Data Mining

Análise de Semântica Latente

Extração de Informação

técnicas associadas

Machine Learning

Introdução ao aprendizado de máquina

Principais Problemas

Dados

Ferramentas

Overfitting

treinamento

validação

dados de teste

Problemas de classificação

fronteiras de decisão