Ontologia (em grego ontos e logoi, "conhecimento do ser") e Semântica
Conceito Genérico
Pegar nossa realidade e modelar para que isso seja processado pelo computador trabalhar em baixo nível.
Em ontologias jrabalhamos em linguagem de alto nível (antes de chegar no baixo nível é necessário trabalhar a modelagem conceitual, para tranformar num modelo (ER - Entidade e Relacionamento.)
Conceito de Dados
Dado Bruto - valor sem significado explícito
metaDados - dado relacionado a um significado (contexto). Ex. Central do Brasil : Título de um filme
Informação : dado já processado, associado a um significado.
Conhecimento: informação processada em nós.
Ex: Dado: 8848. Informação: A altura do Monte Everest. Conhecimento: O Monte Everest é a maior montanha sobre superfície da Terra.
Dados não estruturados : ausência de estrutura, ainda não tratados ou modelados, mas é preciso ter uma maneira de armazenar e manipular. Ex: Dados do Facebook, Youtube, Twitter.
Quem são as fontes de dados?
Nas organizações
Disponíveis na web
Integração de Dados
Como oferecer uma visão uniforme, global, integrada. Temos heterogeneidade da informação.
Sintática : modelos de dados diferentes
Estrutural: estruturas diferentes
Terminológica: nomes diferentes
Semântica: significados diferentes
Solução: Visão Integrada
Esquma de Integração (modelar as informações através de uma mapeamento dos esquemas locais, extraído a partir de BD locais)
Arquitetura de Mediadores: aplicação submete ao mediador para decompor em subconsulta para as fontes de dados, mas isso precisa dos tradutores das fontes de dados.
Arquitetura de Data Warehouse: abordagem materializada, repositório de dados integrados. Dados gerais resultantes de um processo de integração de dados. Obtidos das bases gera um repositório geral, mas perde a informação do dado atual, pois o dado mais atual está na fonte. Necessita atualização constante (rematerialização).
Arquitetura ponto a ponto :P2P é uma arquitetura de sistemas distribuídos caracterizada pela descentralização das funções na rede, onde cada nodo realiza tanto funções de servidor quanto de cliente.
Arquitetura de Dataspaces: diferentes arquiteturas integradas (abordagem pay as you go: pagar pelo que se usa)
Modelo de Dados
RDF
A Resource Description Framework (RDF) é uma linguagem para representar informação na Internet.
Arquivos RDF são modelos ou fontes de dados, também conhecidos como metadata, tecnologia endossada e recomendada pela W3C desde fevereiro de 1999, tendo como principais objetivos criar um modelo simples de dados, com uma semântica formal, usar o vocabulário URI-based e uma sintaxe XML-based e suportar o uso de XML. Os arquivos RDF têm três componentes básicos: recurso, propriedade e indicação, o que torna a linguagem altamente escalável.
Recurso: Qualquer coisa que pode conter um URI, incluindo as páginas da web, assim como elementos de um documento XML.
Propriedade: Um recurso que tenha um determinado nome e possa ser utilizado como uma propriedade
Indicação: consiste na combinação de um recurso, de uma propriedade, e de um valor.
Vocabulário
Reflexões
O objetivo da websemantica é reunir dados para auxiliar na gestão.
Ontologia (em nível alto, é uma representação do conhecimento)
Deve ter:
Suporte pra raciocínio
Sermântica formal
Sintaxe bem definida
Poder expressividade
Linguagem
OWL: Evolução da linguagem DAML + OIL, proposta pela W#C
Criar instâncias
Cabeçalho
Vocabulário
Equevalência entre Classes
Propriedades