Ontologia (em grego ontos e logoi, "conhecimento do ser") e Semântica

r

Ver:http://www.ted.com/talks/lang/pt-br/tim_berners_lee_on_the_next_web.html

Conceito Genérico

Pegar nossa realidade e modelar para que isso seja processado pelo computador trabalhar em baixo nível.

Em ontologias jrabalhamos em linguagem de alto nível (antes de chegar no baixo nível é necessário trabalhar a modelagem conceitual, para tranformar num modelo (ER - Entidade e Relacionamento.)

Conceito de Dados

Dado Bruto - valor sem significado explícito

metaDados - dado relacionado a um significado (contexto). Ex. Central do Brasil : Título de um filme

Informação : dado já processado, associado a um significado.

Conhecimento: informação processada em nós.
Ex: Dado: 8848. Informação: A altura do Monte Everest. Conhecimento: O Monte Everest é a maior montanha sobre superfície da Terra.

Dados não estruturados : ausência de estrutura, ainda não tratados ou modelados, mas é preciso ter uma maneira de armazenar e manipular. Ex: Dados do Facebook, Youtube, Twitter.

Quem são as fontes de dados?

Nas organizações

Disponíveis na web

Integração de Dados

Como oferecer uma visão uniforme, global, integrada. Temos heterogeneidade da informação.

Sintática : modelos de dados diferentes

Estrutural: estruturas diferentes

Terminológica: nomes diferentes

Semântica: significados diferentes

Solução: Visão Integrada
Esquma de Integração (modelar as informações através de uma mapeamento dos esquemas locais, extraído a partir de BD locais)

r

A ideia é fornecer a informação com dados que se complementam e gera uma informação consistente.Soluções precisam ser pensadas:Prover a interoperabilidade (capacidade de um sistema (informatizado ou não) de se comunicar de forma transparente (ou o mais próximo disso) com outro sistema (semelhante ou não) entre as fontes de dados.De maneira geral a solução de integração deve prover o caminho como a informação será obtida, com um vocabulário comum (ontologias) dentro do contexto do sujeito, através de um modelo flexível que seja capaz de representar dados semi-estruturados (de estrutura heterogênea).

Arquitetura de Mediadores: aplicação submete ao mediador para decompor em subconsulta para as fontes de dados, mas isso precisa dos tradutores das fontes de dados.

r

Mediação: Não creio que essa seja melhor solução, a Web por conceito é desintermediadora, então usar um mediador como robô técnico foge a raiz conceitual do comportamento da web.

Arquitetura de Data Warehouse: abordagem materializada, repositório de dados integrados. Dados gerais resultantes de um processo de integração de dados. Obtidos das bases gera um repositório geral, mas perde a informação do dado atual, pois o dado mais atual está na fonte. Necessita atualização constante (rematerialização).

r

Repositório de dados: perda de dado mais atual, pois o mais atual está na fonte.

Arquitetura ponto a ponto :P2P é uma arquitetura de sistemas distribuídos caracterizada pela descentralização das funções na rede, onde cada nodo realiza tanto funções de servidor quanto de cliente.

Arquitetura de Dataspaces: diferentes arquiteturas integradas (abordagem pay as you go: pagar pelo que se usa)

Modelo de Dados

RDF

A Resource Description Framework (RDF) é uma linguagem para representar informação na Internet.

Arquivos RDF são modelos ou fontes de dados, também conhecidos como metadata, tecnologia endossada e recomendada pela W3C desde fevereiro de 1999, tendo como principais objetivos criar um modelo simples de dados, com uma semântica formal, usar o vocabulário URI-based e uma sintaxe XML-based e suportar o uso de XML. Os arquivos RDF têm três componentes básicos: recurso, propriedade e indicação, o que torna a linguagem altamente escalável.

Recurso: Qualquer coisa que pode conter um URI, incluindo as páginas da web, assim como elementos de um documento XML.
Propriedade: Um recurso que tenha um determinado nome e possa ser utilizado como uma propriedade
Indicação: consiste na combinação de um recurso, de uma propriedade, e de um valor.

r

http://vocab.e.gov.br/2011/03/vcge#esquema

a

Vocabulário

Reflexões

O objetivo da websemantica é reunir dados para auxiliar na gestão.

Ontologia (em nível alto, é uma representação do conhecimento)

Deve ter:

Suporte pra raciocínio

Sermântica formal

Sintaxe bem definida

Poder expressividade

Linguagem

OWL: Evolução da linguagem DAML + OIL, proposta pela W#C

Criar instâncias

Cabeçalho

Vocabulário

Equevalência entre Classes

Propriedades