Categorias: Todos - arquitetura - semântica - integração - mediação

por Fabiana Gonçalves 11 anos atrás

346

Ontologia e Semantica - Integração de Dados

A integração de dados busca oferecer uma visão global e uniforme, enfrentando desafios como a heterogeneidade estrutural, semântica, terminológica e sintática das informações. A solução proposta envolve a criação de um esquema de integração, modelando dados locais através de mapeamentos que resultam em informações consistentes e complementares.

Ontologia e Semantica - Integração de Dados

Ontologia (em grego ontos e logoi, "conhecimento do ser") e Semântica

Ver:http://www.ted.com/talks/lang/pt-br/tim_berners_lee_on_the_next_web.html

Ontologia (em nível alto, é uma representação do conhecimento)

Linguagem
Propriedades
Equevalência entre Classes
Cabeçalho
OWL: Evolução da linguagem DAML + OIL, proposta pela W#C

Criar instâncias

Deve ter:
Poder expressividade
Sintaxe bem definida
Sermântica formal
Suporte pra raciocínio

Reflexões

O objetivo da websemantica é reunir dados para auxiliar na gestão.

Modelo de Dados

RDF
A Resource Description Framework (RDF) é uma linguagem para representar informação na Internet. Arquivos RDF são modelos ou fontes de dados, também conhecidos como metadata, tecnologia endossada e recomendada pela W3C desde fevereiro de 1999, tendo como principais objetivos criar um modelo simples de dados, com uma semântica formal, usar o vocabulário URI-based e uma sintaxe XML-based e suportar o uso de XML. Os arquivos RDF têm três componentes básicos: recurso, propriedade e indicação, o que torna a linguagem altamente escalável. Recurso: Qualquer coisa que pode conter um URI, incluindo as páginas da web, assim como elementos de um documento XML. Propriedade: Um recurso que tenha um determinado nome e possa ser utilizado como uma propriedade Indicação: consiste na combinação de um recurso, de uma propriedade, e de um valor.

http://vocab.e.gov.br/2011/03/vcge#esquema

Vocabulário

Integração de Dados

Solução: Visão Integrada Esquma de Integração (modelar as informações através de uma mapeamento dos esquemas locais, extraído a partir de BD locais)

A ideia é fornecer a informação com dados que se complementam e gera uma informação consistente.

Soluções precisam ser pensadas:

Prover a interoperabilidade (capacidade de um sistema (informatizado ou não) de se comunicar de forma transparente (ou o mais próximo disso) com outro sistema (semelhante ou não) entre as fontes de dados.

De maneira geral a solução de integração deve prover o caminho como a informação será obtida, com um vocabulário comum (ontologias) dentro do contexto do sujeito, através de um modelo flexível que seja capaz de representar dados semi-estruturados (de estrutura heterogênea).

Arquitetura de Dataspaces: diferentes arquiteturas integradas (abordagem pay as you go: pagar pelo que se usa)
Arquitetura ponto a ponto :P2P é uma arquitetura de sistemas distribuídos caracterizada pela descentralização das funções na rede, onde cada nodo realiza tanto funções de servidor quanto de cliente.
Arquitetura de Data Warehouse: abordagem materializada, repositório de dados integrados. Dados gerais resultantes de um processo de integração de dados. Obtidos das bases gera um repositório geral, mas perde a informação do dado atual, pois o dado mais atual está na fonte. Necessita atualização constante (rematerialização).

Repositório de dados: perda de dado mais atual, pois o mais atual está na fonte.

Arquitetura de Mediadores: aplicação submete ao mediador para decompor em subconsulta para as fontes de dados, mas isso precisa dos tradutores das fontes de dados.

Mediação: Não creio que essa seja melhor solução, a Web por conceito é desintermediadora, então usar um mediador como robô técnico foge a raiz conceitual do comportamento da web.

Como oferecer uma visão uniforme, global, integrada. Temos heterogeneidade da informação.
Semântica: significados diferentes
Terminológica: nomes diferentes
Estrutural: estruturas diferentes
Sintática : modelos de dados diferentes

Quem são as fontes de dados?

Disponíveis na web
Nas organizações

Conceito de Dados

Dados não estruturados : ausência de estrutura, ainda não tratados ou modelados, mas é preciso ter uma maneira de armazenar e manipular. Ex: Dados do Facebook, Youtube, Twitter.
Conhecimento: informação processada em nós. Ex: Dado: 8848. Informação: A altura do Monte Everest. Conhecimento: O Monte Everest é a maior montanha sobre superfície da Terra.
Informação : dado já processado, associado a um significado.
metaDados - dado relacionado a um significado (contexto). Ex. Central do Brasil : Título de um filme
Dado Bruto - valor sem significado explícito

Conceito Genérico

Em ontologias jrabalhamos em linguagem de alto nível (antes de chegar no baixo nível é necessário trabalhar a modelagem conceitual, para tranformar num modelo (ER - Entidade e Relacionamento.)
Pegar nossa realidade e modelar para que isso seja processado pelo computador trabalhar em baixo nível.