Ontologia (em grego ontos e logoi, "conhecimento do ser") e Semântica
Ver:http://www.ted.com/talks/lang/pt-br/tim_berners_lee_on_the_next_web.html
Ontologia (em nível alto, é uma representação do conhecimento)
Linguagem
Propriedades
Equevalência entre Classes
Cabeçalho
OWL: Evolução da linguagem DAML + OIL, proposta pela W#C
Criar instâncias
Deve ter:
Poder expressividade
Sintaxe bem definida
Sermântica formal
Suporte pra raciocínio
Reflexões
O objetivo da websemantica é reunir dados para auxiliar na gestão.
Modelo de Dados
RDF
A Resource Description Framework (RDF) é uma linguagem para representar informação na Internet.
Arquivos RDF são modelos ou fontes de dados, também conhecidos como metadata, tecnologia endossada e recomendada pela W3C desde fevereiro de 1999, tendo como principais objetivos criar um modelo simples de dados, com uma semântica formal, usar o vocabulário URI-based e uma sintaxe XML-based e suportar o uso de XML. Os arquivos RDF têm três componentes básicos: recurso, propriedade e indicação, o que torna a linguagem altamente escalável.
Recurso: Qualquer coisa que pode conter um URI, incluindo as páginas da web, assim como elementos de um documento XML.
Propriedade: Um recurso que tenha um determinado nome e possa ser utilizado como uma propriedade
Indicação: consiste na combinação de um recurso, de uma propriedade, e de um valor.
http://vocab.e.gov.br/2011/03/vcge#esquema
Vocabulário
Integração de Dados
Solução: Visão Integrada
Esquma de Integração (modelar as informações através de uma mapeamento dos esquemas locais, extraído a partir de BD locais)
A ideia é fornecer a informação com dados que se complementam e gera uma informação consistente.
Soluções precisam ser pensadas:
Prover a interoperabilidade (capacidade de um sistema (informatizado ou não) de se comunicar de forma transparente (ou o mais próximo disso) com outro sistema (semelhante ou não) entre as fontes de dados.
De maneira geral a solução de integração deve prover o caminho como a informação será obtida, com um vocabulário comum (ontologias) dentro do contexto do sujeito, através de um modelo flexível que seja capaz de representar dados semi-estruturados (de estrutura heterogênea).
Arquitetura de Dataspaces: diferentes arquiteturas integradas (abordagem pay as you go: pagar pelo que se usa)
Arquitetura ponto a ponto :P2P é uma arquitetura de sistemas distribuídos caracterizada pela descentralização das funções na rede, onde cada nodo realiza tanto funções de servidor quanto de cliente.
Arquitetura de Data Warehouse: abordagem materializada, repositório de dados integrados. Dados gerais resultantes de um processo de integração de dados. Obtidos das bases gera um repositório geral, mas perde a informação do dado atual, pois o dado mais atual está na fonte. Necessita atualização constante (rematerialização).
Repositório de dados: perda de dado mais atual, pois o mais atual está na fonte.
Arquitetura de Mediadores: aplicação submete ao mediador para decompor em subconsulta para as fontes de dados, mas isso precisa dos tradutores das fontes de dados.
Mediação: Não creio que essa seja melhor solução, a Web por conceito é desintermediadora, então usar um mediador como robô técnico foge a raiz conceitual do comportamento da web.
Como oferecer uma visão uniforme, global, integrada. Temos heterogeneidade da informação.
Semântica: significados diferentes
Terminológica: nomes diferentes
Estrutural: estruturas diferentes
Sintática : modelos de dados diferentes
Quem são as fontes de dados?
Disponíveis na web
Nas organizações
Conceito de Dados
Dados não estruturados : ausência de estrutura, ainda não tratados ou modelados, mas é preciso ter uma maneira de armazenar e manipular. Ex: Dados do Facebook, Youtube, Twitter.
Conhecimento: informação processada em nós.
Ex: Dado: 8848. Informação: A altura do Monte Everest. Conhecimento: O Monte Everest é a maior montanha sobre superfície da Terra.
Informação : dado já processado, associado a um significado.
metaDados - dado relacionado a um significado (contexto). Ex. Central do Brasil : Título de um filme
Dado Bruto - valor sem significado explícito
Conceito Genérico
Em ontologias jrabalhamos em linguagem de alto nível (antes de chegar no baixo nível é necessário trabalhar a modelagem conceitual, para tranformar num modelo (ER - Entidade e Relacionamento.)
Pegar nossa realidade e modelar para que isso seja processado pelo computador trabalhar em baixo nível.