Kategorier: Alle - libros - académicos - social - semántica

av Alex Sánchez Aragón 11 år siden

212

Búsqueda de información en la web

La web es un sistema de hipertexto que opera sobre Internet, permitiendo la consulta y navegación de documentos o páginas web. Existe una "web invisible" que incluye páginas no indexadas por motores de búsqueda generalistas, como las generadas dinámicamente.

Búsqueda de información en la web

Búsqueda de información en la web

¿Qué es la Web?

La web es un sistema hipertexto que funciona sobre Internet, permitiendo la consulta de documentos o páginas web y la navegación a través de las mismas.

Web invisible: constituyen esta web todas aquellas páginas que escapan a los índices de los motores de búsqueda generalistas. Ej: páginas generadas dinámicamente como Amazon; "no existen".

Web 2.0: es el término acuñado para referirse a las plataformas, aplicaciones y herramientas caracterizadas por su dimensión social y comunicativa. Ej: blogs, redes sociales, foros, wikis, etc

Web Semántica: evolución tecnológica de la web actual hacia una nueva web que persigue la comprensión de sus contenidos por las máquinas. Se calcula que en 2015 las máquinas lo podrán descifrar todo.

Buscador

Son herramientas que permiten realizar consultas y recuperar información contenida en la Web. Principal herramienta para navegar por Internet.

Componentes
Software de relevancia

Ordenación de los resultados, es decir, la construcción del ranking de resultados en función de unos criterios de relevancia como los enlaces, las propiedades de la página (ubicación, formato de las palabras clave...) y la diferenciación entre resultados pagados y no pagados.

Interfaz y formularios

Hace referencia al uso de palabras clave, ya sea mediante la búsqueda simple o la avanzada, introduciendo booleanos o filtros.

Sistema de recuperación de información

Funciona según las veces que se repite cada término de la búsqueda.

Spider

Explora la web de forma sistemática con dos objetivos:

- Interactuar con los servidores de sitios web para descargar páginas web u otros documentos y

- Obtener nuevas direcciones (URL) para añadir a su lista de enlaces pendientes de revisar

Principales buscadores generalistas

- Acceder a sitios web, localizar y descargar documentos.

- Extraer el contenido textual (y multimedia) de los documentos descargados.

- Analizar e indexar el contenido de los documentos para construir los índices del motor.

- Realizar el análisis de enlaces de cada página y otorgar alguna medida de popularidad.

- Permitir la formulación de consultas mediante palabras clave.

- Facilitar el acceso a los resultados de una consulta ordenándolos conforme a unos criterios de relevancia.

Ask
Bing
Yahoo!
Google

Buscadores para usos académicos

¡¡¡TODO DE GOOGLE!!!

Búsqueda de informes

La información de carácter económico o empresarial constituye hoy uno de los factores críticos de cualquier institución.

El producto más elaborado que podemos obtener dentro de este tipo de informaciones son los informes y los estudios de mercado.

Previo pago.

Buscadores de libros

Desarrollo de plataformas para el acceso a los contenidos digitales.

NetLibrary (http://www.netlibrary.com/)

Safari Books online (http://my.safaribooksonline.com/)

Ebrary Discover (http://shop.ebrary.com/)

Amazon.com (http://www.amazon.com/)

Google books, solución más destacada.

Presente/futuro: Amazon Kindle, Sony Reader Digital Book, Apple Ipad, Google ebookstore

Buscadores académicos

Sólo indexa sitios académicos, como Universidades, Centros de investigación, Gobierno, Editores de libros y revistas, Colecciones de bibliotecas o Repositorios digitales

Science Research

Es un metabuscador que acude a casi 400 fuentes (repositorios, asociaciones, editoriales y motores de búsqueda especializados).

Redundancia en los resultados obtenidos

Google Scholar

Amplía la timpología de documentos (sin patentes).

Mayor número de documentos, pero sin información precisa.

Acceso a libros completos.

Análisis de citas.

Opciones de ranking y navegación.

Buscadores especializados

Limita su ámbito de búsqueda a un dominio concreto, con el objetivo de proporcionar a sus usuarios acceso a los contenidos de calidad que sobre su área de especialización hay en la web

Mayor funcionalidad y potencial de búsqueda mediante el uso de interfaces adaptados a dominio específico que cubren.

Es bastante cansado ir a uno y otro en función de lo que buscamos. Nada práctico.

Son capaces de indexar los contenidos de su especialización incluso cuando estos están ubicados en la web invisible.

Búsqueda de blogs

Metabuscador

Son herramientas para la búsqueda de recursos web que utilizan los índices de varios buscadores para satisfacer las consultas de sus usuarios.

Intenta recoger los mejores resultados que ofrecen diferentes buscadores para una consulta.

Justificación: constatación de que la coincidencia en los primeros resultados de los principales buscadores está por debajo del 20%.

Ejemplos
Carrot
Yippy
Dogpile
Inconvenientes

Imprecisión de si los buscadores que utiliza el metabuscador son de calidad.

Ventajas

Evitar que los usuarios realicen su consulta en varios buscadores.

Obtener los mejores resultados de diversos buscadores.