Búsqueda de información en la web

r

¿Qué es la Web?La web es un sistema hipertexto que funciona sobre Internet, permitiendo la consulta de documentos o páginas web y la navegación a través de las mismas.Web invisible: constituyen esta web todas aquellas páginas que escapan a los índices de los motores de búsqueda generalistas. Ej: páginas generadas dinámicamente como Amazon; "no existen".Web 2.0: es el término acuñado para referirse a las plataformas, aplicaciones y herramientas caracterizadas por su dimensión social y comunicativa. Ej: blogs, redes sociales, foros, wikis, etcWeb Semántica: evolución tecnológica de la web actual hacia una nueva web que persigue la comprensión de sus contenidos por las máquinas. Se calcula que en 2015 las máquinas lo podrán descifrar todo.

Metabuscador

r

Son herramientas para la búsqueda de recursos web que utilizan los índices de varios buscadores para satisfacer las consultas de sus usuarios.Intenta recoger los mejores resultados que ofrecen diferentes buscadores para una consulta.Justificación: constatación de que la coincidencia en los primeros resultados de los principales buscadores está por debajo del 20%.

Ventajas

r

Evitar que los usuarios realicen su consulta en varios buscadores.Obtener los mejores resultados de diversos buscadores.

Inconvenientes

r

Imprecisión de si los buscadores que utiliza el metabuscador son de calidad.

Ejemplos

Dogpile

Yippy

Carrot

Buscadores para usos académicos

r

¡¡¡TODO DE GOOGLE!!!

Búsqueda de blogs

Buscadores especializados

r

Limita su ámbito de búsqueda a un dominio concreto, con el objetivo de proporcionar a sus usuarios acceso a los contenidos de calidad que sobre su área de especialización hay en la web

Ventajas

r

Son capaces de indexar los contenidos de su especialización incluso cuando estos están ubicados en la web invisible.

Inconvenientes

r

Mayor funcionalidad y potencial de búsqueda mediante el uso de interfaces adaptados a dominio específico que cubren.Es bastante cansado ir a uno y otro en función de lo que buscamos. Nada práctico.

Buscadores académicos

r

Sólo indexa sitios académicos, como Universidades, Centros de investigación, Gobierno, Editores de libros y revistas, Colecciones de bibliotecas o Repositorios digitales

Google Scholar

r

Amplía la timpología de documentos (sin patentes).Mayor número de documentos, pero sin información precisa.Acceso a libros completos.Análisis de citas.Opciones de ranking y navegación.

Science Research

r

Es un metabuscador que acude a casi 400 fuentes (repositorios, asociaciones, editoriales y motores de búsqueda especializados). Redundancia en los resultados obtenidos

Buscadores de libros

r

Desarrollo de plataformas para el acceso a los contenidos digitales.NetLibrary (http://www.netlibrary.com/)Safari Books online (http://my.safaribooksonline.com/)Ebrary Discover (http://shop.ebrary.com/)Amazon.com (http://www.amazon.com/)Google books, solución más destacada.Presente/futuro: Amazon Kindle, Sony Reader Digital Book, Apple Ipad, Google ebookstore

a

Búsqueda de informes

r

La información de carácter económico o empresarial constituye hoy uno de los factores críticos de cualquier institución.El producto más elaborado que podemos obtener dentro de este tipo de informaciones son los informes y los estudios de mercado.Previo pago.

Buscador

r

Son herramientas que permiten realizar consultas y recuperar información contenida en la Web. Principal herramienta para navegar por Internet.

Principales buscadores generalistas

r

- Acceder a sitios web, localizar y descargar documentos.- Extraer el contenido textual (y multimedia) de los documentos descargados.- Analizar e indexar el contenido de los documentos para construir los índices del motor.- Realizar el análisis de enlaces de cada página y otorgar alguna medida de popularidad.- Permitir la formulación de consultas mediante palabras clave.- Facilitar el acceso a los resultados de una consulta ordenándolos conforme a unos criterios de relevancia.

Google

Yahoo!

Bing

Ask

Componentes

Spider

r

Explora la web de forma sistemática con dos objetivos:- Interactuar con los servidores de sitios web para descargar páginas web u otros documentos y - Obtener nuevas direcciones (URL) para añadir a su lista de enlaces pendientes de revisar

Sistema de recuperación de información

r

Funciona según las veces que se repite cada término de la búsqueda.

Interfaz y formularios

r

Hace referencia al uso de palabras clave, ya sea mediante la búsqueda simple o la avanzada, introduciendo booleanos o filtros.

Software de relevancia

r

Ordenación de los resultados, es decir, la construcción del ranking de resultados en función de unos criterios de relevancia como los enlaces, las propiedades de la página (ubicación, formato de las palabras clave...) y la diferenciación entre resultados pagados y no pagados.