Kategorier: Alla - académicos - documentos - información - buscadores

av Alba Llucià för 11 årar sedan

242

Sistemas de búsqueda de información en la web

En la web, los buscadores especializados ofrecen la ventaja de encontrar páginas no indexadas por motores de búsqueda generalistas y tienen una mayor funcionalidad. Sin embargo, su uso depende del tema de interés.

Sistemas de búsqueda de información en la web

Sistemas de búsqueda de información en la web

Buscadores semánticos

Wolfram Aplha

más información sobre Wolfram Alpha:

http://www.nl.gob.mx/pics/pages/educacion_maestros_en_linea_base/maestrosenlinea15.pdf#page=18

Sigma

Buscadores especializados

Ventajas:

- Su capacidad para buscar en páginas que no están indexadas por los buscadores generalistas (web invisible)

- Mayor funcionalidad y potencial de búsqueda


Inconveniente:

- Necesidad de acudir a un buscador u otro en función de la temática

Precios
Kelkoo
Mapas
Google Maps
Blogs
Technorati
Google Blogs
Informes

Obtención de información de carácter económica o empresarial, a través de informes o estudios de mercado.

Normalmente este tipo de información sólo puede ser accedida previo pago

ICEX

Elabora y difunde información sobre la oferta de productos españoles y sobre mercados internacionales

Esade Knowledge

Es probablemente el recurso más importante de España para la búsqueda de información sectorial y empresarial

Libros
Google Books
Académicos
Principales buscadores académicos

Science Research

Aunque no está al nivel de Google Scholar o Scirus, resulta muy útil en la búsqueda de documentos científicos (editoriales y revistas científicas).

Scirus

Es el único que ha conseguido superar al buscador de Google en el ámbito académico.

Google Scholar

Pertenece a Google. Contiene una amplia tipologia de documentos, y también tiene acceso a libros completos (por acuerdos con bibliotecas).

Tipos de documentos recuperados

Libros (monografías)

Patentes

Documentos depositados en repositorios científicos

Trabajos académicos (tesis doctorales, tesis de licenciatura...)

Artículos de publicaciones científicas (abiertas o de pago)

Páginas web (html) y documentos publicados en instituciones académicas o científicas

Fuentes

Repositorios digitales (e-prints, e-books...)

Colecciones de bibliotecas

Editores de libros y revistas

Gobierno

Centros de investigación (NASA, RAND; etc.)

Universidades (.edu)

Metabuscadores

Son herramientas para la búsqueda de recursos web que utilizan los índices de varios buscadores para satisfacer las consultas de sus usuarios.

Recogen los mejores resultados que ofrecen diferentes buscadores para una misma consulta (normalmente la coincidencia en los principales resultados de distintos buscadores para la misma consulta está por debajo del 20%).

Visuales

Ordena los resultados en forma de gráfico

Carrot
De agrupamiento

Agrupan los resultados según su significado

Yippy
Tradicionales
Dogpile
Metacrawler

Buscadores generalistas

Funciones:

1.Acceder a sitios web, localizar y descargar documentos.

2. Extraer el contenido textual (y multimedia) de los documentos descargados.

3. Analizar e indexar el contenido de los documentos para construir los índices del motor.

4. Realizar el análisis de enlaces de cada página y otorgar alguna medida de popularidad.

5. Permitir la formulación de consultas mediante palabras clave.

6. Facilitar el acceso a los resultados de una consulta ordenándolos conforme a unos criterios de relevancia.

Principales Buscadores Generalistas
Ask
Bing
Yahoo!
Google
Componentes
Software de relevancia

Su función es la ordenación de los resultados, es decir, la construcción del ranking de resultados en función de unos criterios de relevancia. Algunos de ellos son:

1. Enlaces: enlaces de entrada y URL.

2. Contenido/Propiedades de la página: frecuencia / ubicación / formato de las palabras clave, etc.

3. Resultados pagados y Resultados no pagados.

Interfaz

Página de resultados

Enlaces patrocinados

Siempre resaltados de alguna forma para distinguir que se ha pagado para que estén allí

Resultados

Formulario de consulta

Búsqueda avanzada

Búsqueda simple

Sistema de recuperación de información

Crea listados internos con todas las palabras que aparecen en el texto de forma que al realizar la búsqueda se rastreen estas palabras, y no el documento entero.

Índices invertidos

Índices directos

Rastreador del motor de búsqueda o Spider.

Un spider (araña) o un crawler (rastreador) es un programa que explora la Web de forma sistemática con dos objetivos principales:

1. Interactuar con los servidores de sitios web para descargar páginas web u otros documentos y

2. Obtener nuevas direcciones (URL) para añadir a su lista de enlaces pendientes de revisar.

Funciones
6. Facilitar el acceso a los resultados de una consulta ordenándolos conforme a unos criterios de relevancia.
5. Permitir la formulación de consultas mediante palabras clave.
4. Realizar el análisis de enlaces de cada página y otorgar alguna medida de popularidad.
3. Analizar e indexar el contenido de los documentos para construir los índices del motor.
2. Extraer el contenido textual (y multimedia) de los documentos descargados.
1. Acceder a sitios web, localizar y descargar documentos