Sistemas de búsqueda de información en la web
Buscadores generalistas
Funciones
1. Acceder a sitios web, localizar y descargar documentos
2. Extraer el contenido textual (y multimedia) de los documentos descargados.
3. Analizar e indexar el contenido de los documentos para construir los índices del motor.
4. Realizar el análisis de enlaces de cada página y otorgar alguna medida de popularidad.
5. Permitir la formulación de consultas mediante palabras clave.
6. Facilitar el acceso a los resultados de una consulta ordenándolos conforme a unos criterios de relevancia.
Componentes
Rastreador del motor de búsqueda o Spider.
Sistema de recuperación de información
Índices directos
Índices invertidos
Interfaz
Formulario de consulta
Búsqueda simple
Búsqueda avanzada
Página de resultados
Resultados
Enlaces patrocinados
Software de relevancia
Principales Buscadores Generalistas
Yahoo!
Bing
Ask
Metabuscadores
Tradicionales
Metacrawler
Dogpile
De agrupamiento
Yippy
Visuales
Carrot
Buscadores especializados
Académicos
Fuentes
Universidades (.edu)
Centros de investigación (NASA, RAND; etc.)
Gobierno
Editores de libros y revistas
Colecciones de bibliotecas
Repositorios digitales (e-prints, e-books...)
Tipos de documentos recuperados
Páginas web (html) y documentos publicados en instituciones académicas o científicas
Artículos de publicaciones científicas (abiertas o de pago)
Trabajos académicos (tesis doctorales, tesis de licenciatura...)
Documentos depositados en repositorios científicos
Patentes
Libros (monografías)
Principales buscadores académicos
Google Scholar
Scirus
Science Research
Libros
Google Books
Informes
Esade Knowledge
ICEX
Blogs
Google Blogs
Technorati
Mapas
Google Maps
Precios
Kelkoo
Buscadores semánticos
Sigma
Wolfram Aplha