Búsqueda de información en la web

Buscadores

Información teórica

¿Qué son?

r

Los buscadores son herramientas para hacer consultas y recuperar información de la web. Son la principal herramienta para navegar por Internet, ya que nos facilitan la información a través de los enlaces que nos proporcionan.

Funciones

r

Sus principales funciones son las siguientes:1. Acceder a sitios web para proporcionar documentos2. Extraer el contenido textual y multimedia de éstos3. Indexar los contenidos 4. Analizar los enlaces y ordenarlos por popularidad5. Formulación de consultas con palabras clave6. Facilitar las consultas ordenando los resultados por relevancia

Componentes

r

Estan formados por los siguientes 4 programas:1. Rastreador o Spider: explora la web para obtener documentos y nuevas URL.2. Sistema de recuperación de la información: a través de una lista de conceptos indexada3. Interfaz: mediante las palabras clave. Normalmente ofrecen al usuario la búsqueda simple y la avanzada (con operadores booleanos, filtros, etc.). En ella también se diferencia entre los resultados pagados (anuncios) y los no pagados (patrocinados). Nos organiza las informaciones en un ranking con información sobre el documento que nos enlaza (título, descripción, URL, etc.)4. Software de relevancia: se encarga de la ordenación de resultados mediante un ranking con criterios de relevancia. Algunos de ellos son los enlaces, los contenidos pagados y determinadas propiedades de la página.

Generalistas

Google

r

En esta dirección encontraréis toda la información necesaria sobre el buscador de Google: http://www.google.es/intl/es/about/

a

Ask

r

En esta web encontraréis toda la información sobre Ask.com España:http://about.es.ask.com/es/docs/about/sitefeatures.shtml

a

Bing

Yahoo!

r

En esta dirección encontraréis toda la información sobre Yahoo! España:http://es.docs.yahoo.com/companysite/

a

Especializados

r

Los buscadores especializados limitan su ámbito de búsqueda a un dominio concreto para proporcionar a sus usuarios contenidos de calidad sobre un área especializado/ concreto de la web. Van mucho más allá de la búsqueda simple ofrecida por los buscadores generalistas.Las principales ventajas que presentan son su capacidad de buscar páginas no indexadas por los buscadores generalistas (accediendo incluso a la web invisible) y una mayor funcionalidad y potencia. Como inconveniente, destacar que debemos acudir a un buscador u otro dependiendo de la temática de nuestro interés.

Tipología

Buscadores académicos

r

Estos buscadores solo indizan sitios web vinculados al mundo acadámico. Sus fuentes de información (inputs), son las siguientes:- Universidades- Centros de investigación- Gobierno- Editores de libros y colecciones de bibliotecas- Repositorios digitalesLos tipos de documentos recuperadors (output) son:- Páginas web y documentos académicos- Artículos de publicaciones científicas- Trabajos académicos (tesis doctorales, etc).- Patentes y libros

Principales

Google Scholar

r

Este buscador, perteneciente a Google, amplía la tipología de documentos (patentes no), nos da un mayor número y nos permite el acceso a libros completos. Se caracteriza por su análisis de las citas y las opciones de ranking y navegación.

Scirus

r

El buscador Scirus, creado en 2001, contenía más de 450 millones de documentos en el año 2009. Propiedad de la editorial Elsevier, se caracteriza por sus avanzadas opciones de búsqueda. Acude a reconocidas Bases de Datos como ScienceDirect o Scopus para ofrecer sus contenidos.

Science Research

r

Desarollado con Deep Web Technologies, este buscador utiliza la búsqueda federada (un metabuscador). Con capacidad de abarcar casi 400 fuentes, accede a colecciones de asociaciones, repositorios, revistas científicas y motores de búsqueda especializados. Se caracteriza por la redundancia de los resultados obtenidos.Para más información sobre este recurso:http://www.lluiscodina.com/scienceResearch.pdf

a

Buscadores de libros

r

Aparecen cuando las editoriales empiezan a incorporar los libros electrónicos (principalmente académicos) y se desarrollan varias plataformas para el acceso a contenidos digitales.

Google Books

El presente/futuro

Amazon Kindle

a

Sony Reader Digital Book

Apple iPad

Google ebookstore

Buscadores de blogs

Blogsearch de Google

Technorati

Otros

Plataformas de contenidos digitales

NetLibrary

a

Safari Books Online

a

Ebrary Discover

a

Amazon.com

Búsqueda de informes

r

Dada la importancia de la información económica y empresarial en la sociedad actual, los informes y estudios de mercado son un producto elaborado muy útil. El principal inconveniente de estos recursos es que es de pago.

ESADE Knowledge

r

Recurso más importante de la búsqueda de información sectorial y empresarial a nivel español.

a

ICEX

r

El ICEX (Instituto Español de Comercio Exterior) ofrece información sobre oferta de productos españoles y sobre mercados interacionales.

Metabuscadores

¿Qué son?

r

Son herramientas para la búsqueda en la web utilizando los índices de varios buscadores a la vez. Cogen el mejor resultado que les ofrecen los diferentes buscadores para una misma consulta. Esto tiene sentido debido a la constatación que la coincidencia en los primeros resultados de los principales buscadores es menor del 20%.

Ventajas e inconveninentes

r

Las principales ventajas que presentan son que evitan a los usuarios tener que hacer la misma consulta en diferentes buscadores y que ofrecen los mejores resultados de todos ellos. Los inconvenientes, que se pone en duda la calidad de sus buscadores.

Destacados

Metacrawler

a

Dogpile

a

Yippy

Carrot

Semánticos

r

Estos buscadores, también llamados "inteligentes" se caracterizan porque analizan el significado del grupo de palabras introducido, no se basan en las etiquetas actuales. Pese a que su uso todavía no es generalizado, funcionan bien a través de palabras clave.

Wolpramalpha

Lexxe

a

Web

r

Sistema de hipertexto que funciona en Internet, permitiendo la consulta de información y la navegación a través de sus páginas.

Web invisible

r

Aquellas páginas que escapan de los índices de los buscadores generalistas. Normalmente son aquellas que no tienen enlaces o que estan en capas demasiado profundas del sitio web.

Web 2.0

r

Término utilizado para hablar de la nueva web desde el punto conceptual. Tiene una gran dimensión social i comunicativa, plasmada en las redes sociales, los blogs, los fotos, etc. El debate se centra ahora en la existencia o no de una Web 3.0

Web semántica

r

Evolución de la web actual a una nueva web que busca que sus contenidos sean compendidos por máquinas.