Búsqueda de información en la web
Buscadores
Información teórica
¿Qué son?
Los buscadores son herramientas para hacer consultas y recuperar información de la web. Son la principal herramienta para navegar por Internet, ya que nos facilitan la información a través de los enlaces que nos proporcionan.
Funciones
Sus principales funciones son las siguientes:1. Acceder a sitios web para proporcionar documentos2. Extraer el contenido textual y multimedia de éstos3. Indexar los contenidos 4. Analizar los enlaces y ordenarlos por popularidad5. Formulación de consultas con palabras clave6. Facilitar las consultas ordenando los resultados por relevancia
Componentes
Estan formados por los siguientes 4 programas:1. Rastreador o Spider: explora la web para obtener documentos y nuevas URL.2. Sistema de recuperación de la información: a través de una lista de conceptos indexada3. Interfaz: mediante las palabras clave. Normalmente ofrecen al usuario la búsqueda simple y la avanzada (con operadores booleanos, filtros, etc.). En ella también se diferencia entre los resultados pagados (anuncios) y los no pagados (patrocinados). Nos organiza las informaciones en un ranking con información sobre el documento que nos enlaza (título, descripción, URL, etc.)4. Software de relevancia: se encarga de la ordenación de resultados mediante un ranking con criterios de relevancia. Algunos de ellos son los enlaces, los contenidos pagados y determinadas propiedades de la página.
Generalistas
En esta dirección encontraréis toda la información necesaria sobre el buscador de Google: http://www.google.es/intl/es/about/
aAsk
En esta web encontraréis toda la información sobre Ask.com España:http://about.es.ask.com/es/docs/about/sitefeatures.shtml
aBing
Yahoo!
En esta dirección encontraréis toda la información sobre Yahoo! España:http://es.docs.yahoo.com/companysite/
aEspecializados
Los buscadores especializados limitan su ámbito de búsqueda a un dominio concreto para proporcionar a sus usuarios contenidos de calidad sobre un área especializado/ concreto de la web. Van mucho más allá de la búsqueda simple ofrecida por los buscadores generalistas.Las principales ventajas que presentan son su capacidad de buscar páginas no indexadas por los buscadores generalistas (accediendo incluso a la web invisible) y una mayor funcionalidad y potencia. Como inconveniente, destacar que debemos acudir a un buscador u otro dependiendo de la temática de nuestro interés.
Tipología
Buscadores académicos
Estos buscadores solo indizan sitios web vinculados al mundo acadámico. Sus fuentes de información (inputs), son las siguientes:- Universidades- Centros de investigación- Gobierno- Editores de libros y colecciones de bibliotecas- Repositorios digitalesLos tipos de documentos recuperadors (output) son:- Páginas web y documentos académicos- Artículos de publicaciones científicas- Trabajos académicos (tesis doctorales, etc).- Patentes y libros
Principales
Google Scholar
Este buscador, perteneciente a Google, amplía la tipología de documentos (patentes no), nos da un mayor número y nos permite el acceso a libros completos. Se caracteriza por su análisis de las citas y las opciones de ranking y navegación.
Scirus
El buscador Scirus, creado en 2001, contenía más de 450 millones de documentos en el año 2009. Propiedad de la editorial Elsevier, se caracteriza por sus avanzadas opciones de búsqueda. Acude a reconocidas Bases de Datos como ScienceDirect o Scopus para ofrecer sus contenidos.
Science Research
Desarollado con Deep Web Technologies, este buscador utiliza la búsqueda federada (un metabuscador). Con capacidad de abarcar casi 400 fuentes, accede a colecciones de asociaciones, repositorios, revistas científicas y motores de búsqueda especializados. Se caracteriza por la redundancia de los resultados obtenidos.Para más información sobre este recurso:http://www.lluiscodina.com/scienceResearch.pdf
aBuscadores de libros
Aparecen cuando las editoriales empiezan a incorporar los libros electrónicos (principalmente académicos) y se desarrollan varias plataformas para el acceso a contenidos digitales.
Google Books
El presente/futuro
Amazon Kindle
Sony Reader Digital Book
Apple iPad
Google ebookstore
Buscadores de blogs
Blogsearch de Google
Technorati
Otros
Plataformas de contenidos digitales
NetLibrary
Safari Books Online
Ebrary Discover
Amazon.com
Búsqueda de informes
Dada la importancia de la información económica y empresarial en la sociedad actual, los informes y estudios de mercado son un producto elaborado muy útil. El principal inconveniente de estos recursos es que es de pago.
ESADE Knowledge
Recurso más importante de la búsqueda de información sectorial y empresarial a nivel español.
aICEX
El ICEX (Instituto Español de Comercio Exterior) ofrece información sobre oferta de productos españoles y sobre mercados interacionales.
Metabuscadores
¿Qué son?
Son herramientas para la búsqueda en la web utilizando los índices de varios buscadores a la vez. Cogen el mejor resultado que les ofrecen los diferentes buscadores para una misma consulta. Esto tiene sentido debido a la constatación que la coincidencia en los primeros resultados de los principales buscadores es menor del 20%.
Ventajas e inconveninentes
Las principales ventajas que presentan son que evitan a los usuarios tener que hacer la misma consulta en diferentes buscadores y que ofrecen los mejores resultados de todos ellos. Los inconvenientes, que se pone en duda la calidad de sus buscadores.
Destacados
Metacrawler
Dogpile
Yippy
Carrot
Semánticos
Estos buscadores, también llamados "inteligentes" se caracterizan porque analizan el significado del grupo de palabras introducido, no se basan en las etiquetas actuales. Pese a que su uso todavía no es generalizado, funcionan bien a través de palabras clave.
Wolpramalpha
Lexxe
Web
Sistema de hipertexto que funciona en Internet, permitiendo la consulta de información y la navegación a través de sus páginas.
Web invisible
Aquellas páginas que escapan de los índices de los buscadores generalistas. Normalmente son aquellas que no tienen enlaces o que estan en capas demasiado profundas del sitio web.
Web 2.0
Término utilizado para hablar de la nueva web desde el punto conceptual. Tiene una gran dimensión social i comunicativa, plasmada en las redes sociales, los blogs, los fotos, etc. El debate se centra ahora en la existencia o no de una Web 3.0
Web semántica
Evolución de la web actual a una nueva web que busca que sus contenidos sean compendidos por máquinas.