カテゴリー 全て - información - buscadores - relevancia - semánticos

によって Lorena Velasco 11年前.

173

Búsqueda de información en la web

Los buscadores son herramientas esenciales para recuperar información en internet, facilitando la navegación mediante enlaces. Se componen de cuatro programas: el rastreador o spider, que explora y obtiene nuevas URL; el sistema de recuperación de información, que indexa conceptos; la interfaz, que permite búsquedas simples y avanzadas diferenciando entre resultados pagados y no pagados; y el software de relevancia, que ordena los resultados basándose en criterios de importancia como enlaces y contenido pagado.

Búsqueda de información en la web

Búsqueda de información en la web

Web

Sistema de hipertexto que funciona en Internet, permitiendo la consulta de información y la navegación a través de sus páginas.

Web semántica

Evolución de la web actual a una nueva web que busca que sus contenidos sean compendidos por máquinas.

Web 2.0

Término utilizado para hablar de la nueva web desde el punto conceptual. Tiene una gran dimensión social i comunicativa, plasmada en las redes sociales, los blogs, los fotos, etc.

El debate se centra ahora en la existencia o no de una Web 3.0

Web invisible

Aquellas páginas que escapan de los índices de los buscadores generalistas. Normalmente son aquellas que no tienen enlaces o que estan en capas demasiado profundas del sitio web.

Buscadores

Semánticos

Estos buscadores, también llamados "inteligentes" se caracterizan porque analizan el significado del grupo de palabras introducido, no se basan en las etiquetas actuales. Pese a que su uso todavía no es generalizado, funcionan bien a través de palabras clave.

Lexxe
Wolpramalpha
Especializados

Los buscadores especializados limitan su ámbito de búsqueda a un dominio concreto para proporcionar a sus usuarios contenidos de calidad sobre un área especializado/ concreto de la web. Van mucho más allá de la búsqueda simple ofrecida por los buscadores generalistas.

Las principales ventajas que presentan son su capacidad de buscar páginas no indexadas por los buscadores generalistas (accediendo incluso a la web invisible) y una mayor funcionalidad y potencia. Como inconveniente, destacar que debemos acudir a un buscador u otro dependiendo de la temática de nuestro interés.

Tipología

Otros

Metabuscadores

Destacados

Carrot

Yippy

Dogpile

Metacrawler

Ventajas e inconveninentes

Las principales ventajas que presentan son que evitan a los usuarios tener que hacer la misma consulta en diferentes buscadores y que ofrecen los mejores resultados de todos ellos.

Los inconvenientes, que se pone en duda la calidad de sus buscadores.

Son herramientas para la búsqueda en la web utilizando los índices de varios buscadores a la vez. Cogen el mejor resultado que les ofrecen los diferentes buscadores para una misma consulta. Esto tiene sentido debido a la constatación que la coincidencia en los primeros resultados de los principales buscadores es menor del 20%.

Búsqueda de informes

Dada la importancia de la información económica y empresarial en la sociedad actual, los informes y estudios de mercado son un producto elaborado muy útil. El principal inconveniente de estos recursos es que es de pago.

ICEX

El ICEX (Instituto Español de Comercio Exterior) ofrece información sobre oferta de productos españoles y sobre mercados interacionales.

ESADE Knowledge

Recurso más importante de la búsqueda de información sectorial y empresarial a nivel español.

Plataformas de contenidos digitales

Amazon.com

Ebrary Discover

Safari Books Online

NetLibrary

Buscadores de blogs

Technorati

Blogsearch de Google

Buscadores de libros

Aparecen cuando las editoriales empiezan a incorporar los libros electrónicos (principalmente académicos) y se desarrollan varias plataformas para el acceso a contenidos digitales.

El presente/futuro

Google ebookstore

Apple iPad

Sony Reader Digital Book

Amazon Kindle

Google Books

Buscadores académicos

Estos buscadores solo indizan sitios web vinculados al mundo acadámico. Sus fuentes de información (inputs), son las siguientes:

- Universidades

- Centros de investigación

- Gobierno

- Editores de libros y colecciones de bibliotecas

- Repositorios digitales

Los tipos de documentos recuperadors (output) son:

- Páginas web y documentos académicos

- Artículos de publicaciones científicas

- Trabajos académicos (tesis doctorales, etc).

- Patentes y libros

Principales

Science Research

Desarollado con Deep Web Technologies, este buscador utiliza la búsqueda federada (un metabuscador). Con capacidad de abarcar casi 400 fuentes, accede a colecciones de asociaciones, repositorios, revistas científicas y motores de búsqueda especializados. Se caracteriza por la redundancia de los resultados obtenidos.

Para más información sobre este recurso:

http://www.lluiscodina.com/scienceResearch.pdf

Scirus

El buscador Scirus, creado en 2001, contenía más de 450 millones de documentos en el año 2009. Propiedad de la editorial Elsevier, se caracteriza por sus avanzadas opciones de búsqueda. Acude a reconocidas Bases de Datos como ScienceDirect o Scopus para ofrecer sus contenidos.

Google Scholar

Este buscador, perteneciente a Google, amplía la tipología de documentos (patentes no), nos da un mayor número y nos permite el acceso a libros completos. Se caracteriza por su análisis de las citas y las opciones de ranking y navegación.

Generalistas
Yahoo!

En esta dirección encontraréis toda la información sobre Yahoo! España:

http://es.docs.yahoo.com/companysite/

Bing

Ask

En esta web encontraréis toda la información sobre Ask.com España:

http://about.es.ask.com/es/docs/about/sitefeatures.shtml

Google

En esta dirección encontraréis toda la información necesaria sobre el buscador de Google:

http://www.google.es/intl/es/about/

Información teórica
Componentes

Estan formados por los siguientes 4 programas:

1. Rastreador o Spider: explora la web para obtener documentos y nuevas URL.

2. Sistema de recuperación de la información: a través de una lista de conceptos indexada

3. Interfaz: mediante las palabras clave. Normalmente ofrecen al usuario la búsqueda simple y la avanzada (con operadores booleanos, filtros, etc.). En ella también se diferencia entre los resultados pagados (anuncios) y los no pagados (patrocinados). Nos organiza las informaciones en un ranking con información sobre el documento que nos enlaza (título, descripción, URL, etc.)

4. Software de relevancia: se encarga de la ordenación de resultados mediante un ranking con criterios de relevancia. Algunos de ellos son los enlaces, los contenidos pagados y determinadas propiedades de la página.

Funciones

Sus principales funciones son las siguientes:

1. Acceder a sitios web para proporcionar documentos

2. Extraer el contenido textual y multimedia de éstos

3. Indexar los contenidos

4. Analizar los enlaces y ordenarlos por popularidad

5. Formulación de consultas con palabras clave

6. Facilitar las consultas ordenando los resultados por relevancia

¿Qué son?

Los buscadores son herramientas para hacer consultas y recuperar información de la web. Son la principal herramienta para navegar por Internet, ya que nos facilitan la información a través de los enlaces que nos proporcionan.