Búsqueda en la Web

Funciones de un motor de búsqueda

Acceder a sitios web, localizar y descargar documentos.

Extraer el contenido textual (y multimedia) de los documentos descargados

Analizar e indexar el contenido de los documentos para construir los índices del motor.

Realizar el análisis de enlaces de cada página y otorgar alguna medida de popularidad.

Permitir la formulación de consultas mediante palabras clave

Facilitar el acceso a los resultados de una consulta ordenándolos conforme a unos criterios de relevancia.

componentes de los búscadores

Rastreador del motor de búsqueda o Spider

r

dos objetivos principales: 1.Interactuar con los servidores de sitios web para descargar páginas web u otros documentos y 2.Obtener nuevas direcciones (URL) para añadir a su lista de enlaces pendientes de revisar.

Sistema de recuperación de información

Índices directos

Índices invertidos

Interfaz

Formulario de consulta

r

Los motores de búsqueda se interrogan utilizando palabras clave.

Búsqueda simple.

Búsqueda avanzada:

Búsqueda booleana

Búsqueda por campos

Filtros

Minería de datos

Página de resultados

Interfaz – PR (I)

r

Resultados pagados vs. Resultados no pagados: enlaces patrocinados

Interfaz – PR (II)

r

Presenta la lista de documentos organizados en un ranking. Ofrece las siguientes informaciones:1.Título de la página (o del documento).2.El tipo del documento (cuando no es HTML).3.Unas líneas de descripción del contenido del documento.4.URL de la página.5.Tamaño de la página web.

Interfaz – PR (III)

r

Opciones:Filtros por formato, ubicación, fecha, etc.Navegación secuencial entre los resultados o yendo a una página de resultados concreta (hasta la página 90 más o menos).etc.

Software de relevancia

r

Su función es la ordenación de los resultados, es decir, la construcción del ranking de resultados en función de unos criterios de relevancia

Enlaces: enlaces de entrada y URL.

Contenido/Propiedades de la página: frecuencia / ubicación / formato de las palabras clave, etc.

Resultados pagados y Resultados no pagados

Metabuscadores

r

Son herramientas para la búsqueda de recursos web que utilizan los índices de varios buscadores para satisfacer las consultas de sus usuarios.Idea principal: recoger los mejores resultados que ofrecen diferentes buscadores para una consulta.

Ventajas-Inconvenientes

Ventajas

r

1.Evitar que los usuarios realicen su consulta en varios buscadores2.Obtener los mejores resultados de diversos buscadores

Inconvenientes

r

¿Son de calidad los buscadores que utiliza el metabuscador?

Principales Metabuscadores

Tradicionales:

Metacrawler

a

dogpile

a

De agrupamiento

Yippy

Visuales

Carrot

búscadores generalistas

r

que compiten entre sí para atraer a los usuarios.

Google

Yahoo!

Bing

Ask.com

a

Búscadores especializados

r

Un buscador especializado (BE) es aquel que limita su ámbito de búsqueda a un dominio concreto, con el objetivo de proporcionar a sus usuarios acceso a los contenidos de calidad que sobre su área de especialización hay en la web.

búscadores académicos

google academico

r

Contexto:GoogleAmplia tipología de documentos (sin patentes)Mayor número de documentos, pero sin información precisaAcceso a libros completos (acuerdos con bibliotecas)Características especiales:Análisis de citasOpciones de ranking y navegación

Scirus

r

ContextoEditorial Elsevier, parte de Reed-ElsevierScienceDirectScopusCreado en el 2001Amplia tipología de documentos (sin libros y referencias)450 millones de documentos a inicios del 2009Características especialesOpciones de búsqueda

Science Reseach

r

ContextoDesarrollo de Deep Web TechnologiesUtiliza la búsqueda federada (es decir, es un metabuscador)Características especiales:Acude a casi 400 fuentes: Colecciones de asociaciones Repositorios Editoriales y revistas científicas Motores de búsqueda especializadosRedundancia en los resultados obtenidos

a

Microsoft Academic Search

a

Buscadores de libros

NetLibrary

a

Safari Books online

a

Ebrary Discover

a

Amazon.com

Solución más destacada

Google búsqueda de libros

Buscadores de blogs

Google Búsqueda de blogs

Búsqueda de informes

ESADE Knowledge:

r

en España es probablemente el recurso más importante para la búsqueda de información sectorial y empresarial.

a

ICEX (Instituto Expañol de Comercio Exterior)

r

elabora y difunde información sobre la oferta de productos españoles, y sobre mercados internacionales.

búscadores de contenidos audiovisual

La búsqueda de imágenes

Motores de búsqueda

Google imágenes

Bing imágenes

Bancos de imágenes comerciales

AGE Fotostock (a nivel nacional)

Getty:

Corbis:

Dos principales modelos de negocio
:Macro y Micro

Macrostock

r

Los más importantes Sectores Creativo > Fotografía de stock Editorial > Fotografía de encargoLicencias Royalty free Right managedFotógrafos: poco accesibles pero mayores ingresosEmpresas: alta calidad y mucha exclusividad (sector editorial), pero precios más altos

Microstock

r

Sector creativoRoyalty freeEmpresas: low costFotográfos: menos ingresos pero más oportunidadesHan generado una nueva industria de software: (1) programas para crear, seleccionar y asignar palabras clave a las imágenes; (2) programas para la subida de colecciones de imágenes

Sutterstock

Fotolia

a

Dreamstime

Repositorios abiertos

r

Búsqueda mediante palabras clave.Emparejamiento contra el etiquetado de las imágenes realizado por los autores.Opciones de búsqueda avanzada muy limitadas

Flickr Creative Commons

r

Buena opción

MorgueFile:

r

Buena opción

Bancos de Vídeo

Footage 1

r

Sector creativo:Clips Suelen: Durar un minuto o menos Sin sonido Sin editarSector editorial:Grabaciones de vídeo actuales e históricas Pueden: Tener audio Durar varios minutos Estar editados Presentar una enorme exclusividad y/o valor histórico

Footage 2

Sistemas comerciales:

BBC Motion Gallery

Geety Images > Films

Corbis > Motion

Repositoros y sistemas abiertos

Archive.org > Movies

Stock Footage for free

a

Búsqueda de sonido

Buscadores

FindSounds

Sistemas comerciales

Sonomic

a

iStockphoto

a

AudioMicro

a

Sounddogs

Creative Commons

Videotutorial en inglés

Videotutorial en castellano

Las licencias

r

importante

a