作者:Alex Sánchez Aragón 11 年以前
214
更多类似内容
¿Qué es la Web?
La web es un sistema hipertexto que funciona sobre Internet, permitiendo la consulta de documentos o páginas web y la navegación a través de las mismas.
Web invisible: constituyen esta web todas aquellas páginas que escapan a los índices de los motores de búsqueda generalistas. Ej: páginas generadas dinámicamente como Amazon; "no existen".
Web 2.0: es el término acuñado para referirse a las plataformas, aplicaciones y herramientas caracterizadas por su dimensión social y comunicativa. Ej: blogs, redes sociales, foros, wikis, etc
Web Semántica: evolución tecnológica de la web actual hacia una nueva web que persigue la comprensión de sus contenidos por las máquinas. Se calcula que en 2015 las máquinas lo podrán descifrar todo.
Son herramientas que permiten realizar consultas y recuperar información contenida en la Web. Principal herramienta para navegar por Internet.
Ordenación de los resultados, es decir, la construcción del ranking de resultados en función de unos criterios de relevancia como los enlaces, las propiedades de la página (ubicación, formato de las palabras clave...) y la diferenciación entre resultados pagados y no pagados.
Hace referencia al uso de palabras clave, ya sea mediante la búsqueda simple o la avanzada, introduciendo booleanos o filtros.
Funciona según las veces que se repite cada término de la búsqueda.
Explora la web de forma sistemática con dos objetivos:
- Interactuar con los servidores de sitios web para descargar páginas web u otros documentos y
- Obtener nuevas direcciones (URL) para añadir a su lista de enlaces pendientes de revisar
- Acceder a sitios web, localizar y descargar documentos.
- Extraer el contenido textual (y multimedia) de los documentos descargados.
- Analizar e indexar el contenido de los documentos para construir los índices del motor.
- Realizar el análisis de enlaces de cada página y otorgar alguna medida de popularidad.
- Permitir la formulación de consultas mediante palabras clave.
- Facilitar el acceso a los resultados de una consulta ordenándolos conforme a unos criterios de relevancia.
¡¡¡TODO DE GOOGLE!!!
La información de carácter económico o empresarial constituye hoy uno de los factores críticos de cualquier institución.
El producto más elaborado que podemos obtener dentro de este tipo de informaciones son los informes y los estudios de mercado.
Previo pago.
Desarrollo de plataformas para el acceso a los contenidos digitales.
NetLibrary (http://www.netlibrary.com/)
Safari Books online (http://my.safaribooksonline.com/)
Ebrary Discover (http://shop.ebrary.com/)
Amazon.com (http://www.amazon.com/)
Google books, solución más destacada.
Presente/futuro: Amazon Kindle, Sony Reader Digital Book, Apple Ipad, Google ebookstore
Sólo indexa sitios académicos, como Universidades, Centros de investigación, Gobierno, Editores de libros y revistas, Colecciones de bibliotecas o Repositorios digitales
Es un metabuscador que acude a casi 400 fuentes (repositorios, asociaciones, editoriales y motores de búsqueda especializados).
Redundancia en los resultados obtenidos
Amplía la timpología de documentos (sin patentes).
Mayor número de documentos, pero sin información precisa.
Acceso a libros completos.
Análisis de citas.
Opciones de ranking y navegación.
Limita su ámbito de búsqueda a un dominio concreto, con el objetivo de proporcionar a sus usuarios acceso a los contenidos de calidad que sobre su área de especialización hay en la web
Mayor funcionalidad y potencial de búsqueda mediante el uso de interfaces adaptados a dominio específico que cubren.
Es bastante cansado ir a uno y otro en función de lo que buscamos. Nada práctico.
Son capaces de indexar los contenidos de su especialización incluso cuando estos están ubicados en la web invisible.
Son herramientas para la búsqueda de recursos web que utilizan los índices de varios buscadores para satisfacer las consultas de sus usuarios.
Intenta recoger los mejores resultados que ofrecen diferentes buscadores para una consulta.
Justificación: constatación de que la coincidencia en los primeros resultados de los principales buscadores está por debajo del 20%.
Imprecisión de si los buscadores que utiliza el metabuscador son de calidad.
Evitar que los usuarios realicen su consulta en varios buscadores.
Obtener los mejores resultados de diversos buscadores.