Kategoriak: All - ambigüedad - barreras - bases - páginas

arabera angelica martinez 7 years ago

168

Web Invisible

El concepto de la web invisible abarca aquellos contenidos en línea que no son indexados por los motores de búsqueda tradicionales. Este tipo de web incluye páginas que no son fácilmente accesibles debido a barreras técnicas o decisiones deliberadas de exclusión por parte de los motores de búsqueda.

Web Invisible

Web Invisible

Saber Más Acerca de la Web Invisible...

Otros links de posible interés sobre la Web Invisible están disponibles bajo este tópico en About.com
http://library.rider.edu/scholarly/rlackie/Invisible/Inv_Web.html
Una discusión inteligente puede encontrarse en: Robert J. Lackie, Those Dark Hiding Places: The "Invisible Web" Revealed
Presentación clara de los aspectos básicos con bibliografía: Invisible Web de Liane Luckman.

La Ambigüedad Inherente a la Web Invisible...

Hay variosfactores involucrados...
Cuáles sitios replican algunos de sus contenidos en páginas estáticas (híbridos de visible e invisible en alguna combinación).

- Los motores de búsqueda pueden cambiar sus políticas sobre qué excluir y qué incluir.

- A menudo no sabes si una página tiene un ? en su URL hasta después que la has encontrado de alguna manera (excluída por política).

- Cuáles no replican nada y deben ser buscadas directamente (totalmente invisible).

- Cuáles replican todo (visible en los motores de búsqueda si se construye una búsqueda que coincida con la página).

Es muy difícil predecir qué sitios o tipos de sitios o porciones de sitios serán o no parte de la Web Invisible.

Páginas basadas en SCRIPT...

Un ejemplo...
un sitio que utiliza parcialmente scripts es Librarians' Index.
bases de datos cuyos contenidos son generados completamente en script: Google.
Categoria 4...
Páginas basadas en script, que llevan un "chivato", en su URL
Si los spiders encuentran un ? en una URL o enlace, están programados para retirarse.

Ellos pobremente encuentran script escrito o "trampas de araña" intencionales diseñadas para atrapar spiders (arañas).

Un script es un tipo de lenguaje de programación que puede ser utilizado para traer ir mostrar páginas web. Hay muchos tipos y usos de scripts en la Web.
Ellos pueden ser utilizados para crear toda o parte de una página web, y para comunicarse con bases de datos con opción de búsqueda.

Páginas que el motor de búsqueda escoge excluir:

Excepciones...
Google ahora tiene la habilidad de buscar el texto completo de muchos archivos PDF convirtiendo estos archivos a texto, y colocando el texto en HTML de manera que pueda trabajar como una página web ordinaria en la base de datos de Google
Categoria 3...
Las páginas formateadas en PDF y otras páginas escritas utilizando muy poco o nada de texto HTML
Las bases de datos y spiders de los motores de búsqueda están optimizados para "leer" HTML, el lenguaje básico de la Web.
Los motores de búsqueda pueden escoger no incluir páginas porque el formato del documento sería buscado raras veces o sin éxito por los usuarios del motor de búsqueda.
Formato de la página...

¿Por qué Algunas Páginas son Invisibles?

Hay dos razones por las cuales un motor de búsqueda no contiene una página.
1._ barreras técnicas que prohiben el acceso.

2.-escogencias o decisiones para excluirla.

Ejemplos de Yahoo y Google...

toxic chemicals database
languages database
plane crash database

Yahoo

Yahoo! Utiliza el término para describir las bases de datos con opción de búsqueda en sus listados.

google

Utilice Google y otros motores de búsqueda para localizar bases de datos con opción de búsqueda, utilizando un término que defina un tema y la palabra "database".

1. Barreras técnicas:

categoria 2...
Spiders de los motores de búsqueda debido a que requieren mecanografiar algo que los spiders no pueden "saber".
Ejemplos...
de sitios con bases de datos con opción de búsqueda incluyen a la mayoría de los motores de búsqueda como Google o Northern Light o AltaVista.
Categoría 1...
el contenido de bases de datos especializadas con opción de búsqueda puede ser enteramente o parcialmente invisible o visible, dependiendo de cuánto está contenido en páginas estáticas con enlaces.
¿Por que?
Las bases de datos de los motores de búsqueda son creadas por programas robot llamados spiders (arañas), programas robot de computación que se arrastran por la web buscando el contenido de los motores de búsqueda.
Si la única manera de acceder páginas web requiere que se mecanografíe algo o se examine una página y se seleccione una combinación de opciones, los motores de búsqueda son incapaces de proceder.

Los mejores directorios y listas de bases de datos con opción de búsqueda en la web general...

Complete Planet
Búsquedas utilizando frases, operadores Boolean y Stems.
IncyWincy
Colección de páginas web, directorios y algunas bases de datos con opción de búsqueda obtenidas del "DMOZ Open Directory".
Internets
Busca un concepto o tópico. Mantener las búsquedas amplias.
The Invisible WebCatalog
Búsqueda rápida de conceptos o tópicos. Búsqueda avanzada permite Boolean y otras búsquedas.
Direct Search
Elaborada por un bibliotecario académico con la investigación en mente.

¿Cómo Encontrar la Web Invisible?

Los de valor particular en investigación académica son:
Infomine
AcademicInfo
-Librarians Index
Es posible encontrar bases de datos con opción de búsqueda y otras cosas de la web invisible en el transcurso de búsquedas rutinarias en los directorios web más generales.

¿Que es una red invisible?

Páginas excluídas...
hay algunos tipos de páginas que las compañías de motores de búsqueda excluyen por política.
Base de datos con opción de búsqueda...
La mayoría de la web invisible está compuesta de contenidos de miles de bases de datos especializadas con opción de búsqueda que se pueden buscar vía la web.
es lo que se ve en las páginas resultantes de los motores de búsqueda generales de la web.