Web Invisible
Saber Más Acerca de la Web Invisible...
Otros links de posible interés sobre la Web Invisible están disponibles bajo este tópico en About.com
http://library.rider.edu/scholarly/rlackie/Invisible/Inv_Web.html
Una discusión inteligente puede encontrarse en: Robert J. Lackie, Those Dark Hiding Places: The "Invisible Web" Revealed
Presentación clara de los aspectos básicos con bibliografía: Invisible Web de Liane Luckman.
La Ambigüedad Inherente a la Web Invisible...
Hay variosfactores involucrados...
Cuáles sitios replican algunos de sus contenidos en páginas estáticas (híbridos de visible e invisible en alguna combinación).
- Los motores de búsqueda pueden cambiar sus políticas sobre qué excluir y qué incluir.
- A menudo no sabes si una página tiene un ? en su URL hasta después que la has encontrado de alguna manera (excluída por política).
- Cuáles no replican nada y deben ser buscadas directamente (totalmente invisible).
- Cuáles replican todo (visible en los motores de búsqueda si se construye una búsqueda que coincida con la página).
Es muy difícil predecir qué sitios o tipos de sitios o porciones de sitios serán o no parte de la Web Invisible.
Páginas basadas en SCRIPT...
Un ejemplo...
un sitio que utiliza parcialmente scripts es Librarians'
Index.
bases de datos cuyos contenidos son generados
completamente en script: Google.
Categoria 4...
Páginas basadas en script, que llevan un "chivato", en su
URL
Si los spiders encuentran un ? en una URL o enlace, están
programados para retirarse.
Ellos pobremente encuentran script escrito o "trampas
de araña" intencionales diseñadas para atrapar spiders (arañas).
Un script es un tipo de lenguaje de programación que puede ser utilizado para traer ir mostrar páginas web. Hay muchos tipos y usos de scripts en la Web.
Ellos pueden ser utilizados para crear toda o parte de una página web, y para comunicarse con bases de datos con
opción de búsqueda.
Páginas que el motor de búsqueda escoge excluir:
Excepciones...
Google ahora tiene la habilidad de buscar el texto completo de muchos archivos PDF convirtiendo estos archivos a texto, y colocando el texto en
HTML de manera que pueda trabajar como una página web ordinaria en la base de datos de Google
Categoria 3...
Las páginas formateadas en PDF y otras páginas escritas
utilizando muy poco o nada de texto HTML
Las bases de datos y spiders de los motores de búsqueda están optimizados para "leer" HTML, el lenguaje básico de la Web.
Los motores de búsqueda pueden escoger no incluir
páginas porque el formato del documento sería buscado raras veces o sin éxito por los usuarios del motor de búsqueda.
Formato de la página...
¿Por qué Algunas Páginas son Invisibles?
Hay dos razones por las cuales un motor de búsqueda no contiene una página.
1._ barreras
técnicas que prohiben el acceso.
2.-escogencias o decisiones para excluirla.
Ejemplos de Yahoo y Google...
toxic chemicals database
languages database
plane crash database
Yahoo
Yahoo! Utiliza el término para describir las bases de datos con opción de búsqueda en sus listados.
google
Utilice Google y otros motores de búsqueda para localizar bases de datos con opción de
búsqueda, utilizando un término que defina un tema y la palabra "database".
1. Barreras técnicas:
categoria 2...
Spiders de los motores de búsqueda debido a que requieren mecanografiar algo que los spiders no
pueden "saber".
Ejemplos...
de sitios con bases de datos con opción de búsqueda incluyen a la mayoría de los motores de búsqueda como Google o Northern Light o
AltaVista.
Categoría 1...
el contenido de bases de datos especializadas con opción de
búsqueda puede ser enteramente o parcialmente invisible o visible, dependiendo de cuánto está contenido en páginas estáticas con enlaces.
¿Por que?
Las bases de datos de los motores de búsqueda son creadas por programas robot llamados spiders (arañas), programas robot de computación que se
arrastran por la web buscando el contenido de los motores de búsqueda.
Si la única manera de acceder
páginas web requiere que se mecanografíe algo o se examine una página y se
seleccione una combinación de opciones, los motores de búsqueda son incapaces
de proceder.
Los mejores directorios y listas de
bases de datos con opción de búsqueda en la web general...
Complete Planet
Búsquedas utilizando frases,
operadores Boolean y Stems.
IncyWincy
Colección de páginas web,
directorios y algunas bases de
datos con opción de búsqueda
obtenidas del "DMOZ Open
Directory".
Internets
Busca un concepto o tópico.
Mantener las búsquedas amplias.
The Invisible WebCatalog
Búsqueda rápida de conceptos o
tópicos. Búsqueda avanzada
permite Boolean y otras
búsquedas.
Direct Search
Elaborada por un bibliotecario
académico con la investigación en
mente.
¿Cómo Encontrar la Web Invisible?
Los de valor particular en
investigación académica son:
Infomine
AcademicInfo
-Librarians Index
Es posible encontrar bases de datos con opción de búsqueda y otras cosas de la web invisible en el transcurso de búsquedas rutinarias en los directorios web más generales.
¿Que es una red invisible?
Páginas excluídas...
hay algunos tipos de páginas que las compañías de motores de búsqueda excluyen por política.
Base de datos con opción de búsqueda...
La mayoría de la web invisible está
compuesta de contenidos de miles de bases de datos especializadas con opción de
búsqueda que se pueden buscar vía la web.
es lo que se ve en las páginas resultantes de los motores de búsqueda generales de la web.