En el vasto mundo de internet, existe una porción significativa conocida como la Web Invisible, la cual no es fácilmente accesible a través de los motores de búsqueda convencionales.
Páginas excluídas: hay algunos tipos de páginas que las compañías de motores de
búsqueda excluyen por política. No hay ninguna razón técnica para no incluirlas si
ellos quieren. Es un asunto de seleccionar qué y qué no incluir en bases de datos que
ya son enormes, costosas de operar, y poco productoras de ingresos.
- Base de datos con opción de búsqueda:La mayoría de la web invisible está compuesta de contenidos de miles de bases de datos especializadas con opción de
búsqueda que se pueden buscar vía la web. Los resultados de búsqueda de muchas
de estas bases de datos son entregadas en páginas web que son sólo para tu
búsqueda
¿Qué es la Web Invisible? La
"web invisible" es lo que no se puede recuperar ("ver") en los resultados de búsqueda y
otros links contenidos en estos tipos de herramientas.
¿Cómo Encontrar la Web Invisible?Simplemente piensa "bases de datos" y mantén tus ojos abiertos: Es posible encontrar bases de datos con opción de búsqueda Utilice Google y otros motores de búsqueda para localizar bases de datos con opción de
búsqueda, utilizando un término que defina un tema y la palabra "database". Si la base de datos utiliza la palabra "database" en sus propias páginas, es probable encontrarla en
Google
¿POR QUE ALGUNAS PAGINAS SON INVISIBLES? Hay dos razones por las cuales un motor de búsqueda no contiene una página: (1) barreras técnicas que prohiben el acceso y (2) escogencias o decisiones para excluirla.
Páginas basadas en SCRIPT:Un script es un tipo
de lenguaje de programación que puede ser utilizado para traer ir mostrar páginas
web. Hay muchos tipos y usos de scripts en la Web. Ellos pueden ser utilizados para
crear toda o parte de una página web
CATEGORIA 4:contenidos son generados
completamente en script: Google. No hay URLs estáticas en estos sitios para
el tipo de cosas que se puede acceder buscando, y si las hubiera, los spiders
de los motores de búsqueda escogerían no indexarlos. Ellos son doblemente
invisibles (por un lado caen en la Categoría 1, y por el otro, son excluídos
por política).
CATEGORIA 3:Las páginas formateadas en PDF y otras páginas escritas
utilizando muy poco o nada de texto HTML. A los motores de búsqueda
también les es difícil indexar los contenidos de los documentos en Flash,
Shockwave, y otros programas como Word, WordPerfect, PowerPoint, etc.
CATEGORIA 2:Requieren contraseña o login. Todos los sitios que requieren
una contraseña o un login están cerrados para los spiders de los motores de búsqueda debido a que requieren mecanografiar algo que los spiders nopueden "saber
".
CATEGORIA 1: el contenido de bases de datos especializadas con opción de
búsqueda puede ser enteramente o parcialmente invisible o visible,
dependiendo de cuánto está contenido en páginas estáticas con enlaces.
Topic principal
EJEMPLOS PARA GOOGLE Y YAHOO:
Recuerda que la Web Invisible existe. Recuerda que, además de lo que se encuentra en los
resultados de los motores de búsqueda y la mayoría de directorios, existen estas minas de
oro que debes buscar directamente