00u
E.) Datos y consulta
Acceso a formatos no indexables por la internet superficial
Gran parte de la información esta compuesta por bases de datos en general e información cientifica
Bases de datos de universidades, grandes centros de investigación y retenedores de información en general
No funciona mediante bases de datos
Páginas dinámicas
Información generada a partir de una petición
Mayor cantidad de información que la internet superficial
Inabarcabilidad de información en bases de datos
Acceso de información por profundidad
Menos información que en la deep web
Crecimiento de contenido más rápido que alguna forma de almacenar con coherencia
F.) Buscadores
Tipos
Motores de búsqueda
Ejemplo: Google
Acceso a resultados mediante palabras claves
Indizado automático hecho por arañas o crawlers
Uso de robots para indizar páginas web y agregarlas a la base de datos
Indizan todas las páginas de un sitio, no solo el título y la descripción
Directorios
Ejemplo: Yahoo
Clasifican la información por temas y subtemas
Analizan fuentes y sugerencias del usuario
Revisados por personas
Cantidad de contenido mucho menor
Clasifican según título y descripción del sitio
Búsqueda de información personalizada por los gustos de la persona
Función
Localizar, recuperar e Indexar información
Categorizar información mediante Bots o crawlers
Dirigirnos hacia un resultado según la búsqueda que hagamos
Limitaciones para acceder a información científica
El buscador define que páginas son más importantes que otras
Basado en criterios pero susceptible a la subjetividad
Los usuarios manifiestan no encontrar la información que solicitan
Baja cobertura de los servicios de la red
Limitaciones para indexar toda la información
Información reducida, oculta
Incapacidad para cubrir la información
Aunque en buscadores como google hay una reducción de estos problemas y con uso de páginas dinámicas
Noción de gatekeeping
Demora en la cadena comunicacional de la información
Limitación para leer formatos como el PDF, entre otros
G.) Consulta de documentos e información en la internet invisible
Haciendo una búsqueda directa
Accediendo a bases de datos de universidades, centros de investigación, entre otros
En la Web propietaria
Registrarse o suscribirse a una fuente de informacion
Ejemplo: Icesi que cuenta con 72 suscripciones para acceder a contenido
95% de contenido libre y gratuito
Admisión de formatos no legibles u olvidados por las arañas
H.) Recursos de información de la red invisible
Calculadoras 2%
Trabajos 1%
Mensajes/chat
Búsquedas generales
1%
Intranet
12%
Publicaciones
11%
Bases de datos tematicas
54%
Compras/subastas
Anuncios clasificados
5%
Portales
3%
Bibliotecas
Páginas blancas/amarillas
2%
Guia 1 Mindomo Santiago Zapata Arias 11C Tecnología- Colegio San Luis rey
Topic principal
D.) Comparación de disposición de información de tipo académica y científica
Internet invisible
Acceso a mayor cantidad de bases de datos e información en general, de alta calidad y avaladas por instituciones confiables, que también tienen sitios en el internet invisible, como es el caso de la RAE y su diccionario, la NASA y de todo tipo, el internet superficial no usa base de datos, en cambio genera páginas dinámicas para acceder a la información solicitada
Internet superficial
Contiene información válida, pero por sus sistema solo nos permite acceder a un pequeño porcentaje de la información que contiene, y esa información es menor a la que tiene la internet invisible, todo porque a internet visible es una base de datos indexados que prioriza unos datos sobre otros, y en consecuencia muchas páginas no han sido visitadas
C.) Clasificación de la internet invisible
Web realmente invisible
Este contenido no puede ser indexado por los buscadores, pies los robots no reconocen el formato, la página se auto diseña
Web propietaria
Contenido semi-abierto, con acceso mediante registro, cuya información no es indexada por los buscadores, muchas veces se hace esto con ánimo de lucro, sin embargo el 95% del contenido de la web profunda está libre
Web privada
Información indexable pero para uso interno (no público), que se publica, buscando no ser indexada (en algunas partes del archivo) y con acceso restringido o simplemente se blinda la información con contraseñas
Web opaca
Páginas que pueden ser indexadas pero no son incluidas en la web superficial, ya sea porque están en una parte demasiado interna del a web, por pocas visitas, por exceso de resultados a una consulta, o por un error del robot del buscador
B.) Internet Invisible
¿Por que existe?
Existen motivos diversos, desde cobertura, motivos legales, gusto personal, legibilidad de formatos, entre otros, la web superficial, jerarquiza las páginas que preferiblemente vamos a ver, para mediados de la década de los 200, 6 de cada 10 páginas no habían sido visitadas, el tema del anonimato tiene muchas caras, puede ayudar a realizar actividades ilegales o escapar de la censura, también existen intranets que se establecen en la deep web, por los ventajas de esta, también cuando no hay interés de hacer pública la información, se puede almacenar en la deep web, donde no va a ser indexada.
Importancia
contiene bases de datos especializadas, con un volumen unas 400 o 500 veces más grande que el de la web superficial, mientras que en la web superficial habían unos 2.500.000.000 de documentos, en la dark web habían unos 550.000.000.000, la deep web es valiosa por su información y accesibilidad, una auténtica red de interacciones y comunicación
Alberga páginas dinámicas, foros, sitios de ventas, weblogs,catálogos...
Información
Bases de datos
National Climatic Data Center y la NASA ocupan un 7,8% del contenido del internet invisible
Contenido académico avalado por organizaciones de prestigio
Tipo cientifico
95% de contenido libre y gratuito, sin restricciones
A.) Tipos de internet
Invisible
Conocida como Dark Web o Deep Web, aloja información, cuyo acceso es restringido desde buscadores tradicionales como google
Para 2003 era 500 veces má grande que el internet superficial
Protegido por sistemas CAPTCHA que evitan el rastreo de buscadores
Cuenta con archivos no indexables para los motores de búsqueda
Puede albergar archivos en formato .pdf, .doc, .xls, .ppt... difícilmente indexables en los motores de búsqueda tradicionales.
Aloja información cuyo acceso es restringido a los buscadores tradicionales como google
Superficial
Parte de la web indexada y que pueda ser indexada por los motores de búsqueda tradicionales
Almacena menos información
Tiene buscadores como google, yahoo, altavista
Almacenan e indexan contenido en distintos formatos, sobre todo en html
Esta web es la más popular y asequible