00u
A.) Tipos de internet
Superficial
Parte de la web indexada y que pueda ser indexada por los motores de búsqueda tradicionales
Esta web es la más popular y asequible
Tiene buscadores como google, yahoo, altavista
Almacenan e indexan contenido en distintos formatos, sobre todo en html
Almacena menos información
Invisible
Conocida como Dark Web o Deep Web, aloja información, cuyo acceso es restringido desde buscadores tradicionales como google
Aloja información cuyo acceso es restringido a los buscadores tradicionales como google
Puede albergar archivos en formato .pdf, .doc, .xls, .ppt... difícilmente indexables en los motores de búsqueda tradicionales.
Para 2003 era 500 veces má grande que el internet superficial
Cuenta con archivos no indexables para los motores de búsqueda
Protegido por sistemas CAPTCHA que evitan el rastreo de buscadores
B.) Internet Invisible
Importancia
contiene bases de datos especializadas, con un volumen unas 400 o 500 veces más grande que el de la web superficial, mientras que en la web superficial habían unos 2.500.000.000 de documentos, en la dark web habían unos 550.000.000.000, la deep web es valiosa por su información y accesibilidad, una auténtica red de interacciones y comunicación
95% de contenido libre y gratuito, sin restricciones
Información
Tipo cientifico
Contenido académico avalado por organizaciones de prestigio
Bases de datos
National Climatic Data Center y la NASA ocupan un 7,8% del contenido del internet invisible
Alberga páginas dinámicas, foros, sitios de ventas, weblogs,catálogos...
¿Por que existe?
Existen motivos diversos, desde cobertura, motivos legales, gusto personal, legibilidad de formatos, entre otros, la web superficial, jerarquiza las páginas que preferiblemente vamos a ver, para mediados de la década de los 200, 6 de cada 10 páginas no habían sido visitadas, el tema del anonimato tiene muchas caras, puede ayudar a realizar actividades ilegales o escapar de la censura, también existen intranets que se establecen en la deep web, por los ventajas de esta, también cuando no hay interés de hacer pública la información, se puede almacenar en la deep web, donde no va a ser indexada.
C.) Clasificación de la internet invisible
Web opaca
Páginas que pueden ser indexadas pero no son incluidas en la web superficial, ya sea porque están en una parte demasiado interna del a web, por pocas visitas, por exceso de resultados a una consulta, o por un error del robot del buscador
Web privada
Información indexable pero para uso interno (no público), que se publica, buscando no ser indexada (en algunas partes del archivo) y con acceso restringido o simplemente se blinda la información con contraseñas
Web propietaria
Contenido semi-abierto, con acceso mediante registro, cuya información no es indexada por los buscadores, muchas veces se hace esto con ánimo de lucro, sin embargo el 95% del contenido de la web profunda está libre
Web realmente invisible
Este contenido no puede ser indexado por los buscadores, pies los robots no reconocen el formato, la página se auto diseña
D.) Comparación de disposición de información de tipo académica y científica
Internet superficial
Contiene información válida, pero por sus sistema solo nos permite acceder a un pequeño porcentaje de la información que contiene, y esa información es menor a la que tiene la internet invisible, todo porque a internet visible es una base de datos indexados que prioriza unos datos sobre otros, y en consecuencia muchas páginas no han sido visitadas
Internet invisible
Acceso a mayor cantidad de bases de datos e información en general, de alta calidad y avaladas por instituciones confiables, que también tienen sitios en el internet invisible, como es el caso de la RAE y su diccionario, la NASA y de todo tipo, el internet superficial no usa base de datos, en cambio genera páginas dinámicas para acceder a la información solicitada
Topic principal
Topic principal
Topic principal
Topic principal
Topic principal
Topic principal
Topic principal
Topic principal
Topic principal
Topic principal
Topic principal
Topic principal
Topic principal
Topic principal
Topic principal
Topic principal
Topic principal
Topic principal
Topic principal
Topic principal
Topic principal
Topic principal
Topic principal
Topic principal
Topic principal
Topic principal
Topic principal
Topic principal
Topic principal
Topic principal
Topic principal
Topic principal
Topic principal
Topic principal
Topic principal
Topic principal
Topic principal
Topic principal
Topic principal
Topic principal
Guia 1 Mindomo Santiago Zapata Arias 11C Tecnología- Colegio San Luis rey
H.) Recursos de información de la red invisible
Páginas blancas/amarillas
2%
Bibliotecas
2%
Portales
3%
Anuncios clasificados
5%
Compras/subastas
5%
Bases de datos tematicas
54%
Publicaciones
11%
Intranet
12%
Búsquedas generales
1%
Mensajes/chat
1%
Trabajos 1%
Calculadoras 2%
G.) Consulta de documentos e información en la internet invisible
Admisión de formatos no legibles u olvidados por las arañas
95% de contenido libre y gratuito
En la Web propietaria
Registrarse o suscribirse a una fuente de informacion
Ejemplo: Icesi que cuenta con 72 suscripciones para acceder a contenido
Accediendo a bases de datos de universidades, centros de investigación, entre otros
Haciendo una búsqueda directa
F.) Buscadores
Limitaciones para acceder a información científica
Limitación para leer formatos como el PDF, entre otros
Noción de gatekeeping
Demora en la cadena comunicacional de la información
Limitaciones para indexar toda la información
Información reducida, oculta
Incapacidad para cubrir la información
Aunque en buscadores como google hay una reducción de estos problemas y con uso de páginas dinámicas
Los usuarios manifiestan no encontrar la información que solicitan
Baja cobertura de los servicios de la red
El buscador define que páginas son más importantes que otras
Basado en criterios pero susceptible a la subjetividad
Función
Localizar, recuperar e Indexar información
Categorizar información mediante Bots o crawlers
Dirigirnos hacia un resultado según la búsqueda que hagamos
Tipos
Directorios
Bases de datos
Clasifican la información por temas y subtemas
Búsqueda de información personalizada por los gustos de la persona
Clasifican según título y descripción del sitio
Revisados por personas
Cantidad de contenido mucho menor
Analizan fuentes y sugerencias del usuario
Ejemplo: Yahoo
Motores de búsqueda
Acceso a resultados mediante palabras claves
Indizado automático hecho por arañas o crawlers
Indizan todas las páginas de un sitio, no solo el título y la descripción
Uso de robots para indizar páginas web y agregarlas a la base de datos
Ejemplo: Google
E.) Datos y consulta
Internet superficial
Inabarcabilidad de información en bases de datos
Crecimiento de contenido más rápido que alguna forma de almacenar con coherencia
Acceso de información por profundidad
Menos información que en la deep web
Internet invisible
No funciona mediante bases de datos
Páginas dinámicas
Información generada a partir de una petición
Mayor cantidad de información que la internet superficial
Acceso a formatos no indexables por la internet superficial
Gran parte de la información esta compuesta por bases de datos en general e información cientifica
Bases de datos de universidades, grandes centros de investigación y retenedores de información en general