00u

A.) Tipos de internet

Superficial

Parte de la web indexada y que pueda ser indexada por los motores de búsqueda tradicionales

Esta web es la más popular y asequible

Tiene buscadores como google, yahoo, altavista

Almacenan e indexan contenido en distintos formatos, sobre todo en html

Almacena menos información

Invisible

Conocida como Dark Web o Deep Web, aloja información, cuyo acceso es restringido desde buscadores tradicionales como google

Aloja información cuyo acceso es restringido a los buscadores tradicionales como google

Puede albergar archivos en formato .pdf, .doc, .xls, .ppt... difícilmente indexables en los motores de búsqueda tradicionales.

Para 2003 era 500 veces má grande que el internet superficial

Cuenta con archivos no indexables para los motores de búsqueda

Protegido por sistemas CAPTCHA que evitan el rastreo de buscadores

B.) Internet Invisible

Importancia

contiene bases de datos especializadas, con un volumen unas 400 o 500 veces más grande que el de la web superficial, mientras que en la web superficial habían unos 2.500.000.000 de documentos, en la dark web habían unos 550.000.000.000, la deep web es valiosa por su información y accesibilidad, una auténtica red de interacciones y comunicación

95% de contenido libre y gratuito, sin restricciones

Información

Tipo cientifico

Contenido académico avalado por organizaciones de prestigio

Bases de datos

National Climatic Data Center y la NASA ocupan un 7,8% del contenido del internet invisible

Alberga páginas dinámicas, foros, sitios de ventas, weblogs,catálogos...

¿Por que existe?

Existen motivos diversos, desde cobertura, motivos legales, gusto personal, legibilidad de formatos, entre otros, la web superficial, jerarquiza las páginas que preferiblemente vamos a ver, para mediados de la década de los 200, 6 de cada 10 páginas no habían sido visitadas, el tema del anonimato tiene muchas caras, puede ayudar a realizar actividades ilegales o escapar de la censura, también existen intranets que se establecen en la deep web, por los ventajas de esta, también cuando no hay interés de hacer pública la información, se puede almacenar en la deep web, donde no va a ser indexada.

C.) Clasificación de la internet invisible

Web opaca

Páginas que pueden ser indexadas pero no son incluidas en la web superficial, ya sea porque están en una parte demasiado interna del a web, por pocas visitas, por exceso de resultados a una consulta, o por un error del robot del buscador

Web privada

Información indexable pero para uso interno (no público), que se publica, buscando no ser indexada (en algunas partes del archivo) y con acceso restringido o simplemente se blinda la información con contraseñas

Web propietaria

Contenido semi-abierto, con acceso mediante registro, cuya información no es indexada por los buscadores, muchas veces se hace esto con ánimo de lucro, sin embargo el 95% del contenido de la web profunda está libre

Web realmente invisible

Este contenido no puede ser indexado por los buscadores, pies los robots no reconocen el formato, la página se auto diseña

D.) Comparación de disposición de información de tipo académica y científica

Internet superficial

Contiene información válida, pero por sus sistema solo nos permite acceder a un pequeño porcentaje de la información que contiene, y esa información es menor a la que tiene la internet invisible, todo porque a internet visible es una base de datos indexados que prioriza unos datos sobre otros, y en consecuencia muchas páginas no han sido visitadas

Internet invisible

Acceso a mayor cantidad de bases de datos e información en general, de alta calidad y avaladas por instituciones confiables, que también tienen sitios en el internet invisible, como es el caso de la RAE y su diccionario, la NASA y de todo tipo, el internet superficial no usa base de datos, en cambio genera páginas dinámicas para acceder a la información solicitada

Topic principal

Guia 1 Mindomo Santiago Zapata Arias 11C Tecnología- Colegio San Luis rey

H.) Recursos de información de la red invisible

Páginas blancas/amarillas

Bibliotecas

Portales

Anuncios clasificados

Compras/subastas

Bases de datos tematicas

54%

Publicaciones

11%

Intranet

12%

Búsquedas generales

Mensajes/chat

Trabajos 1%

Calculadoras 2%

G.) Consulta de documentos e información en la internet invisible

Admisión de formatos no legibles u olvidados por las arañas

95% de contenido libre y gratuito

En la Web propietaria

Registrarse o suscribirse a una fuente de informacion

Ejemplo: Icesi que cuenta con 72 suscripciones para acceder a contenido

Accediendo a bases de datos de universidades, centros de investigación, entre otros

Haciendo una búsqueda directa

F.) Buscadores

Limitaciones para acceder a información científica

Limitación para leer formatos como el PDF, entre otros

Noción de gatekeeping

Demora en la cadena comunicacional de la información

Limitaciones para indexar toda la información

Información reducida, oculta

Incapacidad para cubrir la información

Aunque en buscadores como google hay una reducción de estos problemas y con uso de páginas dinámicas

Los usuarios manifiestan no encontrar la información que solicitan

Baja cobertura de los servicios de la red

El buscador define que páginas son más importantes que otras

Basado en criterios pero susceptible a la subjetividad

Función

Localizar, recuperar e Indexar información

Categorizar información mediante Bots o crawlers

Dirigirnos hacia un resultado según la búsqueda que hagamos

Tipos

Directorios

Bases de datos

Clasifican la información por temas y subtemas

Búsqueda de información personalizada por los gustos de la persona

Clasifican según título y descripción del sitio

Revisados por personas

Cantidad de contenido mucho menor

Analizan fuentes y sugerencias del usuario

Ejemplo: Yahoo

Motores de búsqueda

Acceso a resultados mediante palabras claves

Indizado automático hecho por arañas o crawlers

Indizan todas las páginas de un sitio, no solo el título y la descripción

Uso de robots para indizar páginas web y agregarlas a la base de datos

Ejemplo: Google

E.) Datos y consulta

Internet superficial

Inabarcabilidad de información en bases de datos

Crecimiento de contenido más rápido que alguna forma de almacenar con coherencia

Acceso de información por profundidad

Menos información que en la deep web

Internet invisible

No funciona mediante bases de datos

Páginas dinámicas

Información generada a partir de una petición

Mayor cantidad de información que la internet superficial

Acceso a formatos no indexables por la internet superficial

Gran parte de la información esta compuesta por bases de datos en general e información cientifica

Bases de datos de universidades, grandes centros de investigación y retenedores de información en general