Categorias: Todos - superficial - intranet - motores - información

por Santiago Zapata Arias 3 anos atrás

218

00u

El texto aborda principalmente las diferentes capas de internet, destacando la distinción entre la web superficial y la web invisible, también conocida como Deep Web o Dark Web. La web visible es aquella que puede ser indexada por motores de búsqueda tradicionales como Google y Yahoo, y contiene mayormente contenido en formatos html, siendo la más accesible y popular entre los usuarios.

00u

00u

E.) Datos y consulta

Acceso a formatos no indexables por la internet superficial

Gran parte de la información esta compuesta por bases de datos en general e información cientifica

Bases de datos de universidades, grandes centros de investigación y retenedores de información en general

No funciona mediante bases de datos

Páginas dinámicas

Información generada a partir de una petición

Mayor cantidad de información que la internet superficial

Inabarcabilidad de información en bases de datos

Acceso de información por profundidad

Menos información que en la deep web

Crecimiento de contenido más rápido que alguna forma de almacenar con coherencia

F.) Buscadores

Tipos
Motores de búsqueda

Ejemplo: Google

Acceso a resultados mediante palabras claves

Indizado automático hecho por arañas o crawlers

Uso de robots para indizar páginas web y agregarlas a la base de datos

Indizan todas las páginas de un sitio, no solo el título y la descripción

Directorios

Ejemplo: Yahoo

Clasifican la información por temas y subtemas

Analizan fuentes y sugerencias del usuario

Revisados por personas

Cantidad de contenido mucho menor

Clasifican según título y descripción del sitio

Búsqueda de información personalizada por los gustos de la persona

Función
Localizar, recuperar e Indexar información

Categorizar información mediante Bots o crawlers

Dirigirnos hacia un resultado según la búsqueda que hagamos

Limitaciones para acceder a información científica
El buscador define que páginas son más importantes que otras

Basado en criterios pero susceptible a la subjetividad

Los usuarios manifiestan no encontrar la información que solicitan

Baja cobertura de los servicios de la red

Limitaciones para indexar toda la información

Información reducida, oculta

Incapacidad para cubrir la información

Aunque en buscadores como google hay una reducción de estos problemas y con uso de páginas dinámicas

Noción de gatekeeping

Demora en la cadena comunicacional de la información

Limitación para leer formatos como el PDF, entre otros

G.) Consulta de documentos e información en la internet invisible

Haciendo una búsqueda directa
Accediendo a bases de datos de universidades, centros de investigación, entre otros
En la Web propietaria
Registrarse o suscribirse a una fuente de informacion

Ejemplo: Icesi que cuenta con 72 suscripciones para acceder a contenido

95% de contenido libre y gratuito
Admisión de formatos no legibles u olvidados por las arañas

H.) Recursos de información de la red invisible

Calculadoras 2%
Trabajos 1%
Mensajes/chat
Búsquedas generales
1%
Intranet
12%
Publicaciones
11%
Bases de datos tematicas
54%
Compras/subastas
Anuncios clasificados
5%
Portales
3%
Bibliotecas
Páginas blancas/amarillas
2%

Guia 1 Mindomo Santiago Zapata Arias 11C Tecnología- Colegio San Luis rey

Topic principal

D.) Comparación de disposición de información de tipo académica y científica

Internet invisible
Acceso a mayor cantidad de bases de datos e información en general, de alta calidad y avaladas por instituciones confiables, que también tienen sitios en el internet invisible, como es el caso de la RAE y su diccionario, la NASA y de todo tipo, el internet superficial no usa base de datos, en cambio genera páginas dinámicas para acceder a la información solicitada
Internet superficial
Contiene información válida, pero por sus sistema solo nos permite acceder a un pequeño porcentaje de la información que contiene, y esa información es menor a la que tiene la internet invisible, todo porque a internet visible es una base de datos indexados que prioriza unos datos sobre otros, y en consecuencia muchas páginas no han sido visitadas

C.) Clasificación de la internet invisible

Web realmente invisible
Este contenido no puede ser indexado por los buscadores, pies los robots no reconocen el formato, la página se auto diseña
Web propietaria
Contenido semi-abierto, con acceso mediante registro, cuya información no es indexada por los buscadores, muchas veces se hace esto con ánimo de lucro, sin embargo el 95% del contenido de la web profunda está libre
Web privada
Información indexable pero para uso interno (no público), que se publica, buscando no ser indexada (en algunas partes del archivo) y con acceso restringido o simplemente se blinda la información con contraseñas
Web opaca
Páginas que pueden ser indexadas pero no son incluidas en la web superficial, ya sea porque están en una parte demasiado interna del a web, por pocas visitas, por exceso de resultados a una consulta, o por un error del robot del buscador

B.) Internet Invisible

¿Por que existe?
Existen motivos diversos, desde cobertura, motivos legales, gusto personal, legibilidad de formatos, entre otros, la web superficial, jerarquiza las páginas que preferiblemente vamos a ver, para mediados de la década de los 200, 6 de cada 10 páginas no habían sido visitadas, el tema del anonimato tiene muchas caras, puede ayudar a realizar actividades ilegales o escapar de la censura, también existen intranets que se establecen en la deep web, por los ventajas de esta, también cuando no hay interés de hacer pública la información, se puede almacenar en la deep web, donde no va a ser indexada.
Importancia
contiene bases de datos especializadas, con un volumen unas 400 o 500 veces más grande que el de la web superficial, mientras que en la web superficial habían unos 2.500.000.000 de documentos, en la dark web habían unos 550.000.000.000, la deep web es valiosa por su información y accesibilidad, una auténtica red de interacciones y comunicación

Alberga páginas dinámicas, foros, sitios de ventas, weblogs,catálogos...

Información

Bases de datos

National Climatic Data Center y la NASA ocupan un 7,8% del contenido del internet invisible

Contenido académico avalado por organizaciones de prestigio

Tipo cientifico

95% de contenido libre y gratuito, sin restricciones

A.) Tipos de internet

Invisible
Conocida como Dark Web o Deep Web, aloja información, cuyo acceso es restringido desde buscadores tradicionales como google

Para 2003 era 500 veces má grande que el internet superficial

Protegido por sistemas CAPTCHA que evitan el rastreo de buscadores

Cuenta con archivos no indexables para los motores de búsqueda

Puede albergar archivos en formato .pdf, .doc, .xls, .ppt... difícilmente indexables en los motores de búsqueda tradicionales.

Aloja información cuyo acceso es restringido a los buscadores tradicionales como google

Superficial
Parte de la web indexada y que pueda ser indexada por los motores de búsqueda tradicionales

Almacena menos información

Tiene buscadores como google, yahoo, altavista

Almacenan e indexan contenido en distintos formatos, sobre todo en html

Esta web es la más popular y asequible