Bases de datos especializadas y internet invisible

Conceptos

Internet superficial

Es la porción de internet que es indexada por las arañas de los motores de búsqueda. Las arañas de los buscadores van recorriendo las páginas web y almacenando información.

Internet invisible

También conocida como internet profunda es el contenido de internet que no esta indexado por los motores de búsqueda convencionales, esto significa que Google no puede encontrarlo.

esta existe por:

porque hay mucha información que los motores de búsqueda convencionales no pueden indexar, también es una red para entrar con códigos o contraseñas sin que se nos pueda rastrear por ningún método ya que no se nos monitorea

asi que basicamente es una forma de navegar sin que se nos nos monitoree y sirve como ese motor de busqueda que puede ver lo que los convencionales no

Internet invisible

La internet invisible ofrece a los miembros de la sociedad que viven bajo ciertos regímenes políticos opresores una forma relativamente segura de obtener información crucial para sus propias necesidades.

¿Cuáles son los beneficios de la internet invisible?

Libertad de expresión

A través de esta, en países como China o Corea del Norte las personas pueden enterarse de la realidad que sus gobiernos buscan censurar.

Libros censurados

Igual que en el caso anterior podrás encontrar libros censurados por los gobiernos y también libros regales. Este punto especifico va ligado con la piratearía pues en este espacio no existe el Copyright.

Investigaciones encubiertas

Este punto es el inicio, ya que la web profunda fue creada principalmente para realizar investigaciones. Ahora puedes encontrar investigaciones que en otros sitios no encontraras.

Activismo

No sólo existen hackers malos y la prueba más famosa de ellos son Wikileaks o Anonymous. Ya que gracias a ellos se han descubierto cosas como los abusos de Guantámo o la participación de Estados Unidos en conflictos de Medio Oriente. Estos activistas generalmente basan sus investigaciones en información de la Deep Web.

comparación de datos
estadísticos en cada web

distribución de los recursos informativos presentes
en la web profunda

distribución de los recursos informativos presentes
en la web profunda

motores de busqueda mas  usados

motores de busqueda mas usados

Comparativo

Internet superficial

Hacen parte las páginas de compras en línea, redes sociales o plataformas streaming a las que accedes a través de buscadores como Google, Firefox, Bing o Yahoo

Internet invisible

Responde a todos aquellos contenidos de información que están disponibles en internet pero que únicamente son accesibles a través de páginas generadas dinámicamente tras realizar una consulta en una base de datos

Clasificacion de la internet invisible

Web Opaca

Se compone de archivos que podrian estar incluidos en los indices de los motores de busqueda, pero no lo estan por alguna de estas razones:

Extencion de la indizacion

Por economia, no todas las paginas de un sitio son indizadas en los buscadores.

Frecuencia de la indizacion

Los motores de busqueda no tienen la capacidad de indizar todas las paginas existentes. Diariamente se añaden, modifican o desaparecen muchas.

Numero maximo de resultados visibles

Aunque los motores de busqueda arrojan a veces un gran numero de resultados de busqueda, generalmente limitan el numero de documentos que se muestran entre 200 y 1000.

URL's desconectados

Las generaciones mas recientes de buscadores, como Google, presentan los documentos por relevancia basado en el numero de veces que aparecen referenciados o ligados en otros.

Web privada

Consiste en las paginas web que podrian estar indizadas en los motores de busqueda pero son excluidas deliberadamente por alguna de estas causas:

Las paginas estan protegidas por contraseñas

Contienen un archivo "robots.txt" para evitar ser indizadas

Contienen un campo "noindex" para evitar que el buscador indice la parte correspondiente al cuerpo de la pagina.

Web propietaria

Incluye aquellas paginas en las que es necesario registrarse para tener acceso al contenido, ya sea de forma gratuita o pagada

Web realmente invisible

Se compone de paginas que no pueden ser indizadas por limitaciones tecnicas de los buscadores, como las siguientes:

Paginas web que incluyen formatos como PDF, PostScript, Flash, Schockwave, programas ejecutables y archivos comprimidos.

Paginas generadas dinamicamente, es decir, que se generan a partir de datos que introduce el usuario.

Informacion almacenada en bases de datos relacionales, que no puede ser extraida a menos que se realice una peticion especifica.

Cómo consultar los documentos e información académica en el internet invisible.

Acceder a una información especializada es frustrante si utilizamos el motor de búsqueda del tráfico diario (Google), este motor de búsqueda general no garantiza la información académica de calidad , estos apenas proveen una mínima cantidad de lo que Internet pueda ofrecer.En 1994 la doctora Jill Ellsworth llamó «invisible Web» (Internet invisible), a la información que los motores de búsqueda tradicionales no pueden encontrar. Algunos usuarios lo llaman la "Deep Web" ya que es una búsqueda profunda de información no abierta al público general.

Para buscar información académica se necesitan buscadores especializados como(Google Scholar, Scirus, etc.). La podemos encontrar en (Scopus, etc.), que contienen con certeza información de calidad.

Aunque hay varias formas de acceder a la internet profunda, las más sencilla consiste en instalarse el navegador TOR, acrónimo de The Onion Router, que hace referencia al tipo de red en las conocidas "redes de cebolla" que protegen el anonimato del usuario.

Los buscadores

Son un motor de búsqueda en un sistema informático que busca archivos almacenados en servidores web gracias a su araña web.

Funciones

Las funciones básicas de un buscador puede ser descrito como:

La indexación es ordenar la información de manera sistemática

El rastreo es el acto de enviar pequeños bots programados para recopilar información.

Y el procesamiento de búsquedas es un proceso matemático en el cual la búsqueda de la persona es comparada con el índice y los resultados son presentados.

Tipos

Además de Google, Bing y Yahoo existen todo tipo de buscadores más o menos especializados, que todavía siguen funcionando a pesar de que mayormente el buscador más utilizado es Google ,pero algunos de los buscadores son:

Buscadores de las redes sociales

Youtube, Facebook e Instagram.

Buscador del trafico diario

Google

Buscadores propios de países

Baidu y Yandex.

Recursos informáticos

En la internet invisible podemos encontrar diversidad de temas de información que pueden ser muy útiles y que carecen de algún costo. Entre estos tipos de información encontramos

Bases de datos

Los buscadores comunes solo proporcionan acceso a la página de inicio porque los restantes son dinámicas.

Documentos en formato PDF

Los motores fueron creados solo para localizar e indizar páginas HTML.

Páginas que no son indizadas por los motores de búsqueda

Porque se excluyen ellas mismas a través de un protocolo de exclusión.

Sitios web que necesitan contraseña

Los motores no pueden acceder al contenido de estas páginas.