Bases de datos especializadas y internet invisible
Conceptos
Internet superficial
Es la porción de internet que es indexada por las arañas de los motores de búsqueda. Las arañas de los buscadores van recorriendo las páginas web y almacenando información.
Internet invisible
También conocida como internet profunda es el contenido de internet que no esta indexado por los motores de búsqueda convencionales, esto significa que Google no puede encontrarlo.
esta existe por:
porque hay mucha información que los motores de búsqueda convencionales no pueden indexar, también es una red para entrar con códigos o contraseñas sin que se nos pueda rastrear por ningún método ya que no se nos monitorea
asi que basicamente es una forma de navegar sin que se nos nos monitoree y sirve como ese motor de busqueda que puede ver lo que los convencionales no
Internet invisible
La internet invisible ofrece a los miembros de la sociedad que viven bajo ciertos regímenes políticos opresores una forma relativamente segura de obtener información crucial para sus propias necesidades.
¿Cuáles son los beneficios de la internet invisible?
Libertad de expresión
A través de esta, en países como China o Corea del Norte las personas pueden enterarse de la realidad que sus gobiernos buscan censurar.
Libros censurados
Igual que en el caso anterior podrás encontrar libros censurados por los gobiernos y también libros regales. Este punto especifico va ligado con la piratearía pues en este espacio no existe el Copyright.
Investigaciones encubiertas
Este punto es el inicio, ya que la web profunda fue creada principalmente para realizar investigaciones. Ahora puedes encontrar investigaciones que en otros sitios no encontraras.
Activismo
No sólo existen hackers malos y la prueba más famosa de ellos son Wikileaks o Anonymous. Ya que gracias a ellos se han descubierto cosas como los abusos de Guantámo o la participación de Estados Unidos en conflictos de Medio Oriente. Estos activistas generalmente basan sus investigaciones en información de la Deep Web.
comparación de datos
estadísticos en cada web
distribución de los recursos informativos presentes
en la web profunda
motores de busqueda mas usados
Comparativo
Internet superficial
Hacen parte las páginas de compras en línea, redes sociales o plataformas streaming a las que accedes a través de buscadores como Google, Firefox, Bing o Yahoo
Internet invisible
Responde a todos aquellos contenidos de información que están disponibles en internet pero que únicamente son accesibles a través de páginas generadas dinámicamente tras realizar una consulta en una base de datos
Clasificacion de la internet invisible
Web Opaca
Se compone de archivos que podrian estar incluidos en los indices de los motores de busqueda, pero no lo estan por alguna de estas razones:
Extencion de la indizacion
Por economia, no todas las paginas de un sitio son indizadas en los buscadores.
Frecuencia de la indizacion
Los motores de busqueda no tienen la capacidad de indizar todas las paginas existentes. Diariamente se añaden, modifican o desaparecen muchas.
Numero maximo de resultados visibles
Aunque los motores de busqueda arrojan a veces un gran numero de resultados de busqueda, generalmente limitan el numero de documentos que se muestran entre 200 y 1000.
URL's desconectados
Las generaciones mas recientes de buscadores, como Google, presentan los documentos por relevancia basado en el numero de veces que aparecen referenciados o ligados en otros.
Web privada
Consiste en las paginas web que podrian estar indizadas en los motores de busqueda pero son excluidas deliberadamente por alguna de estas causas:
Las paginas estan protegidas por contraseñas
Contienen un archivo "robots.txt" para evitar ser indizadas
Contienen un campo "noindex" para evitar que el buscador indice la parte correspondiente al cuerpo de la pagina.
Web propietaria
Incluye aquellas paginas en las que es necesario registrarse para tener acceso al contenido, ya sea de forma gratuita o pagada
Web realmente invisible
Se compone de paginas que no pueden ser indizadas por limitaciones tecnicas de los buscadores, como las siguientes:
Paginas web que incluyen formatos como PDF, PostScript, Flash, Schockwave, programas ejecutables y archivos comprimidos.
Paginas generadas dinamicamente, es decir, que se generan a partir de datos que introduce el usuario.
Informacion almacenada en bases de datos relacionales, que no puede ser extraida a menos que se realice una peticion especifica.
Cómo consultar los documentos e información académica en el internet invisible.
Acceder a una información especializada es frustrante si utilizamos el motor de búsqueda del tráfico diario (Google), este motor de búsqueda general no garantiza la información académica de calidad , estos apenas proveen una mínima cantidad de lo que Internet pueda ofrecer.En 1994 la doctora Jill Ellsworth llamó «invisible Web» (Internet invisible), a la información que los motores de búsqueda tradicionales no pueden encontrar. Algunos usuarios lo llaman la "Deep Web" ya que es una búsqueda profunda de información no abierta al público general.
Para buscar información académica se necesitan buscadores especializados como(Google Scholar, Scirus, etc.). La podemos encontrar en (Scopus, etc.), que contienen con certeza información de calidad.
Aunque hay varias formas de acceder a la internet profunda, las más sencilla consiste en instalarse el navegador TOR, acrónimo de The Onion Router, que hace referencia al tipo de red en las conocidas "redes de cebolla" que protegen el anonimato del usuario.
Los buscadores
Son un motor de búsqueda en un sistema informático que busca archivos almacenados en servidores web gracias a su araña web.
Funciones
Las funciones básicas de un buscador puede ser descrito como:
La indexación es ordenar la información de manera sistemática
El rastreo es el acto de enviar pequeños bots programados para recopilar información.
Y el procesamiento de búsquedas es un proceso matemático en el cual la búsqueda de la persona es comparada con el índice y los resultados son presentados.
Tipos
Además de Google, Bing y Yahoo existen todo tipo de buscadores más o menos especializados, que todavía siguen funcionando a pesar de que mayormente el buscador más utilizado es Google ,pero algunos de los buscadores son:
Buscadores de las redes sociales
Youtube, Facebook e Instagram.
Buscador del trafico diario
Buscadores propios de países
Baidu y Yandex.
Recursos informáticos
En la internet invisible podemos encontrar diversidad de temas de información que pueden ser muy útiles y que carecen de algún costo. Entre estos tipos de información encontramos
Bases de datos
Los buscadores comunes solo proporcionan acceso a la página de inicio porque los restantes son dinámicas.
Documentos en formato PDF
Los motores fueron creados solo para localizar e indizar páginas HTML.
Páginas que no son indizadas por los motores de búsqueda
Porque se excluyen ellas mismas a través de un protocolo de exclusión.
Sitios web que necesitan contraseña
Los motores no pueden acceder al contenido de estas páginas.