

DeepWeb


Definicion
Deep Web o Web Profunda es la parte oculta de internet, la parte en donde predomina el anonimato, en la cual es casi imposible de rastrear el origen de su información. En ella se puede encontrar un muy amplia variedad de contenido e información (de todo tipo, desde información educativa, hasta venta de drogas), que normalmente no se puede ver ni acceder a ella por medio de los buscadores o navegadores convencionales (Chrome, Firefox, Opera).


Definicion
Habitualmente cuando se navega por internet accedemos a páginas indexadas y registradas en los navegadores, en pocas palabras son páginas con direcciones URL convencionales (.com), estas páginas e información que encontramos solo cubren aproximadamente el 6% del total del contenido de internet, el otro 94% está conformado por la Deep Web, en la cual encontramos páginas que no están registradas ni indexadas en los navegadores, esto sucede por muchas razones:
-
Páginas y sitios web protegidos con contraseñas o códigos establecidos.
-
Páginas que el buscador decidió no indexar: esto se da generalmente porque la demanda para el archivo que se decidió no indexar es poca en comparación con los archivos de texto HTML; estos archivos generalmente también son más “difíciles” de indexar y requieren más recursos.
-
Sitios que dentro de su código, tiene archivos que le impiden al buscador indexarlo.
-
Documentos en formatos no indexables.
-
De acuerdo a la tecnología usada por el sitio, por ejemplo los sitios que usan bases de datos. Para estos casos los buscadores pueden llegar a la interfaz creada para acceder a dichas bases de datos, como por ejemplo, catálogos de librerías o agencias de gobierno.
-
Enciclopedias, diccionarios, revistas en las que para acceder a la información hay que interrogar a la base de datos, como por ejemplo la base de datos de la RAE.
-
Sitios que tienen una mezcla de media o archivos que no son fáciles de clasificar como visible o invisible (Web opaca).
-
La información es efímera o no suficientemente valiosa para indexar. Es posible indexar está información pero como cambia con mucha frecuencia y su valor es de tiempo limitado no hay motivo para indexarla.
-
Páginas que contienen mayormente imágenes, audio o video con poco o nada de texto.
-
Los archivos en formatos PostScript, Flash, Shockwave, ejecutables (.exe), archivos comprimidos (.zip,.tar, etc)
-
Información creada en páginas dinámicas después de llenar un formulario, la información detrás de los formularios es invisible.
-
Documentos dinámicos, son creados por un script que selecciona datos de diversas opciones para generar una página personalizada. Este tipo de documentos, aunque sí se pueden indexar, no están en los motores de búsqueda porque en ocasiones puede haber varias páginas iguales, pero con pequeños cambios, y las arañas web quedan atrapadas en ellos
-
Es un sitio aislado, es decir, no hay ligas que lo vinculen con otros sitios y viceversa.
-
Son subdirectorios o bases de datos restringidas.
Estas páginas no utilizan direcciones web convencionales, en cambio utilizan el pseudodominio de nivel superior .onion, la cual fue creada por la Armada de los Estados Unidos como una prueba y ahora es aprovechada por delincuentes cibernéticos.


Que es la Deep Web?
Esta es una pequeña y sencilla explicacion de que es la Deep Web.