qué es Internet profunda o Internet invisible? ¿Es una especie de Triángulo de las Bermudas donde solo unos pocos privilegiados pueden tener acceso y salir o es una especie de mito como la Atlántida?
La verdad es mucho más simple, más plana y más simple.
El internet profundo básicamente no está indexado por motores de búsqueda o directorios. Dicho de otra forma, son páginas o más bien repositorios de información, regularmente bases de datos dinámicas, cuyo contenido no puede ser revisado por los motores de búsqueda y por tanto incluido en sus resultados de búsqueda.
A diferencia de otras páginas web, estas bases de datos no son accesibles debido a que necesitan un usuario o contraseña para ingresar a ellas o son páginas dinámicas, es decir que solo liberan información y resultados cuando se completa una serie de variables y en ese momento se crea la tabla de datos y no antes.
Por ende, no son accesibles para un motor de búsqueda común.
Para hacerlo simple, mantenga esta idea:
La Internet profunda está formada por toda la información y bases de datos a las que los buscadores y directorios no disponen acceso directo.
En realidad, es más que probable que ya lo estés utilizando o lo hayas usado sin darte cuenta.
Sea cual sea el caso, si deseas saber qué es y cómo usarlo, lee el post hasta el final donde encontrarás un obsequio.
¿Qué tamaño tiene Internet profundo?
Nadie conoce el tamaño exacto de Internet profunda o de la Web invisible. Según un post de Wikipedia sobre la Deep Web:
En el año 2000 fue estimado3 que el tamaño de la Internet invisible era 7500 Terabytes datos en aproximadamente 550.000 millones de documentos.4 A modo de comparación, se estima que actualmente el Internet poco profundo ocupaba 167 terabytes y el contenido de Biblioteca del Congreso de los Estados Unidos contenía unos 3.000 terabytes a los que no podían ingresar los motores de búsqueda.
Estimaciones sustentadas en extrapolación de un estudio de Universidad de California en Berkeley especula que hoy en día el Internet profundo debería rondar los 91.000 TeraBytes.5
En realidad, el tamaño no importa. La idea principal es tener claro que aproximadamente el 95% de toda la información que existe en Internet no está indexada por ningún motor de búsqueda.
¡Vaya, eso deja mucho espacio de información que podemos aprovechar! ¿No piensas?
La pregunta es ¿cómo? Bueno, ahí es donde los sistemas de inteligencia competitiva que se especializan en compilar este tipo de información provienen de Internet profundo, pero esa es una historia distinto.
¿Por qué es importante Internet profundo?
Bueno, si lo piensas bien, la idea de ceñirte solo a las búsquedas de Google es muy atractiva. ¡Qué digo, es más que atractivo!
Sería perfecto si pudiera preguntarle a Google cualquier cosa y escupir los resultados que necesito.
A pesar de todo, si consideramos que Google y los demás buscadores se rigen por algoritmos y estos no pueden ser perfectos, al mismo tiempo del hecho de que existen bases de datos y páginas dinámicas, pues nos encontramos con la limitación de que una sola herramienta no puede indexar toda información. Es básicamente imposible.
De modo que podemos estar seguros de que hay mucha más información de la que inicialmente teníamos conocimiento.
De esta dinámica, para localizar determinada información de calidad, tenemos que tener acceso en la web invisible y aprovecharla.
La buena noticia de todo esto es que no todo el mundo tiene acceso a una Internet inviable y si sabemos cómo hacerlo, lograremos disfrutar de mejores datos e información que nuestra competencia. Es simple
Donde comenzar …? Algunos recursos de Internet profundo
Por suerte para todos, hay otras personas que han hecho la misma pregunta que nosotros y nos han dejado un montón de entradas de deep web que podemos aprovechar:
Recursos científicos de la Internet profunda o la Internet invisible
- La red del conocimiento: es una de las bases de datos de citas más grandes del mundo con más de 54 millones de registros
- En otra parte: es un repositorio con más de 2000 revistas médicas y de salud
- Science Direct: más de 2.500 revistas científicas y más de 11.000 libros
- Pubmed: es el motor de búsqueda de medline. Contiene más de 22 millones de posts de investigación biomédica
- Ingenta: contiene revistas con más de 12.000 publicaciones
- PTO estadounidense: es un motor de búsqueda de patentes y marcas comerciales de los Estados Unidos de América
- Espacenet: es un motor de búsqueda de patentes para países europeos
- Latipat: La plataforma espacenet suma resultados de patentes de países de América Latina, España y Portugal
Recursos estadísticos de la Internet profunda o la Internet invisible
- Eurostat: fuente estadística de todos los países europeos
- Utiliza.gov: Fuente estadística de EE. UU.
Recursos de datos financieros de Internet profunda o Internet invisible
Recursos de comercio internacional de Internet profunda o Internet invisible
- Comtrade: Base de datos de las Naciones Unidas sobre datos de importación y exportación y códigos SA
- Cameradata: Base de datos española sobre daños de importación y exportación
- Base de datos de acceso al mercado: datos sobre tipos arancelarios en los distintos países de destino de las exportaciones
- La organización mundial del comercio: recopila información legal sobre comercio internacional.
Recursos sobre la legislación de Internet profunda o Internet invisible
Como puede ver, muchos de estos recursos son muy conocidos y no están ocultos en ninguna parte.
Lo que pasa es que los buscadores no recopilan el contenido.
De todos modos, estos son solo algunos ejemplos y ni siquiera alcanzan una pequeña fracción de lo que existe. En realidad, nuevas herramientas o directorios de acceso web profundo que tardan en llegar al dominio público.
Otros recursos web invisibles
Aquí deberíamos hablar de varias funciones como:
- Planeta completo: Una herramienta considerada una de las principales puertas de entrada a la Internet profunda durante muchos años. Este es un directorio con más de 70.000 bases de datos y recursos.
- Infomine: un recurso de la Universidad de California que contiene más de 100,000 links a otras bases de datos
- Scirus: es un meta-motor de investigación científica especializado en institutos de investigación y universidades
Il est juste de souligner qu’une grande partie des ressources vérifiées du Web profond provient de bibliothèques et de centres de recherche universitaires et que, par conséquent, les informations sont d’une grande qualité et d’une grande valeur pour la communauté scientifique et de investigación.
Aún cuando además podemos, como hemos visto, hallar recursos valiosos para la compañía. Al mismo tiempo de estos tres recursos, puede consultar este resumen Recopilación de puertas de link a internet profundo de Ernesto Marrero.
Además te sugiero que uses OJO para lanzar una búsqueda simultánea en varios de estos servicios. Es muy útil.
Cómo aprovechar la Internet profunda
La verdad es que no es fácil y depende de hallar recursos valiosos para usted o su negocio.
Lo que te puedo garantizar es que al momento de identificarlos, es muy importante prestar atención la frecuencia con la que usamos estos sumideros de información.
Si, a modo de ejemplo, hemos hallado uno de ellos y lo usamos repetidamente con búsquedas idénticas o muy similares, es mejor tener un sistema que recupere de forma automática esta información repitiendo de forma automática esas búsquedas.
Esto es lo que hacen los sistemas de inteligencia competitiva. Actúan como un motor de búsqueda específico para uno o más de estos directorios de Internet profundo, recopilando la información que se ha proporcionado. Sería como programar un motor de búsqueda para que repita las cientos de búsquedas que se han introducido durante 24 horas.
Pretendes aprovechar la Internet profunda
Posiblemente no se trata solo de la web profunda o de Internet.
Hay mucho mas
Los links que he presentado en este post son solo la punta del iceberg de la web invisible.
Si deseas seguir entendiendo mejor cómo funciona, aquí tienes nuestro regalo sorpresa:
Al mismo tiempo, te dejo un link a este libro blanco de la web profunda.
Está un poco desactualizado, pero te ayudará a entender mejor esta parte de la web.
Para terminar, aclare que la web actual tiene diversos capas e inclusive parte de esta deep web o deep internet no es alcanzable con navegadores convencionales.
Ahí tenemos que utilizar TOR pero eso lo dejamos para otro momento.
¿Qué opinas de esta entrada? ¿Conoce algún recurso de la web profunda que desee compartir?