Web+Invisible

__**Internet:**__ Conjunto de redes interconectadas entre si.

Cuando entramos a Internet, podemos ver solamente la Web visible (20%), ahora vamos a aprender buscar en la Web invisible.

__Web Superficial:__ Se conoce como: WWW. • Compuesta por páginas estáticas. (Estática significa que no podemos interactuar en la página, solamente bajar info.)

__Web Profunda__: Se conoce como Web Invisible y se compone de: __• Contenidos dinámicos:__ Paginas dinámicas en donde se producen búsquedas por una sola vía. __• Contenidos no enlazados:__ Paginas no tienen vínculos entrantes de otras páginas. __• Contenidos de acceso limitado:__ Que requieren registrarse o que limitan el acceso a sus páginas, prohibiendo que los buscadores los incluyan en sus bases de datos. __• Contenidos “scripted”:__ Páginas que solamente son accesibles a través de enlaces producidos por JavaScript y Flash, las cuales requieren un tratamiento especial. (JavaScript, Flash Player y Adobe son aplicaciones)

__• Contenidos no textuales__: Archivos multimedia, en otros formatos o “usenet”.

**__La Web Profunda se clasifica en:__**

__1. Opaca:__ Compuestas por diferentes paginas excluidas por:

__• Extensión de la indización__: Por economía, no todas las páginas de un sitio son indizadas en los buscadores. __• Frecuencia de la indización:__ Los buscadores indexan de forma periódica y la WWW cambia diariamente. __• Numero máximo de resultados visibles:__ Se limita a 200y 1000 documentos, si el número de resultados es mayor. __• URL’s Desconectados:__ Los buscadores presentan los resultados en base a la cantidad de referencias o enlaces a los sitios, caso contrario la página no será indizada.

__2. Privada:__ Se encuentran protegidas con contraseñas. Contienen archivos “robots.txt”. Contiene un campo “noindex” para evitar que el buscador indique la parte correspondiente al cuerpo de la página.

__3. Propietaria:__ Incluye aquellas paginas en las que es necesario registrarse, ya sea de forma gratuita o pagada. La mayoría de las Webs Profundas son gratuitas y publicas.

__4. Web Realmente Invisible:__ Paginas no indizadas:

• Incluyen formato como PDF, Flash, etc. • Se generan dinámicamente a partir de datos que introduce el usuario. • Almacenan la información en bases de datos. ¿Como buscar en la Web Invisible? Existen buscadores especializados en el segmento de la Web Superficial sino también en la invisible.

Forman parte de la Web profunda: Las bibliotecas, bases de datos, revistas electrónicas y archivos documento, documentos en formato no indizables (mp3, wav, avi, mpeg, etc.). Organismos públicos de gobiernos, ONGs, etc. Que en sus sitios Web disponen de consultas a sus bases de datos.


 * __Libros.__**

__**El archivo de Internet.**__ Asume el reto de preservar el pasado de Internet, y la mayor parte de la información que contiene es estadounidense. Se ingresa a través del sitio: @http://www.archive.org/index.php De sus secciones se destaca Wayback MAchine, que contiene miles de millones de páginas, grabadas desde 1996.