domingo, 6 de marzo de 2016

LA CARACTERIZACIÓN DE LA WEB SUPERFICIAL Y LA WEB PROFUNDA


Los buscadores tradicionales sólo ofrecen acceso a una pequeña parte de lo que existe online, lo que se ha comenzado a llamar la Web superficial o visible. Lo que resta, la Web profunda o invisible, es un amplio banco de información ubicado en catálogos, revistas digitales, blogs, entradas a diccionarios y contenido de sitios que demandan un login (aunque sea gratuito) y otros tipos de contenido que no aparecen entre los resultados de una búsqueda convencional. 

La Web Superficial o visible 

Las características principales de los sitios de la Web visible son: 

  • Su información no está contenida en bases de datos
  • Es de libre acceso
  • No se requiere la realización de un proceso de registro para acceder a la información. 
  • Mayoritariamente está formada por páginas Web estáticas, es decir páginas o archivos con una URL fija y accesibles desde otro enlace. 


La Web Profunda o invisible 


Web invisible es el término utilizado para describir toda la información disponible en Internet que no se recupera interrogando a los buscadores convencionales. 

Generalmente es información almacenada y accesible mediante bases de datos. Parte de la información es "invisible" a los robots de los buscadores convencionales, ya que los resultados se generan en la contestación a una pregunta directa mediante páginas dinámicas (ASP, PHP, etc.) es decir páginas que no tienen una URL fija y que se construyen en el mismo instante (temporales) desapareciendo una vez cerrada la consulta.


Sherman y Price identifican cuatro tipos de contenidos invisibles en la Web: 

  • La Web opaca (the opaque Web)
  • La Web privada (the private Web)
  • La Web propietaria (the proprietary Web)
  • La Web realmente invisible (the truly invisible Web).


Según Lluis Codina: “Internet invisible es un nombre claramente inadecuado para referirse al sector de sitios y de páginas web que no pueden indizar los motores de búsqueda de uso público. Debería denominarse, en realidad, la web "no indizable", lo cual es un término mucho más adecuado”.

No hay comentarios:

Publicar un comentario