Somos como enanos a los hombros de gigantes. Podemos ver más, y más lejos que ellos, no por la agudeza de nuestra vista ni por la altura de nuestro cuerpo, sino porque somos levantados por su gran altura.Bernardo de Chartres
Con el eslogan de "A hombro de gigantes", nos da la bienvenida Google Académico.
Vamos a realizar una búsqueda, para probar esta herramienta, sobre esta gran cita de Bernardo de Chartres que muchos, equivocadamente, atribuyen a Newton.
Palabras Claves: a hombros de gigantes filosofía OR información
El libro debe ser bienvenido
por cuanto supone no sólo la
reunión de textos
fundamentales en la historia
de la física y la astronomía,
sino también porque supone
la traducción al castellano,
por primera vez, de algunos
de los originales
El que se tache de inculta a una
persona que desconozca obras
fundamentales de la literatura
universal como el Tartufo o el Hamlet
y no se extienda dicho
calificativo a la que ignora los textos
fundamentales de la ciencia no deja
de ser algo inexplicable salvo desde la
consideración de tales obras como
algo completamente accesorio.
Vemos como de
acuerdo con la célebre
frase de Newton que da
título a este libro, cada
uno de los autores pudo
llegar a ver lejos por
estar subido a hombros
de gigantes. En las obras de los que les
precedieron
encontraron el acicate
intelectual para corregir
o completar las teorías
anteriores.
Este artículo presenta el avance de un proyecto de investigación cuyo objetivo es el desarrollo de
nuevas tecnologías que faciliten construir y compartir modelos de conocimiento. Usando herramientas
computacionales basadas en mapas conceptuales, usuarios de todas las edades colaboran en su
aprendizaje mediante la construcción y crítica de conocimiento y la navegación a través de sistemas
de multimedia en red creados por expertos. Las herramientas integran nuevas y variadas tecnologías
con enfoques modernos de educación, y de navegación y organización de información.
En el presente artículo se da a conocer algunas de las diferencias
existentes entre la web superficial (surface web) y la web
profunda (deep web), al igual que sus ventajas y desventajas de
ambas; y por último se hace mención al mal uso que le dan
algunas personas a la deep web.
1. INTRODUCCIÓN
Lo que comúnmente llamamos la web en realidad es solo la
superficie. Debajo de ella hay un vasto océano, en su mayoría
inexplorado llamado deep web [1].
Cuando un internauta navega por la web buscando información en
realidad solo lo hace por la superficie, si lograra sumergirse
encontraría un número inconmensurable de páginas que la
mayoría de la gente nunca ha visto que incluyen de todo. La deep web es, por tanto, un recurso que deben tener muy en
cuenta las personas que buscan en internet algo más que
generalidades. El hecho de que Google o Yahoo! no encuentren
una consulta no tiene por qué significar que la respuesta no esté
en internet. Tan solo hay que bucear algo más para encontrar este
mar de información muchas veces desconocido por los usuarios
que se limitan al uso de buscadores comunes [2].
Los buscadores rastrean la red con programas denominados
“arañas”, indizando el contenido de las páginas y saltando de una
a otra siguiendo los enlaces que contienen. Sin embargo estos
programas no pueden indizar o extraer el contenido de esas
páginas cuando esta información se encuentra en bases de datos,
cuya información aparece solo dinámicamente, en respuesta a una
consulta realizada por el usuario [3].
Además de las páginas dinámicas existen otras páginas que no
pueden ser indexadas como los sitios protegidos por alguna
contraseña, documentos en formatos no indexables, páginas que
contienen documentos secretos de estado, contenido de descarga
no gratuita, etc.
Es así que los buscadores solo indizan las páginas estáticas que
equivaldrían al 15 %, el 85% restante estaría dentro de la deep
web. Haciendo una analogía diríamos que el internet que todos
creemos conocer solo es la punta del iceberg y por debajo hay más
información de la que podemos imaginar.
2. SURFACE WEB
La surface web traducida al castellano como la web superficial o
también conocida como web visible es prácticamente la web que
conocemos, con la que tenemos contacto diariamente.
Comprende todos aquellos sitios cuya información puede ser
indexada por los robots de los buscadores convencionales y
recuperada casi en su totalidad mediante una consulta a sus
formularios de búsqueda [4].
Los robots también conocidos como arañas son programas
inteligentes que tienen como labor la búsqueda, indización y
catalogación de la información; lo hacen saltando de una página
web a otra siguiendo los enlaces de hipertexto.
El problema aparece cuando la información requerida se
encuentra en una página que carece de enlaces. En este caso la
única forma que tiene de ser registrada en un buscador es que su
autor la incluya manualmente rellenando un formulario. Caso
contrario, esta web resultará invisible para todos aquellos usuarios
de Internet que no conozcan la URL o dirección concreta [2].
Actualmente la posibilidad de indexar archivos no textuales como
imágenes, audio, video, archivos PDF, archivos comprimidos o
programas ejecutables, se ha convertido en un reto para los
motores de búsqueda más convencionales. Técnicamente la mayoría de estos formatos pueden ser indexados pero muchos
buscadores eligen no hacerlo porque estos formatos son más
difíciles de archivar y organizar, por lo que requieren más
recursos del servidor y un costo económico mayor.
2.1 Ventajas
Las ventajas más notorias de la web superficial que se pueden
mencionar son:
Ser de libre acceso.
Su información no está contenida en bases de datos.
No requiere la realización de un proceso de registro
para acceder.
2.2 Desventaja
Como la desventaja más relevante que tiene la web superficial se
puede mencionar el acceso a solo una parte pequeña de toda la
información online que existe.
3. DEEP WEB
La web profunda que viene del inglés deep web también conocida
por muchos otros nombres como invisible web, hidden web entre
14
otros, es sin duda toda esa información a la que no tenemos
acceso mediante los buscadores más comunes.
La web profunda es el término utilizado para describir toda la
información disponible en Internet que no es recuperada
interrogando a los buscadores convencionales. Generalmente es
información almacenada y accesible mediante bases de datos [4].
La deep web o internet profunda son redes que escapan a los
buscadores más conocidos de la superficie, de ahí su nombre. Sus
páginas, manuales, documentos, no están indexados y necesitamos
usar programas específicos para poder acceder a ellas. Son las
bases de datos no indexadas, son redes que no quieren mantener
comunicación con la Internet común, son las entrañas de la red,
los suburbios [5].
La deep web contiene millones de datos a los que solo se puede
acceder con navegadores especializados, tanto para actividades
legales como para cometer delitos.
Se dice que en la deep web no se navega, se bucea, y es muy
común sentirse perdido las primeras veces; se trata de un ejercicio
nuevo en un elemento conocido y eso genera cierta confusión y
tendencia a abandonar el intento. Los principales problemas con
los que tropezamos son: el desconocer los enlaces de interés y el
no saber cómo llegar a ellos.
También es muy común que al intentar acceder a un servicio de la
deep web, este se encuentre caído, perdido o muerto. Hay que
tener en cuenta que el mantenimiento de esas páginas no es tan
habitual como el de una página web comercial, la de un periódico
digital o un blog famoso, pero como todo en esta vida, no tenemos
más que seguir buscando para encontrar los que realmente son
buenos enlaces.
3.1 Ventajas
Las ventajas de la deep web sobre la surface web claramente
oscilan entre el mayor volumen de información y el tipo de
contenido de esta información difícil de conseguir. De este último
podríamos destacar algunos contenidos ansiados por miles de
personas:
Revistas electrónicas.
Tesis Doctorales.
Estadísticas e informes.
Diccionarios y enciclopedias.
Materiales discográficos.
3.2 Desventajas
Las desventajas que llaman más la atención son:
Los buscadores convencionales no pueden indizar su
contenido.
Tener que instalar un buscador especial como ser TOR,
o para dispositivos móviles ORBOT.
Contenido que en muchos casos solo está disponible por
poco tiempo.
Búsqueda difícil al no saber por dónde empezar y por
dónde continuar.
Mal uso que le dan algunos personas.
De este último punto se hará una explicación más detallada en el
siguiente apartado.
3.3 Mal uso de la Deep Web
Al ser un lugar de difícil acceso y desconocido por la mayoría de
la gente la deep web ha sido utilizada por muchas personas para
realizar toda clase de actos fuera de la ley.
Se realizan tráfico de órganos, de personas y de armas. Se vende
todo tipo de drogas, hay infinidad de sitios que contienen
pornografía infantil, inclusive se dice que hay sitios donde se
puede contratar a sicarios e ingresar a chats donde se planean
secuestros, robos y asesinatos.
De esta manera es que la deep web se convierte en un suburbio,
aunque el anonimato de las personas que frecuentan estos sitios
detestables parece ser una ventaja para ellos, existen personas que
buscan estos sitios para denunciarlos y ayudar a capturar a los
responsables de estas páginas.
Con esto no quiero decir que todo lo que se hace en los suburbios
sea bueno o malo, quiero decir que el anonimato y sus
posibilidades son una herramienta más, no un modo moderno de
ser impune [5].
4. DIFERENCIAS ENTRE SURFACE WEB
Y DEEP WEB
A continuación se presenta una tabla (ver tabla 1) extraída de [4]
que presenta las diferencias existentes entre la web superficial y la
web profunda:
Tabla 1. Diferencias entre Surface Web y Deep Web
5. CONCLUSIONES
A pesar de que la web superficial que conocemos contiene mucha
información no es suficiente para satisfacer a las personas en su
búsqueda del conocimiento es por eso que intentamos
sumergirnos en la web profunda para ampliar nuestra búsqueda.
Ahora bien, al momento de sumergirnos en la web profunda hay
que saber dónde buscar y hacerlo con la mayor responsabilidad
posible, es mejor evitar los sitios donde hay toda clase de
15
ilegalidades, ya que al hombre todo lo prohibido le genera gran
interés aunque diga lo contrario solo por no ser rechazado por la
sociedad. Una frase que resume todo es “Si juegas con fuego te
puedes quemar”.
Es posible que en un futuro casi toda la información que se
encuentra en la web profunda esté disponible para todos por la
evolución que tienen los motores de búsqueda tradicionales como
Google, Yahoo!, AltaVista, entre otros.
Existen diferentes tipos de herramientas de búsqueda de información en Internet. Cada una
de ellas funciona de una manera diferente y tiene su propio propósito y su alcance. Aquí nos
referiremos a: buscadores, metabuscadores, directorios, guías y software
especializado.
Se denomina sobrecarga informativa, infoxicación o
infobesidad es un concepto generalmente usado en conjunto con varias formas de
comunicación por computadora tales como el correo electrónico. Se refiere al
estado de contar con demasiada información para tomar una decisión o permanecer
informado sobre un determinado tema. Grandes cantidades de información
histórica para analizar, una alta tasa de nueva información siendo añadida,
contradicciones en la información disponible, una relación señal/ruido baja
dificultando la identificación de información relevante para la decisión, o la
ausencia de un método para comparar y procesar diferentes tipos de información
pueden contribuir a este efecto.
El término (del inglés information overload) fue acuñado en
1970 por Alvin Toffler en su libro Future Shock.(1)
El temino “infoxicación” fue introducido por Alfons Cornella en 1996, refiere
actualmente a la idea de que la sobrecarga de información que recibe un
usuario, en especial de Internet en todas sus formas, puede causarle la
sensación de no poder abarcarla ni gestionarla y, por tanto, llegar a generarle
una gran angustia. Este término, infoxicación, surge de la unión de las
palabras información e intoxicación.
José Ignacio Aguaded Gómez, en su artículo "Desde lainfoxicación al derecho a la comunicación" expresa: "Asistimos, sin duda, a una hiperconexión compulsiva y una
sobreinformación global, a una obsesión por la comunicación perpetua vacía de
contenidos… La infoxicación, la infopolución… se ha hecho realidad en nuestras
vidas".
En una entrevista realizada al escritor italiano Umberto
Eco le preguntaron lo siguiente: "A pesar de la evolución, ¿ve Internet
como un peligro para el conocimiento?" y parte de su respuesta fue:
"Internet es todavía un mundo salvaje y peligroso. Todo llega allí sin
jerarquía. La inmensa cantidad de cosas que circula es peor que la falta de
información. El exceso de información provoca amnesia. El exceso de información
es malo".
El profesor de la Universidad de Nueva York Clay Shirky
aseguró en la Web 2.0 Expo de 2010 que “El problema no es la sobrecarga de
información, es que el filtro no funciona”.
Problemas que derivan de esta sobrecarga
Así, nos encontramos hoy con una red sobresaturada, llena de
información (muchas veces inútil, errónea o incompleta) y publicidad molesta e
inservible (spam, banners, pop-ups).
En un entorno así, la búsqueda de informaciones concretas se
hace dificultosa y la posterior clasificación de la información por su
corrección, calidad, etc. conlleva mucho trabajo.
Las empresas son quienes mayores problemas tienen para
encontrar la información que les es necesaria entre tantos millones de datos.
Posibles soluciones para la sobrecarga informativa
Los expertos consideran extremadamente difícil y laboriosa
la tarea de clasificar los millones de datos que la red contiene.
Estas son algunas de las actuales herramientas que se usan
contra tal avalancha informativa:
Los rastreadores de información.
Son unos programas capaces
de rastrear en Internet y encontrar y clasificar la información que se busca
(datamining). Se trata de tecnologías del sector de las ingenierías del
contenido, que permiten la extracción y organización de datos que provienen de
unidades de contenido sin estructurar (como sitios web o documentos de texto).
Estos programas son especialmente útiles en empresas y
compañías que precisan diferenciar la información que les afecta de la que no,
entre millones de datos existentes.
Barras que suprimen ventanas emergentes.
Multitud de
portales y sistemas operativos y exploradores para Internet ofrecen servicios
de supresión automática de ventanas emergentes (banners), que normalmente
contienen publicidad. El inconveniente de estos pequeños programas es que
muchas veces eliminan también ventanas necesarias para la navegación por un
sitio determinado, de manera que debe de habilitarse temporalmente esa opción.
Clasificación del correo electrónico.
Se trata de un
servicio para el correo electrónico que muchos portales ofrecen ya. Se trata de
marcar ciertos mensajes de correo electrónico como publicidad o no deseados,
evitando así recibirlos en la bandeja de entrada la siguiente vez. Esta clase
de herramientas son muy útiles contra el llamado spam, o mensajes publicitarios
masivos. Sin embargo, muchas veces, cuando alguien a quien no tenemos en
nuestra lista de direcciones nos envía un correo, éste va a parar a estas
sub-bandejas especiales, pudiendo perderlo.
(1) Future Shock, El shock del futuro
Future Shock es un libro escrito por el futurista Alvin
Toffler en 1970.
En el libro, Toffler define el término shock futuro como un
estado psicológico concreto que afecta tanto a individuos como a sociedades
enteras. La definición más corta del término es la percepción personal de
"demasiado cambio en un período de tiempo demasiado corto".
El libro, que se convirtió en un superventas a nivel
internacional, se escribió a partir del artículo "The Future as a Way of
Life" aparecido en la revista Horizon, en verano de 1965.
En 1972 aparece un documental basado en el libro, con Orson
Welles como narrador.
Hola a todos, mi nombre es Mara, soy un perito químico
industrial, con formación complementaria en calidad. Soy apasionada de informática
y tengo una web personal en sus comienzos.
www.mararasulo.es
Me apuntado al curso “Como encontrar tesoros en la web” para
poder afinar mis búsquedas en Internet de contenidos sobre temas de interés de mi
sector (industrias, calidad, software libre, aplicaciones web) para mi web.
Empiezo la aventura con este blog de formación, con la
esperanza que mi experiencia y mis progresos os sean útiles.