La Web Semántica

Luís Ángel Fernández Hermana - @luisangelfh
1 enero, 2019
Editorial: 269
Fecha de publicación original: 29 mayo, 2001

Toda la baraja es ases

Las lenguas humanas, como es natural, están hechas para el consumo humano. El lenguaje digital de los ceros y unos que, desde este espacio, hemos denominado lengua única, está diseñado para que se entiendan las máquinas. Entre ambos territorios queda una vasta región preñada de enormes posibilidades: el lenguaje que permita a las máquinas y los humanos comunicarse entre sí, comprendiendo las primeras el sentido y el contenido de la lengua humana. Ese es el objetivo de la denominada “web semántica”, el proyecto que lideran Tim Berners-Lee, inventor de la web y director de World Wide Web Consortium (W3C), y James Hendler, profesor de la Universidad de Maryland e investigador en la Agencia de la Defensa para la Investigación de Proyectos Avanzados (DARPA), quienes vendrán en octubre a Barcelona para explicarnos este proyecto en la II Jornada en.red.ando.

La web semántica –o web inteligente, como muchos ya la han bautizado– implica efectivamente insuflarle a la Red un alto grado de inteligencia y modificar muchas de las premisas sobre las que opera actualmente. A pesar de lo cual, esto no implica el desarrollo de una web nueva, sino la extensión de las capacidades de la actual mediante lenguajes y herramientas que permitan almacenar la información en Internet estructurada de tal forma que su significado sea comprensible para las máquinas desde el punto de vista del análisis semántico. Será el primer paso para que los ordenadores y las personas cooperen proactivamente entre ellos en el proceso de comunicación. Como dice Tim Berners-Lee en un artículo escrito para el debate promovido por la revista Nature sobre la publicación científica electrónica: “En vez de pedir a las máquinas que comprendan el lenguaje de los humanos, la nueva tecnología, como la antigua (HTML), le pide a la gente que haga un esfuerzo extra. A cambio, obtendrá un aumento considerable de nuevas funciones, de la misma manera que el esfuerzo extra de producir HTML quedó compensado por la disponibilidad de contenido buscable en la web”.

La investigación para desarrollar la web semántica implica, por tanto, toda una batería de herramientas nuevas para su funcionamiento, desde buscadores avanzados, hasta agentes inteligentes capaces de negociar entre las máquinas el contenido que almacenan, así como de establecer relaciones entre los conceptos aunque provengan de diferentes disciplinas o áreas de conocimiento. Al comprender el contenido de los documentos almacenados en la web, la Red incrementará de manera exponencial su capacidad para buscar información, negociarla entre las máquinas y servirla con un elevado grado de ” intencionalidad”. Es decir, podrá mostrar no sólo la información o el conocimiento que solicita el usuario, sino también toda aquella que, aunque no incluida en la demanda, sin embargo quizá sea mucho más específica y a la que se llega por otras vías.

Y viceversa. Por el mismo método, la web semántica también puede detectar dónde existen “agujeros de información” (demanda sin oferta suficiente) y buscar a quienes podrían rellenar estas lagunas, abriendo, por tanto, un insospechado campo de los negocios en la Red. Dadas estas características de base, no es de extrañar que Berners-Lee esté convencido de que, “si está correctamente diseñada, la web semántica puede ayudar a la evolución del conocimiento humano en general”. Su idea original de la web como una red de inteligencia distribuida, en la que máquinas y humanos cooperaban para mejorar la comunicación, se acerca por esta vía a los objetivos que se fueron quedando por el camino debido a las limitaciones técnicas de la época (Berners-Lee “dixit”).

Ahora bien, y aquí viene la gran pregunta, si la web adquiere la capacidad de obtener un conocimiento semántico del contenido de los documentos que almacena, ¿en qué lengua adquirirá dicha destreza, por decirlo de alguna manera? ¿Qué estructuras semánticas será capaz de discernir? ¿Las de todas las lenguas, sólo las del inglés? ¿Cuál será el calendario para ir incorporando todas las lenguas a las nuevas y espectaculares funcionalidades de la web semántica? Según los investigadores que dirigen el proyecto Semantic Web Activity, el nuevo lenguaje de las máquinas, denominado DARPA Agent Markup Language (DAML), permitirá crear estructuras de información comprensibles para las máquinas independientemente de la lengua de origen. Pero ese es un objetivo a largo plazo (sea lo que sea lo que esto quiere decir en la era de Internet). En otras palabras, durante unos cuantos años, la web tendrá no sólo una inclinación hacia el inglés porque esa será la lengua que entenderá “mejor”, sino que sus funcionalidades simplemente serán tan devastadoras que todo lo dicho hasta ahora sobre lenguas globales y lenguas locales, así como sobre políticas lingüísticas en la Red, habrá que pasarlo por el fino tamiz de la web semántica y examinar con cuidado qué es lo que nos queda en la mano. Sin duda, esta será una de las áreas de mayor interés para el debate que estamos preparando para finales de octubre en Barcelona con los promotores de esta innovación fundamental en la comunicación a través de la web, así como con quienes trabajan en el “cerebro global”, otra línea de investigación que complementa a la web semántica.

print