La Web semàntica

Luís Ángel Fernández Hermana - @luisangelfh
1 gener, 2019
Editorial: 269
Fecha de publicación original: 29 mayo, 2001

Qui té trumfos trumfa; qui no en té, rosega

Les llengües humanes, com és natural, son fetes per al consum humà. El llenguatge dgital dels zeros i uns, que en aquest espai hem anomenat ‘llengua única’, és dissenyat perquè les màquines s’entenguin. Entre aquests dos territoris hi ha una gran regió plena de possibilitats enormes: el llenguatge que permeti que les màquines i els humans es comuniquin entre ells, de manera que les primeres entenguin el sentit i el contingut de la llengua humana. Aquest és l’objetiu de l’anomenada “web semàntica”, el projecte que lideren Tim Berners-Lee, inventor de la web i director de World Wide Web Consortium (W3C), i James Hendler, professor de la Universitat de Maryland i investigador de l’Agència de la Defensa per a la Recerca de Projectes Avançats (DARPA), que vindran el proper mes d’octubre a Barcelona per explicar-nos aquest projecte a la II Jornada en.red.ando

La web semàntica –o web intel.ligent, com molts ja l’han batejada– implica efectivament injectar a la Xarxa un grau d’intel.ligència alt i modificar moltes de les premisses en què es basa actualment. Malgrat tot, això no implica el desenvolupament d’una web nova, sinó l’extensió de les capacitats de l’actual mitjançant llenguatges i eines que permetin emmagatzemar la informació a Internet estructurada de manera que les màquines puguin entendre’n el significat des del punt de vista de l’anàlisi semàntica. Serà el primer pas perquè els ordinadors i les persones cooperin proactivament entre ells en el procés de comunicació. Com diu Tim Berners-Lee en un article escrit per al debat promogut per la revista Nature sobre la publicació científica electrònica: “En lloc de demanar que les màquines entenguin el llenguatge dels humans, la nova tecnologia, igual que l’antiga (HTML), demana que la gent faci un esforç extra. A canvi, obtindrà un augment considerable de noves funcions, de la mateixa manera que l’esforç extra de produir HTML va quedar compensat per la disponibilitat de contingut cercable a la web”.

La recerca per desenvolupar la web semàntica implica, per tant, tota una bateria d’eines noves perquè funcioni, des de cercadors avançats fins a agents intel.ligents capaços de negociar entre les màquines el contingut que emmagatzemen, així com d’establir relacions entre els conceptes encara que provinguin de diferents disciplines o àrees de coneixement. Si comprèn el contingut dels documents emmagatzemats a la web, la Xarxa incrementarà exponencialment la capacitat que té de cercar informació, negociar-la entre les màquines i oferir-la amb un grau d'”intencionalitat” elevat. És a dir, podrà mostrar no només la informació o el coneixement que l’usuari sol.licita, sinó també tot el que, encara que no l’hagi inclòs a la demanda, potser serà molt més específic i aquell al qual s’arriba per altres vies.

I viceversa. Emprant el mateix mètode, la web semàntica també pot detectar on hi ha “forats d’informació” (demanda sense prou oferta) i cercar qui podria omplir aquests buits, de manera que obriria un nou camp inesperat de negoci a la Xarxa. Donades aquestes característiques de base, no és estrany que Berners-Lee estigui convençut que, “si és correctament dissenyada, la web semàntica pot ajudar a fer evolucionar el coneixement humà en general”. La seva idea original de la web com a xarxa d’intel.ligència distribuïda, en què màquines i humans cooperaven per millorar la comunicació, s’acosta per aquesta via als objectius que van anar quedant a la vora del camí a causa de les limitacions tècniques de l’època (Berners-Lee “dixit”).

Ara bé, heus ací la gran pregunta: si la web adquireix la capacitat d’obtenir un coneixement semàntic del contingut dels documents que emmagatzema, en quina llengua adquirirà aquesta habilitat, per dir-ho d’alguna manera? Quines estructures semàntiques serà capaç de discernir? Les de totes les llengües? Només les de l’anglès? Quin serà el calendari per anar incorporant totes les llengües a les noves i espectaculars funcionalitats de la web semàntica? Segons els investigadors que dirigeixen el projecte Semantic Web Activity, el nou llenguatge de les màquines, anomenat DARPA Agent Markup Language (DAML), permetrà crear estructures d’informació que les màquines podran comprendre independentment de la llengua d’origen. Però aquest és un objectiu a llarg termini (vulgui dir el que vulgui dir això en l’era d’Internet). Dit d’una altra manera, durant uns quants anys, la web tindrà una inclinació cap a l’anglès no només perquè aquesta serà la llengua que entendrà “millor”, sinó també perquè les funcionalitats de la web seran senzillament tan devastadores que caldrà passar pel sedàs de la web semàntica per veure què ens queda a la mà, i examinar amb molta cura tot el que s’ha dit fins ara sobre llengües globals i llengües locals, així com sobre polítiques lingüístiques a la Xarxa. Sens dubte, aquesta serà una de les àrees més interessants del debat que estem preparant per finals d’octubre a Barcelona amb els promotors d’aquesta innovació fonamental en la comunicació a través de la web, així com amb els que treballen en el “cervell global”, una altra línia de recerca que complementa la web semántica.

print