Oltre l’etichetta


Secondo Wikipedia, un tag è "una parola chiave o un termine rilevante associato o assegnato a un’informazione". In realtà, i tag sono molto utili per associare concetti a oggetti digitali come immagini, file audio e video, widget e applet.

Ci sono due vantaggi nell’usare i tag. Innanzitutto, la possibilità di categorizzare contenuti digitali che non possono essere facilmente indicizzati dai motori di ricerca, poiché non esiste un modo semplice per estrarre concetti dal file stesso. Prendiamo un film, ad esempio, un documentario sugli animali. Potreste avere il dialogo, la colonna sonora e vari clip in sequenza, ovviamente. Utilizzando alcuni software sofisticati, potreste generare trascrizioni dal dialogo, identificare il titolo e l’autore della colonna sonora e persino riconoscere il soggetto di alcuni clip, ma sarebbe molto costoso e dispendioso in termini di tempo, e potreste facilmente perdere alcuni aspetti importanti del film che sono evidenti agli esseri umani ma assolutamente nascosti alle macchine. Quindi, l’uso di tag sia per l’intero film che per i singoli clip renderebbe più facile trovare ciò che state cercando utilizzando un motore di ricerca.

Il secondo vantaggio riguarda la possibilità di associare ai contenuti digitali altri pezzi di informazioni che sono logicamente correlati ad essi ma che non possono essere dedotti da essi. Ad esempio, considerate il seguente passaggio dal "Giulio Cesare" di William Shakespeare (Atto 3 Scena 2):

Amici, Romani, concittadini, prestatemi orecchio; vengo a seppellire Cesare, non a lodarlo. Il male che gli uomini fanno vive dopo di loro; Il bene è spesso sepolto con le loro ossa: così sia di Cesare.

È un brano della famosa orazione funebre di Antonio. Ovviamente, non c’è nulla nel testo che possa portarvi a Shakespeare o a Bruto. Quindi potreste voler associare anche William Shakespeare e Bruto a questo testo, così come orazione funebre o tragedia. Aggiungendo tag a questo passaggio miglioriamo la possibilità di trovarlo se stiamo cercando una tragedia di Shakespeare, ad esempio.

Tuttavia, il tagging non è utile solo per gli autori dei contenuti per aggiungere metadati al loro lavoro, ma anche per i visitatori per condividere opinioni, valutare la qualità dei contenuti, fornire qualsiasi tipo di feedback. La classificazione folksonomia su Internet, il social bookmarking e altre forme di software sociale sono tutte basate sui tag. I tag possono essere classificati, collegati tra loro, misurati in termini di utilizzo e frequenza, così come di popolarità.

Molte persone associano il tagging all’idea del Web Semantico, ma è vero? È davvero il meccanismo di tagging uno strato semantico per i contenuti digitali?

Consideriamo la seguente immagine e associamole i seguenti tag: bambino, orsacchiotto, carino, gioia.

Tag associati: bambino, orsacchiotto, carino, gioia.

I primi due termini riguardano il contenuto dell’immagine, cioè, il soggetto. Notate che un computer non può decidere quale sia il soggetto principale dell’immagine, poiché sia il bambino sia l’orsacchiotto sono in primo piano, ma se chiedete a un essere umano, la maggior parte vi dirà che il soggetto è il bambino, non il giocattolo. Pertanto, anche quando entrambi i tag si riferiscono allo stesso aspetto, potrebbero avere rilevanze diverse.

E che dire del terzo tag, carino? Non è forse carino quel bambino? Io penso di sì. Non importa se voi pensate diversamente, perché se permettete a tutti di taggare i vostri contenuti, spetta a loro decidere come taggarli. Questo implica che potreste avere due tag contrastanti associati allo stesso contenuto. In tal caso, dovete sviluppare un qualche meccanismo per decidere quale tag prendere e quale lasciare, o come gestire le incongruenze. Ad esempio, potreste voler implementare un meccanismo di valutazione (da una a cinque stelle, o pollice su e giù) in modo che le persone lo usino piuttosto che i tag per valutare i vostri contenuti. Potete anche dare visibilità a un tag solo se confermato da un numero minimo di persone, nascondendo i tag specificati da pochi individui, ma questo meccanismo democratico potrebbe rimuovere tag utili associati da esperti, ad esempio. E che dire di gioia. Non è forse felice quel bambino? Forse questa immagine evoca in voi un sentimento di felicità. Quindi, quel tag è correlato all’immagine, o piuttosto a voi?

Quindi un tag può completare o estendere qualsiasi contenuto, associare attributi o informazioni logicamente correlate a un oggetto digitale, persino essere assolutamente indipendente dal contenuto stesso ma correlato ad aspetti soggettivi e contingenti, come sentimenti e associazioni di idee. Pertanto, affermare che stiamo aggiungendo semantica agli oggetti digitali taggando i contenuti è sbagliato.

Si può parlare di semantica quando si contestualizzano i tag all’interno di un’ontologia. Cosa significa quel tag? È correlato a quel contenuto o ad altri oggetti che sono correlati a quel contenuto? Riguarda il punto di vista dell’autore o dei visitatori? Come dovrei interpretarlo? È rilevante? Ok, ma per chi?

Prendiamo il tag "verde". Potremmo associarlo a molti concetti diversi: a un colore, ovviamente, ma anche a una posizione politica, e persino a un sentimento: l’invidia. Quindi, potremmo taggare con verde una qualsiasi delle seguenti immagini:

Verdi… i dipinti

Verdi… i valori

Verdi… d’invidia

Senza un’ontologia non possiamo parlare di semantica. Pertanto possiamo usare i tag per aggiungere semantica a un oggetto digitale solo se possiamo collegare quei tag a una o più ontologie formali, descritte utilizzando un linguaggio come OWL, ad esempio. Un ottimo strumento (e gratuito) per creare visivamente ontologie (e molto altro) è Protégé. In realtà è una piattaforma gratuita e open-source che fornisce alle persone una suite di strumenti per costruire modelli di dominio e applicazioni basate sulla conoscenza con ontologie.

Un’ontologia formale è importante, ma non sempre sufficiente, comunque. Infatti, la semantica riguarda il significato, e ogni significato deve essere interpretato all’interno di una cultura, e le culture si esprimono attraverso le lingue naturali. Ci sono concetti che non hanno corrispondenze in culture diverse, altri che hanno un significato o un’interpretazione diversa, altri che usano termini diversi per essere espressi. Il nero è il colore del lutto in molti paesi occidentali, mentre il bianco è il colore per i matrimoni, ma in molti paesi del Medio Oriente è il bianco a essere usato per il lutto. Analogamente, il colore blu non è associato a nessun umore nella cultura italiana. Quindi, semplicemente tradurre il tag non è sufficiente, così come non è sufficiente specificare l’ontologia. Il contesto culturale è il terzo elemento del gioco. Molti ricercatori tendono a sottovalutare questo aspetto perché una parte rilevante del web parla inglese, specialmente quello scientifico, ma anche l’inglese è una lingua usata da molte culture diverse in molti modi diversi.

Quindi, se vogliamo aggiungere semantica al meccanismo di tagging, oltre a un dizionario di termini, abbiamo bisogno di un’ontologia e di un contesto culturale, che potrebbe essere o meno associato a una specifica lingua naturale. Questi sono i tre assi di uno spazio semantico 3D. Si noti che l’attenzione è posta sulla cultura, non solo sulla lingua. Non è semplicemente una questione di traduzione. Probabilmente possiamo usare linguaggi formali esistenti come OWL e RDF per fornire questi assi, ma senza di essi, qualsiasi tagging non fornisce al nostro web più significato agli oggetti digitali di quanto possa essere indicizzato analizzando l’oggetto stesso.


Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *

*