Di chi ci possiamo fidare?


Sommario

Al giorno d’oggi, l’affidabilità dei contenuti è estremamente importante sul web. Possiamo trovare qualsiasi tipo di informazione su Internet, ma quanto è affidabile una fonte? Quanto sono accurate le informazioni fornite? Diversi aggregatori di feed ed elenchi di siti hanno definito vari criteri per valutare siti e blog, ma la maggior parte di essi pretende di automatizzare il processo, rendendo la classifica risultante discutibile. Al momento, il miglior approccio è ancora basato su recensioni umane, ma in questo modo stiamo solo spostando il problema: quanto è affidabile un recensore? Come posso misurare la sua affidabilità? Lo scopo di questo articolo è proporre una soluzione alternativa per definire l’affidabilità dei contenuti pubblicati sul web e per misurare la reputazione dei recensori.

Una questione di fiducia

Non esiste una prova irrefutabile delle dimensioni del web. Alla data in cui scrivo, alcune fonti riportano 60 miliardi di pagine indicizzate, altre fino a un trilione. Tuttavia, mentre da un lato una percentuale significativa del web non è affatto indicizzata, dall’altro dobbiamo tenere conto di molti duplicati e della proliferazione di varianti della stessa informazione. Quindi è difficile fornire un quadro affidabile. Comunque, c’è una cosa sicura: il web è grande.

Questo riguarda le dimensioni, ma che dire del contenuto? Quanto è affidabile una singola informazione? Quanto è accurata? In generale, non c’è modo di saperlo. È una questione di fiducia. Supponendo che sappiate con certezza chi ha caricato quella informazione, la vostra valutazione dipende da quanto vi fidate dell’autore o autrice. Ovviamente, se conoscete direttamente chi ha scritto il testo, non è un problema, ma nella maggior parte dei casi non avete modo di conoscere l’individuo che ha pubblicato un contenuto sul web. In alcuni casi, non conoscete nemmeno il suo vero nome. E allora? Bene, nel mondo reale ognuno di noi si fida basandosi sull’esperienza personale e sulle opinioni altrui, cioè su una rete di reputazione. Se A si fida di B e B si fida di C, allora A potrebbe fidarsi di C. Non è un approccio infallibile, ma di solito funziona.

Affidabilità delle fonti

Se ci concentriamo sulle fonti di informazione tradizionali, come giornali, canali di notizie, imprese e governi, lo scenario può variare da Paese a Paese. In alcuni Paesi alcuni media possono essere considerati per lo più affidabili, ma ciò non è necessariamente vero in ogni Paese e per ogni media. Anche nei Paesi democratici e liberali c’è sempre il rischio che alcune informazioni siano manipolate a causa di pressioni culturali, religiose o politiche.

Nel mondo virtuale alcuni siti hanno una buona reputazione. Ad esempio Google, Amazon o Wikipedia. Tuttavia, anche in questi casi dobbiamo essere molto cauti. Consideriamo Wikipedia, per esempio. Il fatto che ogni articolo sia potenzialmente il risultato del contributo di molti autori potrebbe essere considerato una garanzia, ma poiché ogni sito Wikipedia è in qualche modo legato a una cultura specifica e talvolta a un Paese specifico, potrebbe rappresentare solo un punto di vista. Per evitare ciò, ad esempio, nella Wikipedia in inglese esiste un WikiProject per contrastare il bias sistemico, ma è ancora una proposta. Allo stesso modo, alla maggior parte degli articoli di Wikipedia è richiesto di fornire riferimenti per supportare qualsiasi affermazione discutibile inclusa nel testo, ma come possiamo fidarci di un riferimento? Ad esempio, cosa succede se il riferimento riguarda una pubblicazione in un’altra lingua perché non ce ne sono nella stessa lingua dell’articolo? Alcuni wikipediani hanno un approccio molto severo riguardo ai riferimenti in lingue straniere, ma in alcuni casi un approccio così ragionevole potrebbe discriminare articoli relativi a individui, eventi e concetti appartenenti ad altri Paesi. Non è facile definire una regola sicura al riguardo.

Blogsfera

Una delle aree più popolari del web, dove si applicano i metodi di valutazione e classificazione, è la blogsfera. All’inizio, i meccanismi di valutazione si basavano sul numero di volte in cui un certo blog veniva collegato ad altri blog. Tuttavia, i blogroll e strumenti simili hanno completamente vanificato tale approccio. Pertanto, alcuni siti hanno iniziato a valutare i blog in base al numero di link e trackback solo se inclusi negli articoli di altri blog. Tuttavia, questo approccio non dice nulla su quanto sia buono il post di riferimento. Ab absurdo, se un articolo è “cattivo e inaffidabile” e migliaia di blog lo indicano, in effetti, come cattivo e inaffidabile, otterrà comunque una grande valutazione.

Un terzo approccio si basa su social bookmarking e voti diretti. Ad esempio, questo meccanismo è utilizzato da Digg. Non è male, poiché si basa su recensioni umane piuttosto che su algoritmi per valutare un contenuto. Tuttavia, anche questo approccio è discutibile, poiché non misura realmente l’affidabilità del contenuto ma la popolarità del blog. È diverso. Se un articolo è legato a qualche pettegolezzo interessante o tratta di una personalità, prodotto o evento popolare, probabilmente otterrà un alto punteggio anche se il suo contenuto è banale. Inoltre, tale approccio discrimina tra i blog in diverse lingue, poiché la classificazione è proporzionale al pubblico potenziale, cioè le lingue più parlate sono favorite rispetto a quelle minori e ai dialetti. Inserire nella stessa lista blog scritti in diverse lingue non ha senso, in effetti.

Ultimo ma non meno importante, il fatto che possiate leggere una specifica informazione non implica che possiate avere abbastanza competenze per capirla. Questo è particolarmente vero per articoli scientifici e tecnici. Uno dei difetti del voto è che tutti i voti contano allo stesso modo. Tuttavia, non tutti i votanti hanno la stessa competenza. Pregiudizi, ideologie, credenze e altri fattori umani non obiettivi potrebbero influenzare il risultato finale. Inoltre, un gruppo di blogger potrebbe creare vere e proprie lobby digitali per sostenere un punto di vista specifico o semplicemente per sostenersi a vicenda.

Conclusioni

Per riassumere, la maggior parte dei meccanismi di valutazione non misura l’affidabilità, ma la popolarità, e la popolarità è legata a quanto sia famoso il soggetto dell’articolo, a quante persone siano in grado di leggere quell’articolo a causa della lingua, a quanti lettori siano in grado di capire quell’articolo a causa delle competenze, e a quanto onesta e affidabile sia la rete di reputazione che si riferisce a quel sito o autore specifico. Quindi sia i meccanismi automatizzati che gli approcci basati sui social sono discutibili.

Il problema della fiducia non è tipico del web. È sempre esistito ed è già stato parzialmente risolto in settori specifici della società umana. Un approccio valido utilizzato nelle imprese si basa su autorità di certificazione. Questo metodo di solito fallisce solo quando sono in gioco grandi interessi economici, altrimenti è abbastanza affidabile. Un’autorità di certificazione è di solito specializzata su contenuti, processi e competenze specifici. Deve anche essere conforme a regolamenti spesso stabiliti dalle leggi. Quindi, ad esempio, se un’azienda ha bisogno di dimostrare di essere conforme alla ISO 9000, deve essere certificata da un auditor indipendente. Lo stesso approccio potrebbe essere utilizzato sul web. Ovviamente, essere certificati come “fonte di informazione affidabile” non può essere un obbligo. Tutti i meccanismi che ho descritto in precedenza in questo articolo possono applicarsi e, in ogni caso, “non essere certificati” non significa “non essere affidabili”. Tuttavia, i meccanismi di certificazione indipendenti sono già utilizzati sul web. Un esempio è il sistema di etichettatura ICRA, di FOSI. ICRA non è un meccanismo di valutazione, ma di etichettatura; comunque il principio è simile.

Solo una proposta

Quello che dobbiamo fare è definire un sistema di valutazione per misurare solo l’affidabilità dei contenuti. I valori di valutazione dovrebbero essere leggibili sia dagli esseri umani che dalle macchine attraverso un linguaggio semantico, ad esempio, RDF. Più di una valutazione potrebbe essere applicata allo stesso sito nel caso trattasse di diversi argomenti, mentre un singolo valore di valutazione dovrebbe essere utilizzato per un articolo specifico o una parte di informazione. La certificazione del sito non dovrebbe essere per sempre, ma dovrebbe scadere periodicamente, in modo che sia necessario rinnovarla. D’altra parte, i certificati degli articoli possono essere considerati sempre validi a meno che il contenuto non venga modificato.

Un esempio di snippet relativo a un blog potrebbe apparire così:

<rdf:RDF>
	<rdf:Rating about="https://www.myblog.biz"
	  certifiedBy="https://www.certauth.biz&quot; 
	  expireOn="20081023">
		<rcl:rate for="astronomy">AAA+</rcl:rate>
		<rcl:rate for="physics">AA</rcl:rate>
		<rcl:rate for="cousine">C</rcl:rate>
		<rcl:rate for="gardening">F</rcl:rate>
	</rdf:Rating>
	<!-- some signature to validate the snippet -->
</rdf:RDF>

Ovviamente, questo è solo un esempio. Una realizzazione reale richiederà probabilmente un’analisi più approfondita del problema e qualche meccanismo di sicurezza per prevenire frodi. In ogni caso, l’idea di utilizzare auditor indipendenti, la cui affidabilità sarà basata sulla conformità a regolamenti ben definiti, potrebbe funzionare. Ovviamente, la maggior parte dei blogger non si preoccuperà di essere valutata da un’autorità di certificazione, ma se desiderano essere considerati affidabili da altre fonti affidabili, questo è probabilmente l’approccio più efficace. Almeno secondo la mia umile opinione.


Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *

*