Tradotto dall’articolo originale in inglese.
Prefazione
Questa prefazione non è un’introduzione gratuita al mio articolo, o solo un modo per giustificare eventuali conseguenze della mia limitata conoscenza della lingua inglese, ma una componente fondamentale di questo testo perché evidenzia uno dei problemi più critici del web oggi: la lingua inglese come un must per essere parte attiva della nuova Piattaforma Web 2.0.
L’inglese non è la mia lingua madre, e anche se sono uno scrittore italiano, non sono così fluente in inglese come lo sono nella mia lingua. Quindi, perché ho scritto questo articolo in inglese? Perché oggi l’inglese è una sorta di lingua franca del web. La maggior parte delle persone che usano Internet sono in grado di leggere l’inglese, anche se non è la loro lingua madre. Se scrivi un articolo in inglese, molte persone saranno in grado di leggerlo e, se l’articolo è buono, qualcuno potrebbe decidere di tradurlo in altre lingue. Ma se lo scrivi in un’altra lingua, specialmente una lingua non molto conosciuta nel mondo come l’italiano, hai poche possibilità che venga tradotto in inglese, anche se è un testo eccellente. Un altro vantaggio è che se ti riferisci ad altri articoli popolari — una pratica molto comune sul web — che di solito sono anch’essi in lingua inglese, sarai sicuro che le citazioni saranno esatte e non fuorvianti, mentre riferimenti a traduzioni possono sempre introdurre alcuni fraintendimenti.
D’altra parte, scrivere in una lingua diversa dalla tua ha seri svantaggi. Prima di tutto, non puoi davvero competere con gli scrittori nativi sia in termini di contenuti che di stile. Il tuo stile di scrittura sarà per definizione più povero, perché non sei così sicuro di quella lingua come lo sei della tua. Il tuo testo potrebbe essere meno leggibile o addirittura noioso per il lettore nativo, così come i fraintendimenti saranno più probabili. Le lingue non sono diverse solo per le parole e la sintassi, ma lo stile di comunicazione stesso differisce da una lingua all’altra. Una traduzione semplice, anche se perfetta dal punto di vista sintattico, può impedire al lettore di terminare l’articolo, anche se l’argomento è interessante. Dal punto di vista del contenuto, il tuo testo potrebbe essere troppo semplice, infantile, a causa della tua limitata conoscenza del vocabolario dell’altra lingua. In qualsiasi lingua ci sono molte parole che hanno per lo più lo stesso significato — spesso ci riferiamo a loro come sinonimi — ma che non sono perfettamente intercambiabili. Usare un termine piuttosto che un altro dà ai lettori un sapore diverso, supporta la comunicazione, arricchisce il tuo messaggio.
Ultimo ma non meno importante, se vuoi scrivere un articolo in un’altra lingua, devi pensare in quella lingua, e poiché non è la tua, sarà più difficile per te scrivere l’articolo, più stancante, influenzando la tua capacità di raggiungere l’eccellenza, l’obiettivo finale di qualsiasi buon scrittore. Ogni buon articolo, infatti, qualunque sia l’argomento, è un’opera d’arte, e ogni buon scrittore non è contento di pubblicare qualcosa di cui non è orgoglioso.
Alla fine ho deciso che i vantaggi erano maggiori degli svantaggi, quindi ho scritto l’articolo direttamente in inglese, chiedendo a un mio amico americano di rivederlo e correggere almeno gli errori più evidenti. Quello che è ancora sbagliato, è colpa mia, ovviamente. A proposito, ho scritto tutti i miei post sul blog in italiano, fino ad ora. Questo è il primo in inglese. In futuro probabilmente scriverò altri articoli in inglese ogni volta che giudicherò che il contenuto merita una visibilità mondiale.
Cos’è il Web 2.0
Se vuoi sapere cos’è il Web 2.0 probabilmente vorrai leggere l’articolo di Tim O’Reilly. È stato tradotto in varie lingue, inclusa l’italiano. L’articolo di O’Reilly offre una panoramica molto buona degli elementi principali che caratterizzano un sito Web 2.0. Non ti fornisce davvero una definizione, comunque, ma una lista di principi da considerare quando valuti se un sito può essere considerato Web 2.0 o meno. Infatti, secondo Tim e altri analisti web, un buon sito Web 2.0 dovrebbe:
- fornire servizi, non solo un software confezionato, e garantire la scalabilità economica,
- essere basato su fonti di dati uniche e difficili da ricreare che diventano più ricche man mano che più persone le utilizzano,
- fidarsi degli utenti come co-sviluppatori,
- sfruttare l’intelligenza collettiva,
- far leva sulla “coda lunga” attraverso funzionalità “fai-da-te”,
- essere potenzialmente distribuibile su qualsiasi dispositivo,
- fornire agli utenti interfacce utente leggere, modelli di sviluppo e modelli di business.
Questo è un buon approccio pratico, spesso utilizzato in Fisica e altre scienze, e si chiama definizione operativa, cioè una definizione di un concetto che spiega come può essere osservato piuttosto che cos’è. Colloquialmente, una definizione operativa ti dice “come riconoscerla quando la vedi”.
Tuttavia il web non è qualcosa regolato da leggi naturali, ma un ambiente in continua evoluzione. La definizione operativa di un evento fisico può durare anni, è una definizione a lungo termine, e cambia solo quando vengono sviluppati nuovi strumenti per misurare nuovi parametri che sostituiscono in tutto o in parte i vecchi. Ma ciò che chiamiamo Web 2.0 si evolve così rapidamente che in teoria dovremmo parlare di Web 2.0.1, 2.0.2, 2.0.3, e così via. Cioè, una definizione operativa del Web 2.0 rischia di essere continuamente aggiornata, limitando il suo valore intrinseco. Questo è in contraddizione con il principio riportato da Tim, che al Web 2.0 non si applica più il tradizionale Software Life Cycle, ma quello che potremmo chiamare un Sviluppo Continuo “Beta”. Quindi abbiamo bisogno di una definizione più generale che evidenzi i fattori distintivi che caratterizzano il Web 2.0.
Inoltre, l’articolo di Tim è molto focalizzato su siti e aziende specifici, ma il Web 2.0 non è solo basato sempre più sui mashup, ma la maggior parte dei siti che aggregano dati da altre fonti stanno diventando essi stessi nuove fonti di dati perché costruiscono valore come effetto collaterale dell’uso ordinario delle loro applicazioni. Quindi il Web 2.0 sta diventando sempre più una piattaforma ampia dove i prosumers sono i nuovi attori del web, e aziende come Google o eBay sono driver e facilitatori. L’utente non è più esterno al sistema, ma parte integrante di esso. Questo non è un concetto totalmente nuovo, ma è ben noto agli specialisti ICT come una caratteristica dei Sistemi di Gestione della Conoscenza.
Quindi, come dovremmo costruire una nuova definizione di Web 2.0 che non sia limitata a come il web sta evolvendo oggi, ma che stabilisca principi a lungo termine per un ambiente in continuo cambiamento? A mio parere personale dovrebbe affermare:
- di cosa stiamo parlando, cioè qual è l’oggetto chiamato “Web 2.0”,
- a cosa serve, cioè lo scopo o le ragioni della sua esistenza,
- come funziona e su quale design architettonico è basato.
Quindi ho sviluppato diverse definizioni negli ultimi mesi, ma nessuna era soddisfacente fino a quando non ho sviluppato questa. Ovviamente, non pretendo che sia la definizione definitiva del Web 2.0, ma solo il mio piccolo contributo per capire ciò che considero non solo un’evoluzione tecnologica, ma un evento sociale globale che influenzerà centinaia di milioni di persone nel mondo.
Il Web 2.0 è un ambiente orientato alla conoscenza dove le interazioni umane generano contenuti che vengono pubblicati, gestiti e utilizzati attraverso applicazioni di rete in un’architettura orientata ai servizi.
Approfondiamo questa affermazione. Prima di tutto, cos’è il Web 2.0: un ambiente orientato alla conoscenza. Non un sito, non un server o un gruppo di server, non una singola comunità o un team. È un ambiente. Un ambiente è più di una piattaforma. Una piattaforma è la fondazione di un ambiente, ma un ambiente è un ecosistema autopoietico che coinvolge molti attori diversi a vari livelli che interagiscono tra loro.
Ma qualsiasi ecosistema è basato su regole. Ad esempio, gli ecosistemi naturali sono basati sui principi della sopravvivenza e della selezione naturale. Il principio di sostegno che è alla base del Web 2.0 è la conoscenza. La conoscenza è più di semplice informazione, così come l’informazione è più dei dati. Ci sono diverse definizioni di conoscenza. La mia preferita è la seguente:
La conoscenza è la correlazione di dati e pezzi di informazione con esperienze personali o di gruppo e lezioni apprese, che crea una nuova consapevolezza parziale.
In pratica, non esiste conoscenza a meno che non ci sia qualcuno che possa usarla. Al contrario, l’informazione è solo un insieme di dati associati a un contesto specifico, che esiste indipendentemente da qualcuno che possa usarla. Questa definizione ha un’importante implicazione: non è possibile memorizzare la conoscenza come facciamo con l’informazione. Spesso potresti aver sentito parlare di basi di conoscenza come banche dati dove è memorizzata la conoscenza. A mio parere personale, le basi di conoscenza non contengono vera conoscenza, ma pezzi di conoscenza pre-digerita che diventano vera conoscenza solo quando entrano in contatto con un essere umano, cioè un’intelligenza. Infatti, qualunque cosa leggi, potrebbe o non diventare conoscenza a seconda di chi la legge. Gli stessi pezzi di informazione dati a diverse persone possono portarle a conclusioni diverse o a nessuna conclusione a seconda delle loro competenze ed esperienze.
Diversi anni fa ho sviluppato una definizione di intelligenza, una definizione operativa, che considero particolarmente utile quando dobbiamo capire come le persone creano, acquisiscono e usano la conoscenza.
L’intelligenza è la capacità di eseguire correlazioni tra vari pezzi di informazione ed esperienze.
In pratica, dato un insieme di pezzi di informazione ed esperienze, più velocemente sei in grado di correlare quei pezzi tra loro, e più ampio è il network risultante che sei in grado di gestire, più sei intelligente. Mi piace questa definizione perché non è strettamente legata alla logica e al lato razionale del nostro cervello. Non ho specificato che le correlazioni devono essere collegamenti logici. Qualsiasi tipo di correlazione si applica. Quindi, può riferirsi al modo in cui un artista crea un dipinto, o un compositore crea una melodia. Possiamo applicare questa definizione all’intelligenza artistica così come a quella scientifica, al lato destro del cervello così come a quello sinistro.
Puoi facilmente vedere un collegamento ora tra la mia definizione di intelligenza e la precedente definizione di conoscenza che ho menzionato. Per creare, acquisire, gestire ed usare la conoscenza in modo efficiente ed efficace, devi essere davvero intelligente. Sembra una dichiarazione banale, ma è semplicemente una diretta conseguenza di entrambe le definizioni, che non sono affatto banali.
E questo ci porta ora alla seconda linea della mia definizione di Web 2.0: l’ambiente Web 2.0 è dove le interazioni umane generano contenuti che possono diventare conoscenza quando messi in contatto con le persone. Non è semplicemente un trasferimento di conoscenza. La conoscenza risultante non è necessariamente l’unione dei know-how che hanno generato quel contenuto, ma poiché dipende dalle caratteristiche peculiari del destinatario, potrebbe essere qualcosa di nuovo. Questa è la forza del Web 2.0: qualunque idea metti nel calderone può essere raccolta e generare una nuova idea o essere cambiata in modo tale che difficilmente potrai riconoscere la tua idea originale.
Pezzi di conoscenza? Nodi di contenuto di una grande rete in crescita? Abilità? Esperienza? Torniamo alla mia definizione di intelligenza: la capacità di creare una rete di correlazioni tra nodi che rappresentano pezzi di informazione ed esperienze. Riesci a vedere il parallelo con il Web 2.0? Quindi il concetto di intelligenza collettiva sorge naturalmente. Più velocemente e ampiamente possiamo creare collegamenti preziosi tra pezzi di informazione nel web, maggiore sarà l’intelligenza collettiva della rete.
Ora, consideriamo la seguente definizione:
La gestione della conoscenza è una disciplina il cui obiettivo è garantire che l’informazione giusta sia disponibile alla persona giusta al momento giusto per prendere la migliore decisione possibile.
Potremmo parlare per ore del significato di questa definizione, specialmente per quanto riguarda il termine “giusto”, ma ora vorrei attirare la tua attenzione sulle ultime parole: per prendere la migliore decisione possibile. Questo è il motivo per cui dobbiamo conoscere: per decidere. Ogni decisione richiede di avere abbastanza conoscenza per prenderla. Più conoscenza hai, più affidabile sarà la decisione. Questo vale anche per il Web 2.0. Ecco perché nella mia definizione parlo di pubblicare, gestire e usare il contenuto generato dalle interazioni umane. Wikipedia non avrebbe senso se nessuno la usasse, né il PageRank di Google o i Feedback di eBay avrebbero valore se non fossero utili per decidere se il contenuto di un sito o un venditore fosse affidabile.
Quindi ora sappiamo cos’è il Web 2.0 e a cosa serve: un ambiente orientato alla conoscenza per condividere contenuti generati dalle interazioni umane. Ma come funziona? È importante per la sua definizione? Secondo Tim, il Web 2.0 deve essere indipendente dall’hardware e dal software, quindi sembra che non lo sia. Tuttavia possiamo descrivere i principi architettonici di un sistema senza legare il sistema a una specifica implementazione. Il Web 2.0 è basato su applicazioni di rete. Questo è un fatto. Anche il Web 1.0 è basato su applicazioni di rete, ma a differenza del Web 2.0 non sono orientate ai servizi. Tim evidenzia correttamente l’importanza dei servizi come fondamento di un approccio Web 2.0. Ovviamente possiamo distribuire servizi utilizzando molte architetture diverse, ma nel Web 2.0, il fatto che i servizi siano il cuore del nuovo Internet, la scelta degli standard utilizzati per implementare tale architettura ha una conseguenza. Ecco perché, a mio parere, un vero ambiente Web 2.0 deve essere basato su un’Architettura Orientata ai Servizi.
Ora la definizione è completa: abbiamo detto cosa, perché e anche come.
La questione della lingua
C’è però ancora una considerazione da fare. Torniamo alla prefazione di questo articolo e alla mia decisione di scriverlo in inglese. Il Web 2.0 riguarda la condivisione di pezzi di informazione e conoscenza, ma come si può condividere qualcosa se non si può comunicare? Dal punto di vista tecnico non è un problema: gli standard web sono il fattore di successo di una rete globale fatta di hardware e software eterogeneo. Ma che dire della lingua naturale? Non solo comunichiamo attraverso una lingua, ma una lingua è la rappresentazione di una cultura, di una mentalità, di uno stile di vita.
Ad esempio, al momento non c’è modo di aggiungere la maggior parte dei libri non inglesi su Shelfari, così come molte altre applicazioni analoghe del Web 2.0, perché la maggior parte di esse si basa sul database di Amazon. Tuttavia, Amazon elenca solo pochi titoli non inglesi, e in diversi paesi non è disponibile affatto. Non esiste Amazon.it, ad esempio, o Amazon.es. Quindi, se un libro ha un ISBN che inizia con 88, ad esempio, non sarai in grado di aggiungerlo ai tuoi scaffali, nemmeno manualmente.
Ovviamente, grandi aziende come eBay e Google sono disponibili in molti paesi e lingue, poiché è nel loro interesse essere il più globali possibile. Tuttavia, anche in quei casi, i lettori non inglesi sono penalizzati. Ad esempio, la maggior parte dei servizi di Google Translate sono da e verso la lingua inglese. Se vuoi tradurre dall’italiano al francese o dal tedesco allo spagnolo, non hai un servizio affidabile. Le traduzioni automatiche sono ancora molto grezze, ma sono comunque uno strumento utile se non conosci affatto una lingua. Ad esempio, se non puoi leggere il cinese per niente, una cattiva traduzione sarà meglio di nessuna traduzione. La maggior parte dei servizi di Google Translate sono abbastanza buoni per capire almeno l’argomento di un testo. La traduzione dal tedesco all’inglese e viceversa è abbastanza affidabile, ma se provi a tradurre dal tedesco all’italiano attraverso l’inglese, è davvero un disastro.
L’unico servizio Web 2.0 che è davvero globale è probabilmente Wikipedia con oltre sette milioni di articoli in più di 200 lingue, e in continua crescita! Le varie blogosfere sono isole in un oceano, con davvero pochi collegamenti tra loro. Ci sono davvero solo pochi blogger che scrivono in diverse lingue e ancora meno che scrivono tutti i loro articoli in più di una lingua. Ma se le blogosfere francesi, tedesche, spagnole, italiane e molte altre hanno link ad articoli in inglese, il viceversa è davvero raro. La maggior parte dei blogger inglesi non si preoccupa di collegare articoli stranieri anche se possono leggerli, perché presumono che la maggior parte dei loro lettori non possa. La maggior parte dei blogger non inglesi, viceversa, presume che i loro lettori possano leggere un po’ di inglese. Quindi, c’è una evidente asimmetria.
Quindi, sempre di più il Web 2.0 basato sull’inglese sta ignorando il resto del web. La lingua non influenza solo i blog o i libri, ma canzoni, musica, testi, film e ogni altro aspetto della vita sociale. Questo non è tipico del web, comunque. È un dato di fatto che una parte significativa del mercato dei libri nei paesi non anglofoni si basa sulla traduzione di autori inglesi. Non solo i best seller, ma davvero molti autori di alta e media qualità. Tuttavia, è estremamente difficile per un autore non inglese essere pubblicato negli Stati Uniti o nel Regno Unito, ad esempio, a meno che non sia davvero molto molto popolare. Lo stesso vale per i cantanti. Quanti cantanti italiani o francesi sono conosciuti negli Stati Uniti? Nella maggior parte dei casi, gli americani cantano ancora canzoni francesi o italiane di cinquanta anni fa. Non sanno nulla dei cantanti moderni e delle canzoni moderne. Ma i cantanti americani e britannici sono ben conosciuti in tutto il mondo, e non è una questione di qualità. L’inglese sta diventando un killer di molte lingue del mondo e, come conseguenza drammatica, di molte culture del mondo. Sul web, specialmente nel Web 2.0, questo è semplicemente più evidente.
Tuttavia il Web 2.0 potrebbe fare la differenza e cambiare drammaticamente questa tendenza. Come?
Il Dizionario Globale
La traduzione automatica delle lingue è una questione seria. Ciò che si può dire con una sola parola in una lingua può richiedere una frase più lunga in un’altra. Alcuni termini semplicemente non hanno una traduzione, poiché il concetto a cui si riferiscono è tipico di una cultura specifica e non ha controparti in altre. Modi di dire, gerghi ed espressioni specializzate rendono la traduzione automatica un pasticcio. La traduzione parola per parola è spesso inutile, ma anche algoritmi più sofisticati che analizzano gruppi di parole e fanno supposizioni sul contesto possono fallire. Come ho detto prima, solo cambiare una parola in una frase usando un sinonimo può dare a quella frase un sapore diverso, a volte un significato diverso: serio, ironico, giocoso. Le lingue cambiano continuamente, e le persone creano continuamente nuovi significati e varianti ogni giorno, semplicemente parlando o scrivendo. In teoria, ognuno di noi parla una lingua diversa, una propria, o dà significati leggermente diversi allo stesso termine o affermazione.
Da un punto di vista pratico, ogni coppia di lingue richiede il proprio dizionario e un insieme complicato di regole per tenere in considerazione ogni possibile espressione idiomatica. In teoria, questo è necessario anche per la traduzione inversa, cioè tradurre dall’italiano allo spagnolo, ad esempio, può richiedere regole e dati di traduzione diversi rispetto alla traduzione dallo spagnolo all’italiano. È uno sforzo enorme anche quando le lingue sono simili.
Tuttavia c’è un approccio diverso che potrebbe sfruttare il Web 2.0: il Dizionario Globale.
L’idea è di valutare tutti i possibili concetti. Un oggetto fisico come una “casa” o una “scatola” è un concetto, ma anche un aggettivo, come “essere rosso” o “essere grande”, un avverbio, come “periodicamente” o “mai”, un verbo, come “cantare” o “scuotere”. Nota che lo stesso concetto può essere espresso da parole diverse o combinazioni di parole, e che lo stesso termine può essere usato per esprimere concetti diversi sia come parola singola che in combinazione con altri termini. Quindi, un censimento di tutti i possibili concetti è uno sforzo enorme, ma questo è esattamente il lavoro giusto per l’approccio Web 2.0.
Ogni volta che valutiamo un concetto, dobbiamo definirlo e fornire una definizione in quante più lingue possibili. Puoi pensarci come l’unione di tutti i vocabolari monolingue pubblicati nel mondo, con una differenza: non definisci parole, ma concetti. Il Dizionario Globale rappresenta una fonte di dati pubblica che può essere utilizzata dai servizi web per tradurre qualsiasi pagina da qualsiasi lingua a qualsiasi altra lingua. Nella fase iniziale, la traduzione sarà probabilmente solo un po’ migliore delle attuali traduzioni automatiche, con il solo vantaggio di consentire traduzioni tra coppie di lingue che non sono attualmente supportate dai servizi esistenti; ad esempio, dal Cherokee allo Swahili. Ma a lungo termine, potremmo sfruttare servizi che ci permettono di scrivere testi abilitati al Dizionario Globale, cioè testi in cui le parole sono etichettate in modo da identificare un concetto preciso. Ad esempio, “casa” in italiano è usato sia per “house” (l’edificio), che per “home” (l’ambiente familiare), ma “home” stesso ha vari significati in inglese. Ciascuno di questi significati deve essere valutato nel Dizionario Globale e deve essere associato un Identificatore Universale (UID). Quando scrivo un testo usando un’applicazione abilitata al DG, il software farà alcune ipotesi sui concetti che sto usando in base al tag di contesto che ho fornito all’inizio, e se incerto su cosa fare, proporrà allo scrittore un elenco di scelte da cui selezionare quella giusta.
Ovviamente ci vorrà più tempo per scrivere un articolo, ma il vantaggio è che sai che può essere tradotto automaticamente in qualsiasi lingua in modo che chiunque nel mondo sarà in grado di leggerlo. L’impatto sui metodi dei motori di ricerca sarà significativo: dagli indici basati su parole a quelli basati su concetti, da un approccio sintattico a uno semantico.
Nessuna azienda può permettersi lo sforzo di creare un tale Dizionario Globale e di sviluppare le applicazioni per generare testi abilitati al DG e tradurli, ma il Web 2.0 può renderlo reale. Il web cambierà: tutte le blogosfere diventeranno un unico grande continente, non più isole; tutte le pagine saranno disponibili a tutti e avremo una sola grande Wikipedia a cui tutti i wikipediani di tutti i paesi avranno la possibilità di contribuire, aumentando drammaticamente il suo valore. Non più articoli di qualità diversa nelle diverse Wikipedia, ma il miglior articolo possibile in qualsiasi lingua del mondo. Un nuovo mondo: World 2.0.
However idealistic this idea is: It suffers from the misconception that all languages expose structures similar to those of Indo-European languages like English or Italian. Unfortunately, most of the languages of the world are very different from that. Simply mapping the concepts will not suffice at all. You would at least have to model morphology and syntax for each language as well, which is a feat that hasn’t even been completed yet for English let alone the lesser spoken languages of the world. Which is more, a lay person maybe can define a concept, but for modelling morphological or syntactic structures you would at least need some sort of formal education in linguistics.
Besides, similar approaches for a limited set of languages have already been followed in terms of automatic translation software and even for closely related languages like English and German the results are far from satisfactory. Just think of the German concept ‘Schimmel’ which means ‘white horse’ in English. While in German the concept is represented by an atomic token, in English you have to use to two concepts and link them via logical AND.
Regarding the remark about search engines: The current approach in most cases is not syntactic, but simply term-based. In fact, there are some techniques like Latent Semantic Indexing that skip the syntactic level altogether and make use of (abstract) concepts for indexing. There are even some search engines like Hakia or PowerSet which try to venture in the syntactic + conceptual direction, however so far without being tremendously successful.
I agree with you!
2.0 is a new way to develop human relationship and knowledge management.
Ciao
This is why I speak of «concepts» rather than words. A «white horse» is a concept, that is, at least in one language (German) it is a single well-defined concept. A concept that in a language requires a single word, for instance in Japanese, could require a long statement in others. By assessing ALL concepts of ALL languages, I am suggesting to make a census of all concepts that at least in one language are represented by a single word.
Of course it will not be enough. We will have to add composition rules that are quite different for languages which are very different. The approach is similar to Unicode: most of glyphs represents characters in various scripts, but to use Unicode in an editor, you also need writing rules, since in languages as Arabic and some Far East languages, glyphs changes when they are used to make words. This is also true in several Western languages ligatures as double f (ff). In addition, in a Unicode editor you have to manage mixed scripts right-to-left and left-to-right.
So the Global Dictionary will be only the starting point, the driver of a set of applications to translate any language in any language. And yes: we need linguists to define the approach for this project. But that’s the point: does not matter how idealistic is my idea. In Internet there are millions of specialists of any language who can make it real, more concrete. THIS IS THE STRENGTH OF WEB 2.0!
Ti sfuggono un paio di teorie su certa filosofia del linguaggio, di linguistica, di pragmatismo americano, di analisi conversazionale, e ti dico senza nessuna malizia che talvolta è bene chiedersi se per caso qualcuno ha già pensato e scritto di cose simili (“Several years ago I developed a definition for intelligence…”) prima di noi, e per “qualcuno” intendo pensatori di 200 o 2000 anni fa, non bloggers! 🙂
Però il tuo ragionamento l’ho seguito tutto, perché affronti un problema verissimo e serissimo, al di là della colonizzazione culturale americana e dell’apparente somiglianza di tipo neoconnessionista tra neurosinapsi e semiosi enciclopedica infinita per libere associazioni, quello della costruzione collaborativa di contesti enunciativi dove poter incrementare le possibilità di comprensione reciproca interumana, nel tuo caso dovendo interfacciare lingue diverse.
L’idea di costruire repertorii dei significati situazionali (perché il tuo Vocabolario Globale più che un vocabolario è un’enciclopedia, come peraltro ogni vocabolario in realtà è) è stata più volte espressa, e si è sempre scontrata con i suggerimenti derivanti dall’esperienza: si è compreso ad un certo punto nel ‘900 che nei reali processi conversazionali le parole, e i concetti che esse veicolano, sono in realtà come inventate e reinterpretate ogni volta, in quel gioco quotidiano che è la negoziazione sociale del senso degli accadimenti, il patteggiamento dei valori chiamati in causa e il reciproco riconoscimento delle identità sociali dei parlanti.
Il Sé è narrazione, i mercati sono conversazioni, il web e ultimamente la blogosfera hanno reso certe cose molto più visibili.
La lingua cambia ogni volta che la usiamo, i concetti sfumano lentamente in qualcos’altro – come anche tu facevi notare quando parlavi della transitorietà delle definizioni operazionali – e quindi il lavoro che il tuo progetto richiederebbe alle comunità di Abitanti digitali sarebbe quello di costruire repertorii di concetti, ciascuno plurilinkato alle comunità dei parlanti globali, le quali dovrebbero poi in quanche modo con facilità provvedere ad una limatura o conferma o rimodellazione continua della propria rappresentazione simbolica specifica (il concetto di “cavallo bianco” per i Tedeschi, per esempio), dando informazioni continue su quella specifica locuzione ogni volta che viene utilizzata, e in che contesto viene utilizzata, ad un socialweb che potrebbe essere a questo punto la stessa Wikipedia, che diventa il tuo Global Dictionary – ovvero Social Global Encyclopedia ovvero Wikipedia. Dove i termini possono essere cercati e utilizzati dai motori di ricerca del futuro, quelli capaci di leggere il web semanticamente, per inseguire anche le varianti locali più minuscole della possibile declinazione dei concetti (credo che solo in friulano l’alba faccia “cric” come un cigolare di legno, per esempio; mi piacerebbe moltissimo poter confrontare il concetto di alba con tutto il mondo, per come esso viene pensato (tutte le proposizioni in cui il concetto “alba” può apparire come soggetto o come predicato) e pronunciato in altre lingue, e a quali collegamenti morfologici, sintattici, semantici, pragmatici è possibile risalire da quella parola verso altre parole/concetti della stessa lingua.
Ma la tua idea seppur folle è un qualcosa che è nato con una mentalità 2.0, ad esempio quando hai pensato al “correttore di concetti” che confronta in tempo reale quanto vai scrivendo su web o su wordprocessor con la repository mondiale dei concetti interdefiniti plurilinguisticamente, proprio avendo come finalità la propagazione massima dei memi… mi piace un casino.
E poiché mi è sempre sembrato stupido quel tipo che di qualcosa dice “non sarà mai possibile”, ti dirò che forse quello che fino a vent’anni fa non era nemmeno possibile pensare di cominciare a realizzare – i repertorii di concetti o prima ancora i repertorii degli usi linguistici specifici, antropologicamente connotati, nell’espressione dei concetti) ora dentro le potenzialità del 2.0 assume una luce nuova, e tra folksonomies e tagging e networking possono certamente nascere strumenti che permettano di cogliere e rendere condiviso tra tutti il sapere unico depositato dentro ciascuna lingua, dentro ciascun parlante della Rete.
Ti segnalo questo giochino di Google, la quale ci usa anche per taggare collaborativamente le immagini di cui non ha abbastanza informazioni, e che potrebbe assomigliare al nonno del tuo meccanismo per l’enciclopedia dei concetti
https://images.google.com/imagelabeler/
Il tuo post tradotto in italiano (google + lavoretti) l’ho messo qui
https://docs.google.com/Doc?id=dfhxjz4f_951cv79vgfk
ciao
Solstizio
I would like to make clear that, when I state that I developed a definition for intelligence or for any other term,
1) I do not pretend that my definition be better than others
2) I do not even pretend that I was the first to define that term in that way
3) I do not expect it will be a definitive definition for me too (I could change it in future)
I am simply saying that I developed that definition on my own. Of course, whatever I may think is surely influenced by what I read and what I learned, but of course it is also the result of my own experience and reasoning.
The reason I am sharing my thinking is because anybody can take it and use it to improve, change, evolve whatever I thought. What you can call a two-cent contribute.
Caro Solstizio, ti rispondo in italiano perché altrimenti dovrei prima tradurre in inglese il tuo commento, troppo lungo perché lo possa fare rapidamente e troppo complesso per un traduttore automatico. Dato che è indubbiamente un commento che merita, non sarebbe giusto tradurlo in modo approssimativo.
Ti dico subito che condivido assolutamente quanto hai detto. I limiti da te indicati sono purtroppo veri e hanno rappresentato finora il motivo per cui nessun traduttore automatico, per quanto sofisticato, ha mai potuto rappresentare più che un ausilio per un traduttore umano. Ci sono diversi programmi di traduzione, come sicuramente saprai, che sono in grado addirittura di apprendere uno stile di traduzione, ma sono molto costosi, lavorano sempre in un contesto preciso (tecnico, legale, medico, ecc…) e comunque sono pensati per produrre solo una prima bozza di traduzione. Nulla, al momento può ancora sostituire un bravo traduttore umano.
I programmi di traduzione automatici presenti in Internet, tuttavia, sono estremamente rozzi e sono pensati più che altro per aiutare i naviganti di lingua inglese a capire testi in altre lingue, sempre a causa dell’inevitabile dominanza della cultura anglo-americana nel web. Sono rari infatti i servizi, ad esempio, dall’italiano al tedesco o al giapponese, per non parlare delle lingue minori, come l’occitano, lo swahili, il tagalog. Persino lingue parlate da centinaia di milioni di persone, come l’arabo o l’hindi, sono tagliate fuori dal gioco. Ora, una lingua è il canale principe d’espressione di una cultura, e relegarla quindi in un’enclave digitale vuol dire relegare quella cultura con tutto ciò che rappresenta.
La mia proposta non rappresenta quindi un’iniziativa intesa a sostituire le traduzioni manuali, soprattutto per articoli e testi di una certa complessità, ma il tentativo di sfruttare il potere della rete, quelle centinaia di milioni di persone che ogni giorno navigano in Internet, per ridare alle lingue diverse dall’inglese un loro posto e ruolo nelle comunità digitali che si sono sviluppate a macchia d’olio. Altrimenti, invece di una rete globale, avremo un enorme continente, quello anglofono, circondato da migliaia di isole e isolotti destinati a spopolarsi rapidamente, a morire di anemia culturale. Far sì che in India o in Giappone la gente possa leggere articoli di blogger italiani, potrebbe servire a far conoscere in altri Paesi poeti, cantanti, scrittori, da noi famosi e non secondi a nessuno, ma altrove sconoscuti perché le loro opere non sono mai state tradotte in quelle lingue e comunque nella traduzione avrebbero perso gran parte del loro fascino. E viceversa, naturalmente. Non sto però parlando di tradurre le opere, ma piuttosto l’opinione che noi abbiamo di loro, cosa hanno rappresentato per noi. Pensa a De André, ad esempio, poeta cantautore quasi sconosciuto all’estero.
Come dice giustamente Tim, oggi la base della rete sono i dati, e questo dizionario-enciclopedia, come correttamente lo hai definito, potrebbe rappresentare una base dati semantica su cui costruire servizi all’inizio magari primitivi, col tempo sempre più sofisticati. Sarebbe anche un censimento importante per lingue ormai scomparse o in via di estinzione, dialetti poco conosciuti, idiomi che spesso contengono concetti che non hanno corrispondenti in altre culture perché in quelle culture non si sono mai sviluppati. Ormai la rete sta diventando sempre più semantica, ma se questa semantica è solo quella anglosassone, tutti quei concetti prima o poi spariranno dalla rete. C’è da considerare il fatto che probabilmente la rete di domani diventerà una delle fonti primarie di istruzione e formazione delle nuove generazioni. Già adesso i nostri figli usano Wikipedia e altre fonti in Internet per le loro ricerche. Col tempo anche da noi l’inglese diventerà una seconda lingua, come già succede in Scandinavia e nel Nord Europa, e dato che le fonti in inglese sono più ricche di quelle in altre lingue, le nuove generazioni si rivolgeranno in quella direzione.
Ma quale sarà la conseguenza? Pensa a Wikipedia: a parità di articolo, se l’oggetto dello stesso è sufficientemente globale, i testi in inglese sono già ora di qualità migliore, mediamente, di quelli in altre lingue. Ovviamente quando il soggetto appartiene alla cultura anglosassone, il divario aumenta. Ci sono tuttavia alcuni articoli che sono migliori in lingue diverse dall’inglese e sono appunto quelli che riguardano specifiche culture. Ad esempio, poeti italiani o francesi, scrittori spagnoli, politici russi, eventi specifici della storia polacca o turca. Questi articoli sono poveri o inesistenti in inglese, ma per loro stessa natura sono usufruibili solo da chi conosce l’italiano, il polacco, il turco e via dicendo. Ci saranno sempre meno persone disposte a migliorarli e arricchirli, finché alla fine verranno abbandonati, e con loro la storia, la cultura, i principi che in essi sono contenuti.
Rendere tutto ciò usufruibile a tutti è più che una necessità: è un dovere. Il Web 2.0 è autoreferenziale: diventa più forte dove lo è già, si indebolisce dove non lo è. Già ora in tutte le classifiche di blog, news, RSS feed, e altre fonti di informazioni, i siti non in inglese sono in fondo alla classifica in quei rari casi in cui pure appaiono. Presto spariranno del tutto, e una parte della rete verrà ghettizzata. Volenti o nolenti tutti questi servizi “gratuiti” sono in realtà sostenuti dalla pubblicità, per cui, se le aziende non vedono in un settore un ritorno, quel settore sarà abbandonato. Già aziende come Amazon hanno deciso di non aprire in Italia, presto se ne andranno anche altre. Che succederà il giorno in cui eBay o la stessa Google dovesse decidere che mantenere un sito in italiano è un gioco che non vale la candela? Oh, non abbandoneranno i clienti italiani: semplicemente si aspetteranno che siano in grado di usufruire dei servizi in inglese.
Vorrei che fosse chiara una cosa: non ho nulla né contro la lingua inglese né tantomeno contro la cultura anglo-americana. L’inglese è una lingua più ricca e sofisticata di quanti molti credano, e la cultura di quei popoli è estremamente interessante e varia. Credo anche che da qui a qualche secolo rimarranno poche lingue nel mondo: una sorta di inglese internazionale, lo spagnolo, forse il portoghese, sicuramente il cinese. Persino il francese e il tedesco sono a rischio, figuriamoci l’italiano. Probabilmente fra 200 anni l’italiano sarà in Italia quello che per molti è il lombardo in Lombardia: un idioma ancora parlato, in cui ancora si crede, ma conosciuto da sempre meno persone. Non parlo ovviamente di mettere qua e là due o tre parole lombarde in un discorso parlando con un accento del Nord: parlo proprio del lombardo inteso come lingua. Così sarà l’italiano. Non credo che il mio progetto possa cambiare tutto ciò, ma forse potrebbe impedire che un certo modo di pensare, che un certo numero di uomini e donne che hanno fatto la storia del nostro Paese così come quelli che in altri Paesi hanno rappresentato un momento significativo di quelle culture, subiscano inevitabilmente una vera e propria damnatio memoriae.
“You Tube e My Space sono simboli di un grande cambiamento perche’ sono la rappresentazione concreta del fatto che le persone che ogni giorno usando la tecnologia possono prendere il controllo dei media e contribuire a cambiare il mondo.
Nelle banali scelte di un singolo, come l’acquisto di un libro su Amazon, la registrazione di un documento powerpoint su Slideshare tra i preferiti o il clic su uno dei risultati di ricerca su Google, contribuiscono ad incrementare l’analisi e l’archiviazione dell’intelligenza umana in un megacervello globale web-based distribuito.
Il risultato del lavoro, diretto od implicito, condiviso e collaborativo di tutti gli utenti della rete.
Ed e’ il concetto di un pensiero collettivo, di una INTELLIGENZA COLLETTIVA senza un’autorita’ centrale, quindi non controllabile.
E in costante ed infinita evoluzione.
I blog rappresentano la conversazione di queste comunita’ e il dialogo collettivo.
Pensieri definiti o tratteggiati da un singolo, vengono passati o linkati di blog in blog (blogroll), arricchiti, condivisi, integrati, trasformati da tutta la rete.
La collettivita’ e la sua intelligenza in continua evoluzione.”
credo che un elemento da analizzare a fondo, di cui stiamo gia’ vedendo la sua prima “coscientizzazione” o conoscenza di se’, sia proprio il concetto di intelligenza collettiva. Questo personalmente mi affascina molto e come appare dal tuo articolo sul web 2.0, e’ significativamente da tenere in considerazione e puo’ porre le basi a cio’ che tu stesso definisci il nuovo mondo, il World 2.0
🙂
ciao Davide
You wrote: “Web 2.0 is a knowledge-oriented environment where human interactions generate contents that are published, managed and used
through network applications in a service-oriented architecture.”
I agree with knowledge-oriented, but how do you support service-oriented? Service-oriented is merely an implementation style that makes sense, but is not necessary to support a Web 2.0 environment.
Anyway, about languages: it would be interesting to break down the language barriers. There are two particularly interesting things that could arise: (1) I suspect some people would become quickly upset as they discover two different translation, which they posted under the assumption that target audiences would read only certain languages, get quickly discovered… (2) The usage effectiveness of Web 2.0 technologies might actually even out across the different continents. A certain study showed China to be leading the way, and Europe to be using more Web 2.0 than US, but less effectively,and both US and Europe trailing China.
– From another multi-lingual blogger, who probably creates headaches for you with German-English-Italian translations
@Comment #1: Having some background in Linguistics, and having the advantage of knowing a few non-Indo-European languages, it isn’t an inhibition to understandable translation: the mappings actually work decently, as long as you don’t have a third language in the middle, because lost linguistic nuances get compounded.
Consider a language without plural indicators or declinations, like Chinese, being converted into English, which at time introduces confusion in sentence structure between subject and object placement, and the result being converted into a language that requires every subject, object, singular, and plural form to be in appropriate declination, like Arabic. One compoundation would be understandable, but two would be a diasater.
Anonymous said in #8: I agree with knowledge-oriented, but how do you support service-oriented? Service-oriented is merely an implementation style that makes sense, but is not necessary to support a Web 2.0 environment.
Well, a service-oriented architecture is a model which is designed to facilitate the management and usage of distributed resources and capabilities whoever is the provider and whatever are the implementation details, because of conformance to open standards and loosely coupling to operating systems, programming languages, and hardware devices.
I agree that in theory it is not necessary to implement SOA to support a Web 2.0 environment, as well as it is not necessary to use an object-oriented language as C++ or Java to develop an object-oriented application. You can develop object-oriented code by assembler too, but who does it today?
SOA is a strong enabler of Web 2.0, and my personal opinion is that more and more social networking will be based on that model. Of course, you may say that such a architectural choice is not a good reason to explicitly state it in a general definition. I may agree, but in my opinion when we give a definition in Information and Communications Technology, we should not only state what is, but also which should be the preferred way to make it real. That is why I decided to tightly connect the concept of Web 2.0 to SOA. I understand is debatable. I said: mine is not intended to be a definitive definition… just a proposal.
Perhaps group language translation is really Web 3.0?
Dario, thanks for the article….very interesting and it provides a good
perspective where we have been and where we are going….
From a Web 2.0 point of view its a long time coming approach ever since object orientation
became popular and now its the underpinning technology for everything we are doing today.
I like to refer to Web 2.0 as the Architecture of Participation…..which is also what Gartner is saying..
The article does a nice job in making sure that at the end of the day its all about Knowledge and
how you distributed….
Thanks
Hector Hernandez – USA
It made for a very interesting reading. I enjoyed the writer’s blog and the readers’ comments.
I am not so far into technology as to say what is feasible.
But Erich Kästner’s word ring in my ear:
“If we had believed the people who said:”It can’t be done!”, then we would still be sitting in the trees.”
I believe it can be done.
I enjoyed the writer’s blog and the readers’ comments.
I am not so far into technology to know what is feasible.
But Erich Kästner once said: “If we had believed the people, who said: “It can’t be done”, we would still be sitting up high in the trees.
I would like to believe.
Cf. PanLex.