Home
Come (e perché) dovrebbe funzionare Technorati

01 Febbraio 2007

Come (e perché) dovrebbe funzionare Technorati

di

Per la crescita del web è necessario che ci sia la collaborazione di milioni di utenti, i quali devono imparare a inserire informazioni in modo che le macchine possano aiutarci nell'orientamento. Perchè questo apprendimento avvenga, è necessario che piccoli standard si affermino. E la storia di internet ci dice che...

Dicevamo che la storia di Internet (e di tutti i network digitali) può essere raccontata come la storia del confronto tra l’uomo e la complessità di un sistema in grado di processare tutte le informazioni di tutti gli individui. L’assetto del Web, in particolare, ha sempre assunto una configurazione derivata direttamente dalle migliori soluzioni disponibili per orientarsi tra i milioni di dati. È, banalmente, la storia – appena iniziata – della “grande soluzione” a un problema di incontri, di matching come dicono gli anglofoni.

Se è vero, come sanno i problem solver, che le soluzioni a un problema variano in base alla formulazione del problema, tutto lo sviluppo di Internet ruota attorno al tentativo di far incontrare l’informazione (o anche la relazione) esatta con la persona che ne ha bisogno, nel momento in cui ne ha bisogno e nel minor tempo possibile. Ma non solo: la grande disponibilità di dati e punti di vista ci permette anche di pianificare l’incontro con l’informazione che ci serve, ma di cui non conosciamo l’esistenza. È, questo passaggio, la creazione di un’analogia nuova, individuale e pronta ad essere rimessa in circolo come conoscenza collettiva, la sfida più interessante degli architetti dell’informazione. Le analogie sono, infatti, il modo in cui il cervello umano produce conoscenza. E l’esposizione continua, di milioni di individui, alle analogie è un grandissimo acceleratore culturale. Internet è il maggior supporto al pensiero che l’uomo abbia mai avuto.

A che punto siamo

L’assetto (la topografia, direbbe un fisico teorico) del web attuale è configurato sul modello Google. Quando fu chiaro che non era possibile venire a capo dell’orientamento tra le informazioni in maniera completamente centralizzata, i signori di Mountain View con una intuizione geniale decisero di sfruttare la cognizione di tutti gli utenti per migliorare la tecnologia degli incontri. Poichè l’unica informazione che le macchine potevano elaborare in maniera automatica erano i link, fu elaborato un algoritmo che ne teneva conto e li pesava, partendo dal presupposto che se una intelligenza umana stabiliva una connessione a una informazione, quell’informazione aveva un interesse. Al di là dell’algoritmo di Google e delle formule con cui valuta l’importanza dei singoli link, la scelta di «mettere nell’interfaccia l’intelligenza degli utenti» (per dirla con Tim O’Reilly) ha inaugurato la fase in cui ci troviamo. Il lemma è che «senza gli utenti non si viene a capo di tanta complessità». Il teorema perfetto è quello che stiamo lentamente cercando.

Con il senno di poi può sembrare persino evidente. Se l’architettura di Internet è costruita per non avere un centro coordinatore (o un governo centrale), ma per immettere innovazione e informazione da qualsiasi nodo, è abbastanza lineare immaginare che – pur utilizzando tecnologie di tipo informatico – nessun problema sia risolvibile senza superare la bipartizione classica hardware/software. Così stiamo cominciando a confrontarci con una nuova componente, che potremmo chiamare socialware, alludendo alla componente cognitiva che ogni utente aggiunge al valore della Rete e al suo funzionamento.

Se guardiamo ad applicazioni locali (gli esempi classici sono Wikipedia, eBay, Amazon) è intuitivo che, a fronte di una tecnologia che abilita i processi, gli utenti producono valore (spesso in senso sociale). Ma anche nell’attuale configurazione del web, a livello generale, ci rendiamo conto che molte soluzioni che noi adottiamo oggi come standard (i tag, i feed rss) hanno una grande componente sociale. La diffusione dei feed Rss si deve probabilmente a Dave Winer e non per meriti tecnici. Dave ha avuto una intuizione, ne ha discusso con altri, ne ha favorito l’adozione da parte degli early adopters, innescando un meccanismo classico di diffusione delle innovazioni. I Tag, partendo da Technorati e Flickr, hanno seguito lo stesso percorso.

Poichè questo processo richiede, nello spirito stesso dell’architettura di Internet, l’adozione di una soluzione da parte di milioni di singoli utenti, nella crescita della Rete e nello sviluppo delle soluzioni bisogna sempre calcolare la parte di apprendimento e di scelta, che sono fondamentali. Da un punto di vista tecnico siamo abbastanza avanti: con i feed Rss – che ormai sono un output praticamente ubiquo – potremmo trasportare moltissime metainformazioni, ma socialmente li utilizziamo al 5% (affidando loro in genere solo tag e categorie). Quindi, ad oggi, pur avendo a disposizione la base tecnologica per mettere in circolo informazioni che le macchine possono elaborare per aiutarci nell’orientamento, dobbiamo prendere atto del fatto che il cammino prevede soprattutto difficoltà nella costruzione di un’alfabetizzazione diffusa e nella predisposizione di soluzioni semplici e intuitive per milioni di utenti.

La scommessa mancata di Technorati

La diffusione dei blog ha portato nel web un’esigenza di ricerca diversa da quella tradizionale. Seguire le conversazioni, capire cosa si dice di noi o di ciò che scriviamo, osservare di cosa stanno discutendo gli altri. Mentre i motori di ricerca sono abbastanza slegati dal senso del tempo (il loro business è cercare l’informazione mirata), serviva qualche strumento che monitorasse gli eventi conversazionali. Technorati si è subito imposto come standard e, a livello base, ha svolto discretamente il proprio ruolo. Tuttavia, con il tempo, il numero dei blog è cresciuto esponenzialmente e le esigenze (quindi le richieste e le aspettative) si sono modificate sensibilmente.

Da un punto di vista tecnico Technorati fa un lavoro abbastanza semplice, almeno nel concetto. Archivia i link e ci permette di visualizzare quali pagine linkano un determinato indirizzo. Come servizio accessorio, conta (e visualizza) il numero di link che puntano ad una data pagina, pretendendo di creare un rank. Se il servizio base (monitorare le conversazioni attraverso i link e, successivamente, la ricerca testuale) funziona a sufficienza, tutto il resto è rimasto negli anni molto carente. Ci sono, infatti, una serie di problemi che sono rimasti non risolti.

Il primo di questi è l’evidenza del fatto che non ogni link somiglia a se stesso. Se guardiamo al valore funzionale, i link hanno una natura diversa (quelli nel blogroll spesso indicano una relazione, quelli all’interno dei post fanno riferimenti a un meme o a una conversazione). Uno studio americano, già anni fa, dimostrò compiutamente che se analizziamo i link nei blogroll ci troviamo di fronte ad una rappresentazione di popolarità che premia i primi arrivati (e la fisica teorica lo spiega con il preferential attachment). Se invece guardassimo solo ai link nelle conversazioni, troveremmo premiati gli individui che sono maggiormente in grado di lanciare nuovi temi o di intervenire meglio nelle informazioni culturali. Ma Technorati non opera alcuna differenza tra i valori funzionali dei link. Anche come valore assoluto i link non sono interpretabili univocamente. Nella logica di Google (che però ha un sistema di pesi nel suo algoritmo) il link equivale a un voto. Tuttavia un link può puntare a una pagina che viene additata negativamente, o comunque con un valore diverso da quello positivo. In una lettura meramente quantitativa, come quella di Technorati, il semplice conteggio di link si limita a misurare in maniera banale la potenziale accessibilità di una pagina. E questo è un dato che in nessun modo aiuta ad orientarci meglio nelle informazioni.

I dati aggregati senza cognizione (ad esempio le varie classifiche, tipo la Top100) sono paragonabili ai risultati di un rally cui hanno partecipato tutti i veicoli possibili, dalle auto preparate dalle Case fino alle mietitrebbia. È un modello che nei media tradizionali poteva servire come orientamento (ad esempio, sapere quali sono i quotidiani più diffusi ci aiutava a valutarne la portata e la partecipazione all’aleborazione della cornice sociale). Ma, per restare nell’esempio, i quotidiani più diffusi sono generalisti e, nell’ambito “quotidiani”, hanno senso ed interesse per milioni di persone. In un mondo di preferenze individuali come il web, invece, in cui ciascuno di noi segue interessi particolari, sapere che una pagina di template ha più link di milioni di altre, non ci aiuta a trovare l’informazione che ci interessa o la voce considerata autorevole. Se un blog che si occupa di pesca sportiva, in italiano, ha trenta link è probabile che quei trenta link siano un valore davvero importante, in quell’ambito.

Se poi pretendiamo (come pure Technorati sembra voler fare) di attribuire un valore di reputazione al numero di link, occorre anche tener conto che i blog sono voci personali e che quindi una persona che è molto linkata può essere attendibile quando parla di un tema che domina, ma molto meno quando recensice libri o parla di musica. Detto in altro modo, senza una valutazione qualitativa e senza un ambito (anche tematico) di riferimento, non c’è modo di dare un valore pratico alle misurazioni.

Il ruolo potenziale di Technorati

Technorati ha (forse non a lungo, visto che gli altri avanzano) probabilmente la migliore base di dati (non a caso è il riferimento di moltissime ricerche) e una posizione di visibilità assolutamente favorevole. La base di dati, se ripulita e trattata con maggior attenzione, potrebbe fornire un servizio migliore. Alcuni dei problemi evidenziati nel paragrafo precedente hanno soluzioni tecniche possibili ed esistenti. Il clustering, ovvero il monitoraggio delle conversazioni all’interno dei loro ambienti potrebbe essere realizzato anche solo via software e utilizzando tecnologie disponibili, magari tenendo conto delle frequenze nell’uso delle parole (ci sono molti studi interessanti, su questo: ad esempio Topic Detection from Blog Documents Using Users’ Interests o Automatically Linking News articles to Blog entries, ma basti guardare al funzionamento di software come Devon Think).

Tuttavia se ci fermiamo a considerare solo l’aspetto tecnico potremmo sembrare quelli che pretendono di riarredare la casa del vicino. La considerazione a mio modo di vedere più interessante, invece, è quella relativa al potenziale ruolo di Technorati nella crescita del Web. A differenza di qualsiasi altro innovatore (che partirebbe da zero), Technorati oggi ha milioni di utenti e quindi una capacità di intervenire con buona efficacia sulla variabile socialware. Un esempio potrebbe essere l’adozione dei microformati (che tra l’altro stanno a cuore anche a Tantek Çelik, chief technologist di Technorati). Personalmente non credo siano soluzioni completamente convincenti, tranne forse il votelinks (almeno dal loro punto di vista di sistema), che però non mi pare di utilizzo intuitivo e quotidiano per milioni di utenti.

Più in generale, sarebbe utile ragionare sulla possibilità di Technorati (e sul conseguente ruolo) di progettare soluzioni semplici per “suggerire” ai suoi milioni di utenti (e creare standard) un modo migliore per inserire informazioni che poi le macchine trovino utili per orientarci. Se infatti è necessario che il socialware “apprenda” per rendere il web sempre più usabile, Technorati potrebbe essere il miglior cavallo di Troia. Uno strumento utilizzato costantemente da decine i milioni di persone ha probabilmente la forza e la centralità necessaria per stimolare innovazione e generare circoli virtuosi, agendo sui comportamenti cognitivi dei suoi utenti attraverso piccole soluzioni praticabili. Paradossalmente, ma nemmeno tanto, la crescita del web in questa fase passa (più facilmente che altrove) per il lavoro di queste persone e per la loro capacità di rendersene conto e, magari, di guardarsi intorno e adottare le soluzioni e la capacità ideativa anche di altre intelligenze.

L'autore

  • Giuseppe Granieri
    Autore, docente ed esperto di comunicazione e cultura digitale.
    Il suo bookcafe.net, fondato nel 1996, è stato uno dei primi siti letterari e blog italiani. Ha collaborato con testate come Il Sole 24 Ore, l’Espresso, La Stampa e firmato diversi saggi per l'editore Laterza.

    Foto: Enrico Sola.

Iscriviti alla newsletter

Novità, promozioni e approfondimenti per imparare sempre qualcosa di nuovo

Gli argomenti che mi interessano:
Iscrivendomi dichiaro di aver preso visione dell’Informativa fornita ai sensi dell'art. 13 e 14 del Regolamento Europeo EU 679/2016.