Home
Wiki, engine spamming e il futuro di Google

14 Gennaio 2005

Wiki, engine spamming e il futuro di Google

di

Siti aperti in scrittura da parte di tutti, i wiki rappresentano un facile strumento per chi cerca di guadagnare posizioni in Google attraverso la link popularity minacciando, se il fenomeno continua a crescere, la stessa autorevolezza del motore di ricerca numero uno

All’inizio della loro avventura i motori di ricerca dovevano dimostrare la loro autorevolezza sulla base della precisione dei risultati restituiti. Così Google guadagnò la popolarità nei primi anni di vita grazie al pulsante “Mi sento fortunato”. Oggi la situazione si è ribaltata. Sono i singoli siti che devono dimostrare la loro autorevolezza in termini di posizione occupata su Google. Se, per una particolare parola chiave, il sito appare nella prima pagina, o al massimo nella seconda, allora il sito è autorevole. In alternativa, oltre alla scarsa possibilità di essere raggiunto tramite una ricerca, perde anche di valore.

Google è il principale referral della stragrande maggioranza di siti. Quindi la posizione al suo interno riveste sempre più valore, tanto che i responsabili della visibilità dei siti talvolta ricorrono a trucchi non troppo etici, anche se non sanzionati da alcuna norma legale, come il search engine spamming o il Google bombing. E i wiki rappresentano uno strumento formidabile per attuare queste tecniche.

Probabilmente tutti gli utenti di Internet hanno sperimentato l’e-mail spamming, ovvero la posta indesiderata. Data la facilità con cui si possono spedire messaggi di posta elettronica, esistono organizzazioni che sfruttano questo mezzo di comunicazione per generare pubblicità a costo bassissimo verso milioni di destinatari. La posta spazzatura è aumentata fino a rappresentare oltre la metà della posta elettronica che circola regolarmente su Internet, tanto da costituire la preoccupazione principale non solo degli utenti ma anche degli amministratori di rete, che devono far fronte a un fenomeno devastante in termini di consumo di tempo e risorse.

Il search engine spamming, ovvero lo spamming dei motori di ricerca, è qualcosa di analogo. Si tratta di tecniche automatizzate per portare un sito in testa ai risultati nei motori di ricerca, sfruttando le stesse informazioni che gli algoritmi di ranking dei motori usano per classificare i risultati. L’uso di doorway pages (numerosissime pagine di accesso al sito ognuna ottimizzata per una particolare stringa di ricerca), la proliferazione di referral link (creati su siti fittizi e sparpagliati su diverse pagine), l’inserimento di keyword in posizioni nascoste della pagina sono solo alcune tra le tecniche politicamente scorrette per guadagnare posizioni in classifica con poco sforzo.

Il fenomeno dello spamming dei motori non è ancora percepito come un problema dalla maggior parte degli utenti Internet (che invece si sono da tempo accorti della posta spazzatura). Questo perché ha intaccato solo una minima parte delle ricerca su Internet. Tuttavia è in crescita. Vi è mai capitato di cercare qualcosa su Internet e trovare una pagina che è a sua volta un secondo motore di ricerca? Pagine che, stranamente, hanno le parole da voi cercate nel titolo e nella stessa URL del file HTML, ma che al loro interno non forniscono alcun contenuto utile ma solo link ad altre pagine ancora? Sono esempi di pagine create automaticamente (doorway pages) per portarvi verso un altro sito, o semplicemente per mostrarvi una qualche comunicazione pubblicitaria. Questi risultati inquinano inevitabilmente la ricerca e, come accade con la posta spazzatura, l’utente deve abituarsi a fare pulizia e ignorare i contenuti parassiti.

L’attacco agli algoritmi dei motori non sempre avviene per finalità di promozione scorretta e a costo zero di prodotti o aziende. In alcuni eclatanti casi assume il carattere di protesta politica del pubblico di Internet. Attraverso la cooperazione di centinaia o migliaia di siti diversi, in particolare nella blogsfera, è possibile infatti aumentare la rilevanza di un sito per una particolare stringa di ricerca semplicemente inserendo un link. Tale fenomeno ha preso il nome di Google bombing. Tra i casi più eclatanti le seguenti keyword, che potete sperimentare direttamente su Google: waffles, failure, miserabile fallimento, incapace.

L’unione del Google bombing con le tecniche di search engine spamming potrebbe rappresentare una minaccia all’autorevolezza di Google proprio a causa della proliferazione dei wiki. Un wiki è, in parole semplici, un sito accessibile a tutti in lettura e scrittura. Wikipedia è il più mirabile esempio di questo tipo, un’enciclopedia online interamente realizzata dal pubblico con la collaborazione di centinaia di migliaia di persone diverse.

La possibilità per i visitatori di intervenire sul contenuto rappresenta uno strumento di valore aggiunto, che consente di accrescere il sito stesso grazie alla collaborazione di tutti o di buona parte dei visitatori, ognuno con il suo piccolo contributo. Ma se tanti piccoli contributi da parte di persone diverse possono far crescere un wiki, allo stesso modo tanti contributi di una stessa persona, su wiki diversi, possono elevare o affossare un sito nei risultati di Google. Basterebbe selezionare un centinaio di wiki diversi e inserire in tutte le loro pagine una particolare keyword linkata al sito interessato. La link popularity ne verrebbe influenzata immediatamente. Non solo. Dal momento che la maggior parte di questi wiki sfruttano pagine PHP e si basano su tecnologie open source, basterebbe studiare il codice e scrivere uno script in grado di eseguire tale operazione in maniera automatica su centinaia di siti diversi. È una tecnica assolutamente da condannare, perché minerebbe in modo irreparabile la filosofia cooperativa alla base dei wiki e di Internet stessa. Ma è una minaccia che non si può ignorare.

Non stupisce che tutte queste tecniche siano rivolte principalmente contro Google, dal momento che è IL motore di ricerca. In virtù della sua precisione si è guadagnato una popolarità tale che oggi lo rende non solo il bersaglio numero uno, ma anche un ostacolo da affrontare necessariamente: chi lavora su Internet sa che, in un modo o nell’altro, con i risultati di Google dovrà fare i conti. Se lo spamming dei motori di ricerca seguirà un andamento simile alla posta elettronica, in breve tempo avremo una percentuale di risultati fasulli nelle ricerche da rendere inutile lo strumento stesso: non potremo più usare Google perché è il motore di ricerca più popolare (e quindi più attaccato). Fortunatamente lo scenario non è così catastrofico, perché gli algoritmi di ricerca si possono cambiare e i nuovi e agguerriti player (tra cui A9 e MSN) interverranno sicuramente per cambiare le regole del gioco.

Alberto Mari è autore del libro pubblicato da Apogeo Web Publishing Blog e Wiki

L'autore

  • Alberto Mari
    Alberto Mari lavora col Web dal 1998. La passione per le tecnologie e una cultura umanistica l'hanno portato a occuparsi di editoria digitale e ebook.

Iscriviti alla newsletter

Novità, promozioni e approfondimenti per imparare sempre qualcosa di nuovo

Gli argomenti che mi interessano:
Iscrivendomi dichiaro di aver preso visione dell’Informativa fornita ai sensi dell'art. 13 e 14 del Regolamento Europeo EU 679/2016.