Articoli

Tony Blair scottato da Word

di Paolo Attivissimo

thumbnail

30

Lug

2003

Il primo ministro britannico è l'ultima vittima illustre dei formati "con sorpresa" di Microsoft. Giocate anche voi a fare gli 007 dei documenti Word

Tempo addietro vi avevo raccontato delle informazioni private nascoste nei documenti scritti con Microsoft Word. Ora il problema della sicurezza dei formati in cui scriviamo i nostri documenti elettronici torna alla ribalta con clamore, perché ha causato un putiferio nientemeno che al governo inglese a proposito delle giustificazioni per l'intervento militare in Iraq. In più ci sono aggiornamenti tecnici e un paio di programmi per snidare queste informazioni dai documenti. Vostri e, se volete, anche altrui.

A febbraio 2003, il governo Blair ha pubblicato un documento riguardante l'occultamento delle armi di distruzione di massa da parte del regime iracheno, che fu poi citato da Colin Powell di fronte alle Nazioni Unite. Si è scoperto ben presto che il documento, lungi dall'essere stato generato dagli 007 inglesi tramite rocambolesche infiltrazioni, era stato scopiazzato dilettantescamente (errori di battitura compresi) da un vecchio documento di un ricercatore statunitense, Ibrahim al-Marashi, del Monterey Institute of International Studies.

La versione pubblicata sul Web era in formato Microsoft Word. Ora è stata rimossa, ma ne è conservata copia in vari siti, compreso quello dell'esperto di sicurezza Richard M. Smith. La pubblicazione in questo formato ha peggiorato ulteriormente la già magra figura, perché nascosti nel log delle revisioni del documento sono stati trovati i nomi di ben quattro collaboratori di Blair: Paul Hamill (funzionario del ministero degli esteri), John Pratt (funzionario di Downing Street), Alison Blackshaw (assistente personale dell'addetto stampa del primo ministro), e Murtaza Khan (vice addetto stampa di Tony Blair).

Il documento, insomma, era passato da molte mani assai responsabili prima di essere pubblicato. Difficile, a questo punto, prenderne le distanze: i nomi e cognomi di coloro che avevano letto e riveduto il documento erano lì, sotto gli occhi di tutti, silenziosamente registrati dal diligente programma Microsoft. La scoperta di questi nomi nel log è stata trascinata in Parlamento e ha contribuito a mettere a serio repentaglio la stabilità del governo britannico.


Metadati in libertà

I log di revisione di Word, annidati all'interno di ciascun documento scritto con il programma Microsoft, sono davvero ricchi di dettagli (ci sono log analoghi in PowerPoint e Excel, ma questa è un'altra storia). Nel caso Blair, per esempio, il log contiene anche traccia del fatto che Pratt ha fornito il dossier a Blackshaw affinché lo desse a Colin Powell, e per essere precisi lo ha fatto usando un dischetto.

Conoscere dettagli di tale finezza, relativi a personaggi di questo calibro, sembrerebbe roba degna di 007 ultrasofisticati. Invece sono informazioni in libertà all'interno di ogni documento Word. E non ci vuole molto per rivelarle: per un primo assaggio, in Windows basta cliccare sul nome del documento col pulsante destro e scegliere le proprietà avanzate.

Volendo scavare più a fondo, è sufficiente un qualsiasi editor esadecimale, facilmente disponibile in Rete, per scoprire tutti i dettagli del documento, come mostrato in questa schermata. I metadati sono sempre situati verso la fine del file. Spesso si trovano anche porzioni di testo cancellate, invisibili aprendo il documento nel modo normale ma molto rivelatrici.

Sia ben chiaro che Microsoft ha avvisato i propri utenti dell'esistenza di questa situazione: perlomeno lo ha fatto se per voi "avvisato" significa pubblicare l'avvertimento in inglese sul proprio sito (ogni riferimento ai Vogon della Guida Galattica per Autostoppisti di Douglas Adams è puramente casuale). La documentazione Microsoft in proposito è abbondante e proprio per questo piuttosto inquietante. In varie misure, sono colpite dal problema tutte le versioni di Microsoft Word attualmente in circolazione. Nella Knowledge Base della società di Redmond trovate i dettagli tecnici per Word 97, Word 2000 e Word 2002. La falsariga generale è che un documento scritto con queste tre versioni di Word può contenere due o tre fatterelli su di voi (cito testualmente): "il vostro nome, le vostre iniziali, il nome della vostra società o organizzazione, il nome del vostro computer, il nome del server di rete o del disco rigido sul quale avete salvato il documento, altre proprietà del file e informazioni riepilogative, porzioni non visibili di oggetti OLE embedded, i nomi degli autori precedenti, le revisioni e le versioni del documento, informazioni sul modello, testo nascosto e commenti". Scusate se è poco.

A tutto questo si aggiunge la spinosa questione del cosiddetto Unique Identifier di Word 97, un numero identificativo univoco che (dice Microsoft) consente a "strumenti di terze parti di lavorare con i documenti creati da Office e far riferimento ad essi". I maligni notano che siccome questo identificativo include il MAC address (identificativo univoco dell'eventuale scheda di rete presente nel PC), a dire il vero consente di sapere esattamente da quale computer (e quindi da chi) è stato scritto o modificato un qualsiasi documento Word. Grazie al cielo quest'informazione è stata rimossa dalle versioni successive del popolarissimo programma Microsoft.


Tecniche di pulizia

Le spiegazioni su come rimediare a questi problemi di privacy hanno momenti di ironia involontaria, come quando le istruzioni per Word 2000 suggeriscono di salvare in un formato diverso da quello Microsoft (RTF o HTML), e consistono principalmente in una lunga sequenza di operazioni manuali da eseguire su ciascun documento.

Per chi è rimasto a Word 97 (come certi membri del governo Blair) e teme il suo Unique Identifier, Microsoft offre un'apposita patch e anche un programma autonomo di "pulizia", che però rimuove soltanto quest'informazione nascosta senza far nulla per le altre. Stranamente, applicando questo programma al documento Blair, il file perde ben 3600 byte: un po' tanti per un semplice "identificativo univoco".

Per Word 2000, che non ha la magagna dell'Unique Identifier ma conserva tutte le altre, l'unica soluzione è una entusiasmante serie di procedure manuali. Buon divertimento.

Le cose migliorano un po' con Word 2002 e XP: esiste un'apposita opzione per "minimizzare" i metadati automaticamente in ogni documento. "Minimizzare" non vuol dire però "eliminare", come notano quelli di Securityfocus, che suggeriscono ulteriori misure.

Per farla breve, a tutt'oggi non c'è un modo semplice e rapido per garantire che un documento Word contenga più informazioni private di quante ne contenga una sua versione cartacea. L'unica vera soluzione è evitare di diffondere la versione Word di un documento, sostituendola con un'altra redatta in un formato meno indiscreto. Il governo Blair, per esempio, ha imparato bene la lezione appresa così duramente: ora il documento sull'Iraq è disponibile soltanto come file Acrobat PDF. Un'altra soluzione è usare OpenOffice.org il cui formato di file (XML compresso con ZIP) non contiene sorprese chiacchierone.


Giochiamo?

La lezione non è ancora stata assimilata del tutto dal governo italiano, ma ci sono segnali di speranza: immettendo word nel motore di ricerca di Governo.it, per esempio, si trovano numerosissimi documenti ex-Word riconvertiti in PDF. Di documenti in formato DOC non v'è traccia, perlomeno usando i normali metodi di ricerca.

Altra aria, purtroppo, presso la Camera, dove i file DOC abbondano e soprattutto sono ricchi di informazioni che non è prudente far circolare. Basta pescarne uno a caso per trovare l'autore del documento (non citato nel testo normalmente visibile), il sistema operativo e la struttura di directory dei vari computer degli utenti che si sono passati il documento (utili a chi volesse commettere intrusioni informatiche), e persino il famoso Unique Identifier che contiene il MAC address della scheda di rete del computer dell'autore. In tempi in cui si usano sempre più le reti wireless e si cerca di renderle sicure usando l'autenticazione basata proprio sul MAC address, questo è un comportamento decisamente imprudente.

Bene. Ora avete a disposizione anche voi gli strumenti per giocare alla caccia al tesoro. Se scoprite qualche chicca nascosta all'interno di un documento Word pubblicato sul Web, scrivetemi; stilerò una top ten delle più ghiotte indiscrezioni digitali. Buona caccia!