[Riproduciamo un articolo di Cole Nussbaumer Knaflic, di cui Apogeo ha pubblicato Data Storytelling, libro con tentativi di imitazione. Il post originale, how you would visualize hurricanes, è tratto dal blog storytelling with data.] [Gli altri post della serie sono apparsi nel 2017 in data 19 ottobre, 26 ottobre, 8 novembre, 22 novembre, 6 dicembre e 20 dicembre.]
Qualche tempo fa ho ripreso dall’Economist un grafico sugli uragani negli Stati Uniti e invitato i lettori a rielaborarlo, per dirmi che titolo avrebbero usato per descriverlo al posto dell’originale Gli uragani in America sono diventati meno frequenti. C’è voluto tempo per scegliere le sessanta migliori proposte [che presentiamo nel corso di più articoli]. Questo è il grafico originale:
I lettori hanno inviato le proposte più diverse e creative. Qui ne mostriamo una parte.
Kevin R.
Ha creato a grafico a colonne impostato sul declino complessivo del numero totale degli uragani.
Leonard M.
Nelle sue parole: “Siccome lo scopo del diagramma era mostrare che la tendenza degli uragani di potenza maggiore è in rialzo, ho levato i dati di sfondo sul conteggio totale. Mi distraevano e fluttuavano così selvaggiamente che veniva da mettere in dubbio la precisione del trend. Inoltre ho reso continua la linea che prima saltava di decennio in decennio”. “Nel mio titolo avrei colorato le parole ‘major hurricane’ in tinta con la riga rossa, probabilmente eliminando la necessità di una legenda. Lo strumento che ho usato (Power BI) però non lo consente”. “Mi chiedo quanto sia utile l’analisi di regressione su un set di dati come questo, visto che le misurazioni del vento 1901 erano sicuramente più approssimate di quelle del 2001. Si vede che per l’Economist sono affidabili comunque.”
Man H.
Ha elencato le imperfezioni dell’originale…
- Le barre colorate delle categorie di uragani sono troppo fitte. Alla prima occhiata è difficile cogliere il significato dei differenti colori.
- Le barre blu/verdi riguardano le categorie 1-2. Per logica viene da pensare che la linea tratteggiata verde riguardi sempre le categorie 1-2 (come quella tratteggiata rossa, per gli uragani più potenti. Invece si riferisce a “All Hurricanes”. Confonde.
- Il titolo recita “All hurricanes become less frequent” e così trascura l’aumento degli uragani potenti.
…e quanto ha fatto per trasmettere un messaggio più semplice, leggibile e chiaro:
- Via le barre colorate per le categorie, che ho riunito in strong winds (1-3) e major hurricanes /4-5).
- Solo una linea di tendenza per il totale uragani. Dà più prominenza al titolo appoggiato sulla linea.
- Via la linea di tendenza sugli uragani più potenti, perché dai dati non colgo un andamento significativo da evidenziare.
Marco H.
Ha svolto una montagna di analisi dentro Stata e aggiunto una quantità di illustrazioni in forma grafica e tabellare di cui riporto solo un sottoinsieme, aggiungendo varie informazioni: “Se consideriamo i dati su base annuale, non c’è evidenza di tendenze lineari significative, né per gli uragani potenti né per il totale. Anche scegliere punti di partenza diversi porta a risultati diversi: gli ultimi dieci decenni, e solo quelli, mostrano una decrescita quasi significativa degli uragani maggiori”. Marco aggiunge anche:
- All’Economist non dovrebbero avere aggiunto i dati di quell’ultimo mezzo decennio, che non sono rappresentativi di un periodo equivalente agli altri e confondono.
- Non dovrebbero avere dichiarato che Noaa ha prodotto questi dati, se l’Economist ha compiuto questa analisi e Noaa è unicamente la fonte.
- La linea best fit di regressione lineare è difficilmente giustificabile in dati espressi come piccoli interi positivi. Sarebbero state meglio la distribuzione di Poisson o una binomiale negativa oppure, ancora meglio, regressioni di serie temporali come Arima ce consentono di lavorare su sottili ritardi nei dati (per esempio, gli ultimi tre anni hanno influito sul dato 2017).
- Si potrebbe andare avanti…
Mark E.
Mark (Twitter) scrive “Non sono sicuro che l’esito dei dati sia abbastanza sensazionale da giustificare un titolo, ma dovessi proporne uno starei sul neutrale, tipo ‘Un uragano su tre soffia oltre le 178 miglia orarie'”. Mark ha inoltre raccontato l’esperienza sul proprio blog.
[Presenteremo in altri articoli il resto delle soluzioni fornite dai lettori del blog di Cole Nussbaumer Knaflic. Se i lettori di Apogeonline vogliono cimentarsi nella sfida, possono inviarci il loro lavoro e relative considerazioni all’indirizzo [email protected]. Il dataset di partenza è scaricabile da Dropbox. Entrati nel 2018, qualcuno potrebbe voler aggiungere al dataset le informazioni presenti sul sito Noaa e riguardanti lo scorso anno.]