Home
L’abitudine costa

19 Novembre 2015

L’abitudine costa

di

Si generano sempre più dati, la complessità di utilizzo e analisi esplode. Ci sono strumenti migliori di quelli scontati.

Non è la disponibilità gratuita a rendere preferibile il software open source in campo professionale; al limite, questo può tradursi in una maggiore libertà di stabilire la quantità di valore ricevuto e la forma più adatta per riconoscerlo.
Il vero motivo è la possibilità di affrontare problematiche di computing inusuali con tecniche molto più efficaci di quelle tradizionali. Situazione che si verifica sempre più spesso, nell’era dei terabyte, di mining e analytics dei dati, della moltiplicazione dei formati.
Si è verificata per esempio, racconta un articolo di CIO.com, nella produzione dell’annuale Data Breach Report dell’operatore telefonico americano Verizon. Il rapporto, ricco di analisi numeriche e diagrammi, è stato tradizionalmente prodotto con Excel, fino a che la crescente complessità dei dati ha suggerito il passaggio al progetto R. Oltre a facilitare l’analisi, raccontano su CIO, questo ha portato vari altri vantaggi collaterali non trascurabili:

Dato che il pacchetto di R ggplot2 può produrre grafica raffinata di qualità pubblicabile, l’azienda ha stimato un risparmio tra 15 mila e 20 mila dollari nell’evitare il ricorso a una agenzia esterna.

ggplot2 è anch’esso open source e universalmente utilizzabile. Così come il pacchetto verisr utilizzato per lavorare in modo più facile con il formato VERIS in cui si trovano i dati relativi alle violazioni della sicurezza dei sistemi, cui è dedicato il rapporto. Oppure R Markdown, che consente la creazione semplice di documenti dinamici che mescolano gli output di R con il testo a commento.
C’è molto altro nell’articolo, tra cui la descrizione degli strumenti di collaborazione – dalle chat alle videoconferenze ai controlli di versione – adoperati per venire a capo della mole di dati, assicurare il coordinamento tra tutte le persone interessate e mantenere la riproducibilità delle analisi indipendentemente da chi le effettua. Tutto open source, forse difficile da approcciare d’acchito ma incredibilmente flessibile e modellabile in base a obiettivi precisi e su misura, con dietro comunità attive e capaci di fornire supporto se e ove necessario.
I risultati parlano da soli e insegnano a non dare più per scontata la scelta degli strumenti di calcolo e analisi in ambito professionale e aziendale. Suggeriamo anche un’occhiata alla presentazione tenuta da Bob Rudis, senior data scientist presso Verizon Enterprise Solutions, al recente convegno EARL (Effective Applications of the R Language) di Boston.
Un’altra situazione dove l’open source brilla e mostra tutta la propria superiorità con il crescere delle difficoltà da superare per giungere al risultato. In potenza, versatilità e anche costo. Le vecchie abitudini, nell’informatica di oggi, possono essere una spesa superflua.

L'autore

  • Lucio Bragagnolo
    Lucio Bragagnolo è giornalista, divulgatore, produttore di contenuti, consulente in comunicazione e media. Si occupa di mondo Apple, informatica e nuove tecnologie con entusiasmo crescente. Nel tempo libero gioca di ruolo, legge, balbetta Lisp e pratica sport di squadra. È sposato felicemente con Stefania e padre apprendista di Lidia e Nive.

Iscriviti alla newsletter

Novità, promozioni e approfondimenti per imparare sempre qualcosa di nuovo

Gli argomenti che mi interessano:
Iscrivendomi dichiaro di aver preso visione dell’Informativa fornita ai sensi dell'art. 13 e 14 del Regolamento Europeo EU 679/2016.