Non è la disponibilità gratuita a rendere preferibile il software open source in campo professionale; al limite, questo può tradursi in una maggiore libertà di stabilire la quantità di valore ricevuto e la forma più adatta per riconoscerlo.
Il vero motivo è la possibilità di affrontare problematiche di computing inusuali con tecniche molto più efficaci di quelle tradizionali. Situazione che si verifica sempre più spesso, nell’era dei terabyte, di mining e analytics dei dati, della moltiplicazione dei formati.
Si è verificata per esempio, racconta un articolo di CIO.com, nella produzione dell’annuale Data Breach Report dell’operatore telefonico americano Verizon. Il rapporto, ricco di analisi numeriche e diagrammi, è stato tradizionalmente prodotto con Excel, fino a che la crescente complessità dei dati ha suggerito il passaggio al progetto R. Oltre a facilitare l’analisi, raccontano su CIO, questo ha portato vari altri vantaggi collaterali non trascurabili:
Dato che il pacchetto di R ggplot2 può produrre grafica raffinata di qualità pubblicabile, l’azienda ha stimato un risparmio tra 15 mila e 20 mila dollari nell’evitare il ricorso a una agenzia esterna.
ggplot2 è anch’esso open source e universalmente utilizzabile. Così come il pacchetto verisr utilizzato per lavorare in modo più facile con il formato VERIS in cui si trovano i dati relativi alle violazioni della sicurezza dei sistemi, cui è dedicato il rapporto. Oppure R Markdown, che consente la creazione semplice di documenti dinamici che mescolano gli output di R con il testo a commento.
C’è molto altro nell’articolo, tra cui la descrizione degli strumenti di collaborazione – dalle chat alle videoconferenze ai controlli di versione – adoperati per venire a capo della mole di dati, assicurare il coordinamento tra tutte le persone interessate e mantenere la riproducibilità delle analisi indipendentemente da chi le effettua. Tutto open source, forse difficile da approcciare d’acchito ma incredibilmente flessibile e modellabile in base a obiettivi precisi e su misura, con dietro comunità attive e capaci di fornire supporto se e ove necessario.
I risultati parlano da soli e insegnano a non dare più per scontata la scelta degli strumenti di calcolo e analisi in ambito professionale e aziendale. Suggeriamo anche un’occhiata alla presentazione tenuta da Bob Rudis, senior data scientist presso Verizon Enterprise Solutions, al recente convegno EARL (Effective Applications of the R Language) di Boston.
Un’altra situazione dove l’open source brilla e mostra tutta la propria superiorità con il crescere delle difficoltà da superare per giungere al risultato. In potenza, versatilità e anche costo. Le vecchie abitudini, nell’informatica di oggi, possono essere una spesa superflua.