Data Science: il nuovo che avanza ?


Ogni epoca ha le sue nuove “mode” e il nuovo che avanza. I cambiamenti stanno diventando sempre più frenetici e le necessità di aggiornamento professionale e metodologico aumentano di conseguenza. Nel mondo dell’analisi dei dati le novità degli ultimi lustri si collocano tutte a monte e a valle del processo, mentre il nocciolo duro, che poi sono le metodologie di analisi, sono ormai consolidate e nessuna vera novità le ha scalfite. L’approccio delle reti neurali ha fatto capolino negli anni novanta ma è stato rapidamente messo da parte dalla ricerca di marketing, benché sia uno degli ingredienti del moderno data mining. Cosa allora è veramente cambiato ?

Essenzialmente due elementi, il primo come si diceva a monte dell’analisi e il secondo a valle.

Il primo: una sempre più vasta capacità di raccogliere dati e informazioni. Molti ricercatori e analisti ricorderanno che solo 30 anni fa la raccolta di dati nell’ambito della cosiddetta “traditional research” era una vera e propria avventura. Il paper and pen era il metodo di intervista imperante e solo una parte dei dati erano raccolti attraverso indagini postali.  Poi è arrivata l’epoca del CATI, ancora tutt’altro che tramontata, che ha permesso di abbattere in modo decisivo costi e tempi di rilevazione. Infine è arrivato il web e una volta reso pressoché “universale” l’accesso a internet, anche grazie alla diffusione degli smartphone, sono entrate in gioco le web survey. Ma la vera e propria rivoluzione è arrivata con la diffusione di tecnologie in grado di tracciare sia i comportamenti “di navigazione” dei cybernauti che tutta una vasta serie di comportamenti della vita di tutti i giorni, dal modo di spostarsi alle spese effettuate, dalla fruizione dei servizi della P.A. al modo di fruire del nostro tempo libero, ecc. Siamo sempre connessi si dice. E quindi siamo sempre tracciati, che ci piaccia o meno.

datascience_775_x_330L’enorme mole di dati a disposizione, per lo più raccolti in modo passivo, ha dato così impulso al filone dei cosiddetti Big Data, dove si è realizzato più facilmente il connubio tra raccolta dei dati e loro elaborazione.

Qui arriviamo al secondo punto: una sempre maggiore capacità computazionale e quindi possibilità di esplorare i dati multidimensionali e ricavarne insights.

Quando si parla di Data Science in effetti non si sta parlando di una nuova disciplina e quanti la spacciano per assoluta novità non fanno onore alla storia delle tante altre discipline, dalla business analytics alla predictive analysis, dal data mining al database marketing, che di Data Science parlavano già negli anni ottanta. Ciò che sicuramente è cambiato è che oggi è più facile raccogliere i dati e utilizzarli per restituire al consumatore un valore aggiunto. Quindi i tempi sono diventati maturi per ridefinire un approccio trasversale e organico alla trattazione dei dati, dalla loro raccolta alla loro fruizione.

In effetti potremmo affermare che la Data Science oggi è soprattutto un tentativo di raccogliere a fattor comune metodologie, tecnologie e competenze, per valorizzare il patrimonio informativo dei dati.

DSwordle

Ieri il Dipartimento di Ingegneria dell’Università di Perugia, in collaborazione con Sviluppumbria, IBM, Engineering e progetto di ricerca Edison ha organizzato un interessante convegno, dal titolo “Data Science, una scienza per la crescita sociale ed economica” (cliccare qui per dettagli), con la partecipazione di esperti di diverse realtà, sia aziendali che istituzionali che, infine, accademiche. Presso il dipartimento di Ingegneria è stato peraltro istituito un master di secondo liv17760067_10154778215546773_3645632839540836466_nello in Data Science, iniziativa che pone l’Università di Perugia all’avanguardia nel mondo accademico. Ho ascoltato con attenzione in particolare la tavola rotonda presieduta egregiamente dal professor Sciolari di AssoKnowledge.

Tra le mie percezioni-riflessioni a seguito di questa esperienza voglio evidenziare le seguenti:

  1. sembra non sia chiaro ancora nemmeno agli addetti ai lavori quale sia il perimetro della Data Science. In alcuni casi gli esempi testimoniati  sono sconfinati nell’Automation, disciplina che a parere di chi scrive vive di luce propria ed è estranea alla Data Science. In un contesto ancora confuso non è stato possibile per il professor Sciolari ottenere risposte soddisfacenti a due interrogativi tra tutti:
    1. quali i vantaggi concreti che la Data Science potrà apportare agli user finali
    2. quale il percorso condiviso che può essere attivato per costruire-rafforzare-cristallizzare la disciplina.
  2. la trasversalità e l’ampiezza della Data Science così come oggi è presentata rende difficile l’individuazione di figure professionali omogenee. In effetti l’articolazione delle figure professionali necessarie rende arduo lo stesso tentativo di costruire una didattica standardizzata. Non conosco nei dettagli la didattica del master dell’Università di Perugia e quindi mi astengo da qualsiasi valutazione su questo aspetto. Per il lettore potrà essere sicuramente utile dare un’occhiata a questo documento di presentazione del corso di specializzazione post-laurea dell’AUST (American University of Science and Technology) denominato Data Science and Big Data, che mi ha colpito per la sua estrema chiarezza ed efficacia.  masterAUSTConfesso che non ho effettuato una ricerca organica presso i siti delle principali università del globo per cui l’esempio non vuole essere rappresentativo di alcunché, ma deve essere inteso solo come uno stimolo ad ulteriori approfondimenti.
  3. Dal punto di vista delle aziende la Data Science dovrebbe essere finalizzata alla generazione di insights, ovvero nuove conoscenze sulle preferenze e sui comportamenti dei consumatori. In questo ambito non può venir meno, come sottolineato anche nel corso del Convegno, la capacità di porre le giuste domande ai dati, né la capacità di trarre conclusioni appropriate e di comunicarle nel modo più efficace possibile. Più difficile a mio parere che la Data Science possa essere invece inserita subito in modo efficace nei processi di Data Driven Decisions. In questo caso il ruolo della ricerca tradizionale è tuttora decisivo.
  4. Lo user finale inteso come consumatore/cittadino non ha alcun bisogno di essere pienamente consapevole dell’esistenza e dei meccanismi di funzionamento della Data Science. Ha però diritto a vedere tutelata la propria privacy, così come ha diritto a essere tutelato dall’invadenza di talune offerteATI-Blog-Image commerciali…  E’ in generale auspicabile che la destinazione d’uso della disciplina non sia confinata al neo marketing one-to-one tecnologico ma includa invece e soprattutto una più facile fruizione di informazioni e di servizi. In questo ambito il compito del regolatore pubblico è di fondamentale importanza.

Per quanto concerne la ricerca di marketing tradizionale essa non è necessariamente in competizione con i nuovi attori della Data Science. Le differenze di approccio e di contenuto sono per ora chiaramente identificabili:

  • diverso contesto di azione, come descritto al punto 3, nei processi di data driven decisions la ricerca tradizionale è ancora protagonista
  • diversi tools utilizzati in funzione della natura dei dati raccolti e delle modalità di raccolta (essenzialmente passive in ambito Big Data, attive in ambito marketing research)
  • diversa filosofia di analisi dei dati.

Lauren Paul (lead blogger di GutCheck) ha proposto in un recente articolo (link) alcune interessanti convergenze tra ricerca di marketing e Data Science. Secondo la Lauren la complementarietà tra le due discipline si esplicherebbe in:

  • uso di strumenti di ricerca qualitativa per verificare e validare le scoperte dell’analisi dei Big Data
  • verifica di ipotesi proposte dai Data Scientist con tecniche di ricerca tradizionale
  • uso della tecnica dello storytelling per contestualizzare gli insight dei Data Scientist
  • inglobare alcune evidenze delle ricerche di marketing nei modelli predittivi.

Il dibattito è aperto e ancora molto rimane da scrivere. Ai posteri l’ardua sentenza…

 

Annunci

Rispondi

Inserisci i tuoi dati qui sotto o clicca su un'icona per effettuare l'accesso:

Logo WordPress.com

Stai commentando usando il tuo account WordPress.com. Chiudi sessione / Modifica )

Foto Twitter

Stai commentando usando il tuo account Twitter. Chiudi sessione / Modifica )

Foto di Facebook

Stai commentando usando il tuo account Facebook. Chiudi sessione / Modifica )

Google+ photo

Stai commentando usando il tuo account Google+. Chiudi sessione / Modifica )

Connessione a %s...

Blog su WordPress.com.

Su ↑

%d blogger hanno fatto clic su Mi Piace per questo: