L’epoca delle delocalizzazioni ha contagiato anche il settore delle ricerche di mercato. Tendenza in atto per la verità già da tempo ma, almeno inizialmente, confinata ai call center rumeni.

Ora assistiamo invece a una crescente tendenza a “delocalizzare” anche le analisi dei dati. L’idea in sè non è malvagia: gli indiani costano poco, almeno fino a quando li teniamo a casa loro. Quindi, gli spediamo il nostro pacchetto di dati e loro costruiscono tabelle e grafici a costi da grandi magazzini.

Tuttavia, c’è già chi si è pentito…

Alcuni mesi fa, parlando con un nostro cliente, ci hanno riferito che un loro ex fornitore, istituto molto noto in Italia, gli ha fatto venire i capelli diritti a causa di elaborazioni dati affidate a una società indiana. E non parliamo solo di problemi linguistici, ovvero sgrammaticature e quant’altro, ma proprio di problemi legati a una mole abnorme di errori di elaborazione. Cosa è successo ? Certo sbagliare può capitare a chiunque, anche se nell’elaborazione dei dati è richiesta una altissima precisione, ma il problema è nel controllo. Il controllo dei dati è facilitato dalla conoscenza del contesto di riferimento, ovvero se io so già che la popolazione di Roma ha certe caratteristiche sono certamente facilitato nello scovare errori evidenti nella distribuzione per età, ecc.

Ma partendo da questo aneddoto (per inciso, uno dei motivi per i quali li abbiamo sostituiti è anche questo…), colgo l’occasione per alzare un pò il tiro. Il problema non è la Cina, l’India, il Vietnam o qualunque altra opportunità data dalla combinazione tra gli strumenti di comunicazione a distanza oggi disponibili e la disponibilità in quei paesi di servizi EDP a basso costo. Il problema è che manca la sensibilità per cogliere l’importanza di una analisi dei dati di qualità.

In Italia siamo particolarmente bravi a sottovalutare le elaborazioni statistiche dei dati e la professionalità necessaria per svolgerle al meglio. Con il risultato che il “mestiere” di analista dati è uno dei più improvvisati del Paese. Il “fai da Te” dilaga a tutti i livelli, basta scorrere il curriculum dei vari soggetti che svolgono studi e indagini per i vari enti pubblici.

Giova ricordare che quasi sempre la quota di costo più elevata di una indagine è il field. Mentre quasi sempre analisi dei dati e reporting sono quelli che fanno la differenza agli occhi del Cliente. Allora, a che pro risparmiare proprio nell’analisi dei dati ?

Che vengano colti o no, ci sono una serie di errori che vengono commessi comunemente dagli analisti improvvisati, tra i quali:

  • scelta di grafici e tabelle inappropriati per la variabile in esame
  • ignorare il tipo di campionamento adottato quando il campione non è autoponderante (o rappresentativo), ergo: errori di inferenza statistica
  • ignorare il problema delle basse numerosità, ovvero mancata applicazione della teoria sulla “robustezza dei dati”
  • quantificazioni delle scale ordinali “artigianali” o banalizzate, sistematicamente risolte con l’attribuzione di punteggi progressivi ai vari elementi della scala semantica
  • generale mancata consapevolezza della natura della variabile in esame e delle conseguenti possibili elaborazioni ad essa associate,

nonché omissioni più o meno gravi, che contribuiscono ad alimentare l’immagine della statistica come qualcosa di raffazzonato e poco scientifico, per esempio:

  • non calcolare la variabilità dei risultati (da cui “la media dei polli…”)
  • non supportare le segmentazioni dei risultati da una analisi della correlazione, o della concordanza o della connessione tra le variabili coinvolte
  • ignorare l’errore statistico associato a una stima e tutti gli elementi che possono dare l’opportunità di valutarlo anche in modo approssimato, (p.e. non presentare le basi di calcolo di una percentuale, ecc.)

Leggendo in giro vari commenti a post di Linkedin e Xing, mi sono imbattuto in uno sfogo di una ricercatrice con la quale sono in corrispondenza, che si lamentava perché dopo anni di esperienza è costretta a guadagnare 600 Eur al mese, nonostante sappia tutto della regressione e dei modelli fattoriali (e, penso, di molto altro ancora).

Il problema, cara amica, è che chi deve giudicare il Tuo lavoro e decidere quanto vali non sa nulla delle analisi dei dati. Eh sì, perché nessuno dei nostri istituti è rappresentato ai massimi livelli da persone che abbiano una conoscenza teorica della statistica metodologica. E anche tra i cosiddetti Responsabili Ricerche quelli in possesso di una solida base statistico-metodologica sono una sparuta minoranza.

Ad maiora.