Joan Carles Martori. Professor del Departament d’Economia i Empresa.

El Data Mining és un procés per explorar grans quantitats de dades amb l’objectiu de descobrir patrons i lleis. Encara que algunes de les tècniques que utilitza són noves, no és una nova tecnologia. La gent sempre ha intentat analitzar les dades, però la irrupció dels equips informàtics va suposar que moltes tècniques d’estadística multivariant desenvolupades en els inicis dels segle XX és poguessin aplicar a grans volums de dades. Aquestes eren  tècniques que havien estat formulades per estadístics dedicats principalment a la biologia, de fet eren eines i tècniques dedicades a la confirmació de les teories de l’evolució de Darwin. Al llarg del temps Data Mining ha tingut altres noms: knowledge discovery, business intelligence, predictive modelin i predictive analítics, entre altres.

Aplicat a l’economia i l’empresa, el Data Mining és un procés que interactua amb altres processos, no és el principi i el final sinó que sempre està en funcionament. Data Mining analitza les dades però també en crea de noves que serveixen com a matèria primera per altres anàlisis, i també col·labora amb altres tècniques per entendre els mercats i els consumidors.

Perquè ara és important per a les empreses? Encara que les tècniques que utilitza Data Mining són antigues, algunes com l’anàlisi de supervivència tenen el seu origen en les tables de mortalitat del segle XVII. A partir de la dècada dels 90 la seva importància creix degut a la convergència de diversos factors: Es produeixen dades constantment, aquestes dades es poden emmagatzemar, es disposa d’un alt poder de càlcul, hi ha un gran interès per la gestió de la relació amb el client (CRM, Customer Relationship Management), i es disposa de  software comercial i lliure de Data Mining.

En un gran ventall de sectors, el client és el  centre de l’activitat de l’empresa i la informació sobre aquest client esdevé un element clau. D’aquesta idea se’n deriven dos més: cada negoci és un negoci de serveis i la informació és un producte.

Quines competències ha de tenir un Data Miner? Primer de tot es necessiten habilitats numèriques i un fort coneixement de les tècniques estadístiques. Les tècniques més emprades són: anàlisi clúster i factorial (exploratori i confirmatori), anàlisi discriminant, regressió múltiple, models logístics i arbres de decisió, entre altres.

El coneixement de les tècniques per si sol no garanteix l’èxit, perquè encara és més important saber quan són útils. En termes de competències acadèmiques, un Data miner ha de saber treballar amb grup, comunicar els resultats i reconèixer què és realment important de les anàlisis executades.

Per últim i per copsar la magnitud de la informació que es genera constantment en el nostre entorn i que és susceptible de ser analitzada i posada en valor, un petit exercici d’imaginació:   Penseu quanta informació queda registrada dels moviments dels caixers automàtics un dissabte al vespre, quanta informació tenen les companyies de telecomunicacions sobre les nostres connexions o quina informació té el nostre supermercat quan el caixer passa la nostra targeta de l’establiment després de la nostra compra.