Analiza datelor este o provocare de foarte multe ori. Tocmai din cauza asta a fost nevoie să apară specializari gen Data Mining, Data Modelling, Data Insights pe lângă mult mai popularele Data Visualisation si Data Analysis ca parte din Data Analytics. Sigur, Data Mining se datorează mai mult Machine Learning, dar nu contrazice ce am zis mai sus în totalitate.
Însă, pe cât de frumos și util poate fi domeniul acesta, pe atât de ușor este să greșești atunci când nu ești suficient de abil în analiză.
Câteva, doar câteva, exemple de analiză eronată:
Eșantioanele de date trimise spre analiză sunt pe un segment de timp prea mare pentru o analiză în detaliu. Eroarea aici fiind ignorarea faptului că detaliile importante pot fi descoperite doar în analiza datelor pe un timeframe mic, chiar și de o zi.
Descoperirea șabloanelor sau structurilor (patterns) se încearcă în seturi prea mici de date pe un segment prea mare timp. Eroarea fiind că este nevoie de exact opusul acestei tehnici și anume seturi mari de date în interval de timp mic. Dacă seturile de date sunt mici, atunci intervalul de timp trebuie să fie și mai mic.
Interpretarea datelor (Data Insights/ Insights Analytics) se face pornind de la o bază de cunoștințe mult prea generalizată. Eroarea fiind evidentă: – este o pierdere de timp să încerci să analizezi un business, spre exemplu, pe baza a ceea ce știi doar la modul general.
Graba de a trage concluzii. Am văzut modul acesta de lucru atât la nivel de analist, dar mai ales la nivel de management. Lucrând grăbit, nu faci decât eroare după eroare. Concluzionezi urmarind doar informații de suprafață, nu și de detaliu. ori detaliul se poate observa doar când analizezi ca atare.