在大數(shù)據(jù)時代,大數(shù)據(jù)價值的呈現(xiàn)最重要的就是數(shù)據(jù)分析。中培偉業(yè)《大數(shù)據(jù)分析及可視化應用》培訓專家,數(shù)據(jù)分析是基于商業(yè)目的,有目的的進行收集、整理、加工和分析數(shù)據(jù),提煉有價信息的一個過程。
其過程概括起來主要包括:明確分析目的與框架、數(shù)據(jù)收集、數(shù)據(jù)處理、數(shù)據(jù)分析、數(shù)據(jù)展現(xiàn)和撰寫報告等6個階段。
1、明確分析目的與框架
一個分析項目,你的數(shù)據(jù)對象是誰?商業(yè)目的是什么要解決什么業(yè)務問題數(shù)據(jù)分析師對這些都要了然于心。
基于商業(yè)的理解,整理分析框架和分析思路。例如,減少新客戶的流失、優(yōu)化活動效果、提高客戶響應率等等。不同的項目對數(shù)據(jù)的要求,使用的分析手段也是不一樣的。
2、數(shù)據(jù)收集
數(shù)據(jù)收集是按照確定的數(shù)據(jù)分析和框架內容,有目的的收集、整合相關數(shù)據(jù)的一個過程,它是數(shù)據(jù)分析的一個基礎。
3、數(shù)據(jù)處理
數(shù)據(jù)處理是指對收集到的數(shù)據(jù)進行加工、整理,以便開展數(shù)據(jù)分析,它是數(shù)據(jù)分析前必不可少的階段。這個過程是數(shù)據(jù)分析整個過程中最占據(jù)時間的,也在一定程度上取決于數(shù)據(jù)倉庫的搭建和數(shù)據(jù)質量的保證。
數(shù)據(jù)處理主要包括數(shù)據(jù)清洗、數(shù)據(jù)轉化等處理方法。
4、數(shù)據(jù)分析
數(shù)據(jù)分析是指通過分析手段、方法和技巧對準備好的數(shù)據(jù)進行探索、分析,從中發(fā)現(xiàn)因果關系、內部聯(lián)系和業(yè)務規(guī)律,為商業(yè)目提供決策參考。
到了這個階段,要能駕馭數(shù)據(jù)、開展數(shù)據(jù)分析,就要涉及到工具和方法的使用。其一要熟悉常規(guī)數(shù)據(jù)分析方法,最基本的要了解例如方差、回歸、因子、聚類、分類、時間序列等多元和數(shù)據(jù)分析方法的原理、使用范圍、優(yōu)缺點和結果的解釋;其二是熟悉1+1種數(shù)據(jù)分析工具,Excel是最常見,一般的數(shù)據(jù)分析我們可以通過Excel完成,后而要熟悉一個專業(yè)的分析軟件,如數(shù)據(jù)分析工具SPSS/SAS/R/Matlab等,便于進行一些專業(yè)的統(tǒng)計分析、數(shù)據(jù)建模等。
5、數(shù)據(jù)展現(xiàn)
一般情況下,數(shù)據(jù)分析的結果都是通過圖、表的方式來呈現(xiàn),俗話說:字不如表,表不如圖。。借助數(shù)據(jù)展現(xiàn)手段,能更直觀的讓數(shù)據(jù)分析師表述想要呈現(xiàn)的信息、觀點和建議。。
常用的圖表包括餅圖、折線圖、柱形圖/條形圖、散點圖、雷達圖等、金字塔圖、矩陣圖、漏斗圖、帕雷托圖等。
6、撰寫報告
最后階段,就是撰寫數(shù)據(jù)分析報告,這是對整個數(shù)據(jù)分析成果的一個呈現(xiàn)。通過分析報告,把數(shù)據(jù)分析的目的、過程、結果及方案完整呈現(xiàn)出來,以供商業(yè)目的提供參考。
一份好的數(shù)據(jù)分析報告,首先需要有一個好的分析框架,并且圖文并茂,層次明晰,能夠讓閱讀者一目了然。結構清晰、主次分明可以使閱讀者正確理解報告內容;圖文并茂,可以令數(shù)據(jù)更加生動活潑,提高視覺沖擊力,有助于閱讀者更形象、直觀地看清楚問題和結論,從而產生思考。
另外,數(shù)據(jù)分析報告需要有明確的結論、建議和解決方案,不僅僅是找出問題,后者是更重要的,否則稱不上好的分析,同時也失去了報告的意義,數(shù)據(jù)的初衷就是為解決一個商業(yè)目的才進行的分析,不能舍本求末。
蔣老師指出,在大數(shù)據(jù)時代,所有的大數(shù)據(jù)人才都應該注重大數(shù)據(jù)分析,這才是決定大數(shù)據(jù)價值的關鍵要素。