CDA認(rèn)證在數(shù)據(jù)分析方面是較為權(quán)威的,CDA LEVEL1業(yè)務(wù)數(shù)據(jù)分析師認(rèn)證考試主要涵蓋業(yè)務(wù)數(shù)據(jù)分析的基礎(chǔ)知識(shí)和技能。以下是為大家整理的備考建議。
CDA LEVEL1業(yè)務(wù)數(shù)據(jù)分析師備考首先需要熟悉考試內(nèi)容和結(jié)構(gòu):在考試之前,應(yīng)該詳細(xì)了解考試的內(nèi)容和結(jié)構(gòu),包括考試題型、考試時(shí)間限制、考試重點(diǎn)和難點(diǎn)等。CDA理事會(huì)官方網(wǎng)站提供了詳細(xì)的考試指南和信息。
其次就是學(xué)習(xí)業(yè)務(wù)數(shù)據(jù)分析基礎(chǔ)知識(shí):了解業(yè)務(wù)數(shù)據(jù)分析的基本概念、方法和工具,例如數(shù)據(jù)收集、數(shù)據(jù)預(yù)處理、數(shù)據(jù)分析、數(shù)據(jù)可視化等。您可以參考相關(guān)的教材、課程。
CDA LEVEL1業(yè)務(wù)數(shù)據(jù)分析師認(rèn)證課程,按照【領(lǐng)會(huì)】【熟知】【應(yīng)用】三個(gè)級(jí)別學(xué)習(xí),高效備考。
PART 1 數(shù)據(jù)分析概念與統(tǒng)計(jì)學(xué)基礎(chǔ)
1、數(shù)據(jù)分析概述
【領(lǐng)會(huì)】
數(shù)據(jù)分析和數(shù)據(jù)挖掘的概念
強(qiáng)調(diào)商業(yè)數(shù)據(jù)分析中對(duì)業(yè)務(wù)的理解
商業(yè)數(shù)據(jù)分析和預(yù)測(cè)的本質(zhì)
數(shù)據(jù)分析的8個(gè)層次
大數(shù)據(jù)對(duì)傳統(tǒng)小數(shù)據(jù)分析的拓展
【熟知】
明確數(shù)據(jù)分析目標(biāo)及意義
數(shù)據(jù)分析的過程
數(shù)據(jù)分析與數(shù)據(jù)挖掘的常用方法
CRISP-DM、SEMMA 方法論
數(shù)據(jù)分析中不同人員的角色與職責(zé)
2、描述性統(tǒng)計(jì)分析
【領(lǐng)會(huì)】
數(shù)據(jù)的計(jì)量尺度
數(shù)據(jù)的集中趨勢(shì)、離中趨勢(shì)和數(shù)據(jù)分布的概念
統(tǒng)計(jì)圖的概念
各種統(tǒng)計(jì)圖的含義和畫法
【熟知】
衡量數(shù)據(jù)集中趨勢(shì)、離中趨勢(shì)和數(shù)據(jù)分布的常用指標(biāo)及計(jì)算方法統(tǒng)計(jì)圖形的繪制、圖形元素的調(diào)整、可視化效果,主要涉及條形圖、線圖、直方圖、盒須圖、散點(diǎn)圖、氣泡圖、馬賽克圖、玫瑰圖及其多種圖形整合。明確統(tǒng)計(jì)圖形對(duì)統(tǒng)計(jì)指標(biāo)表達(dá)上的對(duì)應(yīng)關(guān)系
【應(yīng)用】
根據(jù)不同數(shù)據(jù)類型選用不同的統(tǒng)計(jì)指標(biāo)來進(jìn)行數(shù)據(jù)的集中趨勢(shì)、離中趨勢(shì)和數(shù)據(jù)分布的衡量,不同統(tǒng)計(jì)圖的使用場(chǎng)景。會(huì)寫數(shù)據(jù)分析報(bào)告和結(jié)合業(yè)務(wù)需求對(duì)報(bào)告進(jìn)行合理解釋,對(duì)業(yè)務(wù)?出建設(shè)性意見建議。
3、抽樣估計(jì)
【領(lǐng)會(huì)】
隨機(jī)試驗(yàn)、隨機(jī)事件、隨機(jī)變量的概念
總體與樣本的概念
抽樣估計(jì)的理論基礎(chǔ)
正態(tài)分布及三大分布的函數(shù)形式和圖像形式
抽樣的多種組織形式
確定必要樣本容量的原因
【熟知】
隨機(jī)事件的概率
抽樣平均誤差的概念與數(shù)學(xué)性質(zhì)
點(diǎn)估計(jì)與區(qū)間估計(jì)方法的特點(diǎn)與優(yōu)缺點(diǎn)
全體總體與樣本總體
參數(shù)和統(tǒng)計(jì)量
重復(fù)抽樣與不重復(fù)抽樣
抽樣誤差的概念對(duì)總體平均數(shù)和總體成數(shù)的區(qū)間估計(jì)方法
必要樣本容量的影響因素
中心極限定理的意義與應(yīng)用
【應(yīng)用】
隨機(jī)變量及其概率分布
全部可能的樣本單位數(shù)目的概念及其在不同抽樣方法下的確定
抽樣平均誤差在實(shí)際數(shù)據(jù)分析中的計(jì)算方法
4、假設(shè)檢驗(yàn)
【領(lǐng)會(huì)】
假設(shè)檢驗(yàn)的基本概念
其基本思想在數(shù)據(jù)分析中的作用
假設(shè)檢驗(yàn)的基本步驟
假設(shè)檢驗(yàn)與區(qū)間估計(jì)的聯(lián)系
假設(shè)檢驗(yàn)中的兩類錯(cuò)誤
【熟知】
P值的含義及計(jì)算
如何利用P值進(jìn)行檢驗(yàn)
z檢驗(yàn)統(tǒng)計(jì)量
t檢驗(yàn)統(tǒng)計(jì)量
F檢驗(yàn)統(tǒng)計(jì)量
c2檢驗(yàn)統(tǒng)計(jì)量的函數(shù)形式和檢驗(yàn)步驟
【應(yīng)用】
實(shí)現(xiàn)單樣本t檢驗(yàn)
兩獨(dú)立樣本t檢驗(yàn)的步驟和檢驗(yàn)中使用的統(tǒng)計(jì)量與原假設(shè)
兩種檢驗(yàn)應(yīng)用的數(shù)據(jù)分析場(chǎng)景。
5、方差分析
【領(lǐng)會(huì)】
方差分析的相關(guān)概念
單因素方差分析的原理
統(tǒng)計(jì)量構(gòu)造過程
【熟知】
單因素方差分析的基本步驟
總離差平方和(SST)的含義及計(jì)算
組間離差平方和(SSA)的含義及計(jì)算
組內(nèi)離差平方和(SSE)的含義及計(jì)算
單因素方差分析的原假設(shè)
【應(yīng)用】
實(shí)現(xiàn)單因素方差分析的步驟
對(duì)方差分析表的分析以及多重比較表的分析
6、簡(jiǎn)單線性回歸分析
【領(lǐng)會(huì)】
相關(guān)圖的繪制與作用
相關(guān)表的編制與作用
相關(guān)系數(shù)定義公式的字母含義
估計(jì)標(biāo)準(zhǔn)誤差與相關(guān)系數(shù)的關(guān)系
【熟知】
相關(guān)關(guān)系的概念與特點(diǎn)
相關(guān)關(guān)系與函數(shù)關(guān)系的區(qū)別與聯(lián)系
相關(guān)關(guān)系的種類
相關(guān)系數(shù)的意義以及利用相關(guān)系數(shù)的具體數(shù)值對(duì)現(xiàn)象相關(guān)等級(jí)的劃分
回歸分析的概念
回歸分析的主要內(nèi)容和特點(diǎn)
建立一元線性回歸方程的條件
應(yīng)用回歸分析應(yīng)注意的問題
估計(jì)標(biāo)準(zhǔn)誤差的意義及計(jì)算
【應(yīng)用】
運(yùn)用簡(jiǎn)捷法公式計(jì)算相關(guān)系數(shù)
相關(guān)分析分析中應(yīng)注意的問題
回歸分析與相關(guān)分析的區(qū)別與聯(lián)系
PART 2 SQL數(shù)據(jù)庫基礎(chǔ)
1、SQL基礎(chǔ)概念
【領(lǐng)會(huì)】
關(guān)系型數(shù)據(jù)庫基本概念、屬性
主鍵
外鍵
E-R 圖
ANSI-SQL 以及不同的數(shù)據(jù)庫實(shí)現(xiàn)的關(guān)系
【熟知】
邏輯運(yùn)算符
比較運(yùn)算符
算術(shù)運(yùn)算符
通配符
2、SQL查詢語句
【應(yīng)用】
select 語句
包括查詢單列
多列,去重,前 N 列
from 語句、where 語句、group by 語句、having 語句、order by 語句、子查詢
SQL 聚合函數(shù),包括 count、sum、avg、max、min 等
3、SQL連接語句
【領(lǐng)會(huì)】
表的連接類型,包括內(nèi)連接(等值、不等值)、外連接(左、右、全)、交叉連接(笛卡爾連接)查詢的集合操作,只包括并集操作
【應(yīng)用】
inner join 的用法
left/right/full join 的用法
cross join 的用法
union 的用法
4、其他SQL語句
【領(lǐng)會(huì)】
表的創(chuàng)建
視圖及索引的概念及創(chuàng)建
數(shù)據(jù)插入、更新、刪除
【領(lǐng)會(huì)】
高級(jí)函數(shù),如 Oracle 或 Hive 中的 row number over partition by、正則匹配等
PART 3數(shù)據(jù)采集與處理
1、數(shù)據(jù)采集方法
【領(lǐng)會(huì)】
一手?jǐn)?shù)據(jù)與二手?jǐn)?shù)據(jù)來源渠道
優(yōu)劣勢(shì)分析
使用注意事項(xiàng)
【熟知】
一手?jǐn)?shù)據(jù)采集中的概率抽樣與非概率抽樣的區(qū)別與優(yōu)缺點(diǎn)
【運(yùn)用】
概率抽樣方法,包括簡(jiǎn)單隨機(jī)抽樣、分層抽樣、系統(tǒng)抽樣、分段抽樣
明確每種抽樣的優(yōu)缺點(diǎn)
根據(jù)給定條件選擇最可行的抽樣方式
計(jì)算簡(jiǎn)單隨機(jī)抽樣所需的樣本量
Ø 市場(chǎng)調(diào)研
【熟知】
市場(chǎng)調(diào)研的基本步驟(?出問題、調(diào)查收集材料、分析預(yù)測(cè)問題)
單選題及多項(xiàng)選擇題的設(shè)置
數(shù)據(jù)編碼及錄入
Ø 數(shù)據(jù)預(yù)處理方法
【熟知】
數(shù)據(jù)預(yù)處理的基本步驟,包括數(shù)據(jù)集成(不同數(shù)據(jù)源的整合)、數(shù)據(jù)探索、數(shù)據(jù)變換(標(biāo) 準(zhǔn)化)、數(shù)據(jù)歸約(維度歸約技術(shù)、數(shù)值歸約技術(shù)),這部分內(nèi)容不需要涉及計(jì)算,只需要根 據(jù)需求明確可選的處理技術(shù)即可。
【應(yīng)用】
數(shù)據(jù)清洗,包括填補(bǔ)遺漏的數(shù)據(jù)值(根據(jù)業(yè)務(wù)場(chǎng)景使用常數(shù)、中位數(shù)、眾數(shù)等方法,不 涉及多重查補(bǔ)的方法)、平滑有噪聲數(shù)據(jù)(移動(dòng)平均)、識(shí)別或除去異常值(單變量根據(jù)中心 標(biāo)準(zhǔn)化值,多變量使用快速聚類),以及解決不一致問題(熟知概念即可),查重(只考核 SQL 的語句,不涉及 R、SAS 等其它語言)。