數(shù)據(jù)系統(tǒng)工程師崗位職責:應(yīng)負責大數(shù)據(jù)系統(tǒng)/平臺的運行和維護等工作。
數(shù)據(jù)系統(tǒng)工程師初級能力要求具體如下:
a) 專業(yè)知識:
1) 運維基礎(chǔ)知識:
2) 硬件設(shè)備功能知識,
3) 服務(wù)器組網(wǎng)知識,
4) 服務(wù)器配置知識,
5) 操作系統(tǒng)安裝知識,
6) 云計算及虛擬化部署知識,
7) Linux 系統(tǒng)基礎(chǔ)操作知識,
8) 大數(shù)據(jù)組件安裝知識,
9) 大數(shù)據(jù)集群配置知識,
10) 大數(shù)據(jù)組件基礎(chǔ)操作知識,
11) 應(yīng)用變更管理知識,
12) 代碼倉庫托管知識,
13) 功能持續(xù)集成知識,
14) 代碼版本控制知識,
15) 管理平臺操作知識,
16) 系統(tǒng)環(huán)境監(jiān)控知識,
17) 常見故障排查知識,
18) 容災(zāi)備份知識。
b) 專業(yè)技能:
1) 能根據(jù)施工方案,進行需求溝通并確認設(shè)備參數(shù);
2) 能參照施工方案,對大數(shù)據(jù)機架及大型設(shè)備進行機房空間規(guī)劃并部署服務(wù)器;
3) 能根據(jù)組網(wǎng)規(guī)劃方案,對各服務(wù)器或需聯(lián)通網(wǎng)絡(luò)設(shè)備進行組網(wǎng)布置;
4) 能根據(jù)現(xiàn)場設(shè)施及電力系統(tǒng),對設(shè)備進行上電測試及點亮測試;
5) 能根據(jù)系統(tǒng)部署方案,安裝集群環(huán)境、硬件環(huán)境、虛擬化環(huán)境所需的各類系統(tǒng);
6) 能根據(jù)軟件部署方案使用腳本部署產(chǎn)品或用原生方法安裝各類大數(shù)據(jù)功能組件;
7) 能根據(jù)節(jié)點連接信息配置大數(shù)據(jù)集群;
8) 能根據(jù)集群功能對組件進行啟動調(diào)試;
9) 能對現(xiàn)有大數(shù)據(jù)集群的各類組件進行應(yīng)用變更或版本更迭;
10) 能根據(jù)上線計劃,按時完成功能上線;
11) 能對提交代碼的版本進行管理;
12) 能使用工具對集群的軟硬件運行狀態(tài)進行監(jiān)控管理;
13) 能使用工具對大數(shù)據(jù)集群的各類組件、服務(wù)的運行狀態(tài)進行監(jiān)控管理;
14) 能使用工具對作業(yè)運行情況和資源占用進行監(jiān)控管理;
15) 能根據(jù)故障報告,參與故障排查,處理故障問題;
16) 能根據(jù)容災(zāi)計劃,定期備份和遷移關(guān)鍵數(shù)據(jù)。
c) 經(jīng)驗:
1) 累計從事本崗位工作 1 年以上。
數(shù)據(jù)系統(tǒng)工程師中級能力要求具體如下:
a) 專業(yè)知識:
1) 網(wǎng)絡(luò)架構(gòu)和規(guī)劃,
2) 服務(wù)器底層配置知識,
3) 云計算及虛擬化知識,
4) 自動化腳本開發(fā)知識,
5) 集群配置知識,
6) 高可用及容災(zāi)知識,
7) 集群技術(shù)知識,
8) 安全訪問控制知識,
9) 性能調(diào)優(yōu)知識,
10) 故障排查知識,
11) 容災(zāi)管理知識。
b) 專業(yè)技能:
1) 能根據(jù)配置需求,規(guī)劃及選型硬件配置設(shè)施;
2) 能根據(jù)機房環(huán)境和配置清單,制定工程實施方案;
3) 能根據(jù)物理硬件特性,制定組網(wǎng)規(guī)劃方案;
4) 能根據(jù)硬件設(shè)備條件,進行底層及驅(qū)動配置;
5) 能根據(jù)現(xiàn)場施工情況進行故障處理指導(dǎo);
6) 能根據(jù)應(yīng)用需求,規(guī)劃系統(tǒng)部署方案;
7) 能根據(jù)性能需求,對各運行系統(tǒng)進行配置和調(diào)優(yōu);
8) 能根據(jù)軟件部署方案,編寫自動化部署腳本,并完成部署;
9) 能根據(jù)集群組件進行高可用及容災(zāi)配置;
10) 能根據(jù)集群功能對各組件進行聯(lián)通調(diào)試;
11) 能根據(jù)集群功能變更需求,制定組件升級及功能遷移方案;
12) 能對上線功能進行測試,評估上線可行性,制定上線計劃;
13) 能對大數(shù)據(jù)平臺中的各個組件使用權(quán)限進行管理;
14) 能編寫腳本對集群軟硬件、組件與服務(wù)、作業(yè)運行情況進行監(jiān)控及管理操作;
15) 能對集群的運行性能、讀寫性能等指標進行調(diào)優(yōu);
16) 能根據(jù)故障報告,排查故障原因,處理故障問題,并編寫自動化運維腳本;
17) 能制定容災(zāi)計劃,對異常服務(wù)進行故障轉(zhuǎn)移。
c) 經(jīng)驗:
1) 具備一定的數(shù)據(jù)運維相關(guān)項目經(jīng)驗;
2) 累計從事本崗位工作 3 年以上。
數(shù)據(jù)系統(tǒng)工程師高級能力要求具體如下:
a) 專業(yè)知識:
1) 安全施工規(guī)范,
2) 硬件產(chǎn)品知識,
3) 故障管理知識,
4) 權(quán)限安全規(guī)范,
5) 軟件產(chǎn)品知識,
6) 聯(lián)邦集群知識,
7) 異地多活知識,
8) 風險管理知識,
9) 應(yīng)用變更知識,
10) 代碼管理知識,
11) 權(quán)限管理知識,
12) 性能指標知識,
13) 負載均衡知識,
14) 故障分析方法,
15) 故障轉(zhuǎn)移知識。
b) 專業(yè)技能:
1) 能根據(jù)安全施工規(guī)范,整體規(guī)劃硬件設(shè)施安全方案;
2) 能審核及指導(dǎo)工程師規(guī)劃和選型硬件配置設(shè)施;
3) 能根據(jù)產(chǎn)品特性,制定統(tǒng)一施工標準;
4) 能根據(jù)系統(tǒng)部署方案,與產(chǎn)品開發(fā)部門整體規(guī)劃硬件承載、配置及擴展方案;
5) 能根據(jù)不同硬件設(shè)施,制定故障處理規(guī)范及流程;
6) 能根據(jù)權(quán)限安全規(guī)范,制定軟件權(quán)限安全方案;
7) 能審核并指導(dǎo)工程師制定系統(tǒng)及軟件部署方案;
8) 能根據(jù)產(chǎn)品特性,制定部署及升級策略;
9) 能根據(jù)集群組件特性制定高可用及容災(zāi)策略;
10) 能根據(jù)調(diào)試結(jié)果,制定部署優(yōu)化方案;
11) 能評估應(yīng)用變更風險,發(fā)布應(yīng)用變更計劃,管控變更流程,總結(jié)變更報告;
12) 能根據(jù)軟件部署方式,制定各類組件應(yīng)用變更或版本更迭方案;
13) 能制定代碼管理規(guī)范并配置代碼倉庫管理系統(tǒng);
14) 能制定各部門平臺功能使用權(quán)限規(guī)范;
15) 能規(guī)劃監(jiān)控指標,制定監(jiān)控管理規(guī)范;
16) 能開發(fā)監(jiān)控腳本,并規(guī)劃閾值;
17) 能對系統(tǒng)性能進行調(diào)優(yōu);
18) 能使用數(shù)據(jù)挖掘方法挖掘潛在故障;
19) 能對故障事故進行復(fù)盤,編寫故障預(yù)防規(guī)范;
20) 能定期組織容災(zāi)演練。
c) 經(jīng)驗:
1) 具備數(shù)據(jù)運維相關(guān)項目經(jīng)驗;
2) 累計從事本崗位工作 5 年以上。