2)數(shù)據(jù)存儲(chǔ)
數(shù)據(jù)存儲(chǔ)階段是將數(shù)據(jù)持久地保存在大數(shù)據(jù)平臺(tái)中,存儲(chǔ)的數(shù)據(jù)包括采集的數(shù)據(jù)以及分析的數(shù)據(jù)等。存儲(chǔ)系統(tǒng)應(yīng)支持對(duì)不同數(shù)據(jù)類型和格式的數(shù)據(jù)存儲(chǔ),并且需要提供多種數(shù)據(jù)訪問接口,如文件系統(tǒng)接口、數(shù)據(jù)庫接口等。存儲(chǔ)活動(dòng)的主要操作包括數(shù)據(jù)編解碼、數(shù)據(jù)加解密、數(shù)據(jù)持久存儲(chǔ)、數(shù)據(jù)備份、數(shù)據(jù)更新和數(shù)據(jù)訪問等。
在數(shù)據(jù)存儲(chǔ)階段涉及到的安全問題有:存儲(chǔ)架構(gòu)安全、邏輯存儲(chǔ)安全、存儲(chǔ)訪問安全、 數(shù)據(jù)副本安全、數(shù)據(jù)歸檔安全等。
3)數(shù)據(jù)使用
數(shù)據(jù)使用活動(dòng)包括利用數(shù)據(jù)預(yù)處理、數(shù)據(jù)分析和數(shù)據(jù)可視化等技術(shù)從原始數(shù)據(jù)中提取有價(jià)值信息,支撐組織作出合理決策等操作。使用活動(dòng)的主要操作包括數(shù)據(jù)查詢、讀取、索引、批處理、交互式處理、流處理、數(shù)據(jù)統(tǒng)計(jì)分析、預(yù)測分析、關(guān)聯(lián)分析、可視化以及分析報(bào)告生成等。
在數(shù)據(jù)使用階段涉及到的安全問題有:分布式處理安全、數(shù)據(jù)分析安全、數(shù)據(jù)加密處理、數(shù)據(jù)脫敏處理以及數(shù)據(jù)溯源等。
4)數(shù)據(jù)分發(fā)
數(shù)據(jù)分發(fā)活動(dòng)是將原始數(shù)據(jù)、處理后數(shù)據(jù)以及分析后數(shù)據(jù)等不同形式的數(shù)據(jù)傳遞給外部實(shí)體或組織內(nèi)部的其他部門。數(shù)據(jù)分發(fā)階段主要操作有數(shù)據(jù)傳輸、數(shù)據(jù)交換、數(shù)據(jù)交易、數(shù)據(jù)共享等。
在數(shù)據(jù)使用階段涉及到的安全問題有:數(shù)據(jù)傳輸安全、數(shù)據(jù)訪問控制、數(shù)據(jù)脫敏處理等。
5)數(shù)據(jù)刪除
數(shù)據(jù)刪除是指刪除大數(shù)據(jù)平臺(tái)或租用的第三方大數(shù)據(jù)存儲(chǔ)平臺(tái)上的數(shù)據(jù)及其副本。若數(shù)據(jù)來自于外部實(shí)時(shí)數(shù)據(jù)流,還應(yīng)斷開與實(shí)時(shí)數(shù)據(jù)流的連接。數(shù)據(jù)刪除階段主要操作包括刪除元數(shù)據(jù)、原始數(shù)據(jù)及副本,斷開與外部實(shí)時(shí)數(shù)據(jù)流的鏈接等操作。