4.5 知識(shí)子域:大數(shù)據(jù)安全
4.5.1 大數(shù)據(jù)基本概念
1.大數(shù)據(jù)的定義
對(duì)于大數(shù)據(jù)的概念,業(yè)界尚未給出統(tǒng)一的定義。201 1年,美國著名的咨詢公司麥肯錫( Mckin。ey)在研究報(bào)告《大數(shù)據(jù)的下一個(gè)前沿:創(chuàng)新、競爭和生產(chǎn)力》中給出了大數(shù)據(jù)的定義:大數(shù)據(jù)是指大小超出常規(guī)數(shù)據(jù)庫軟件工具收集、存儲(chǔ)、管理和分析臺(tái)旨力的數(shù)據(jù)集。根據(jù)Gartner的定義,大數(shù)據(jù)是需要新處理模式才能具有更強(qiáng)的決策力、洞察發(fā)現(xiàn)力和流程優(yōu)化能力的海量、高增長率和多樣化的信息資產(chǎn)。
美國國家標(biāo)準(zhǔn)技術(shù)研究所( National Institute of Standards and Technology,NIST)的大數(shù)據(jù)工作組在《大數(shù)據(jù):定義和分類》中指出:大數(shù)據(jù)是指傳統(tǒng)數(shù)據(jù)架構(gòu)無法有效處理的新數(shù)據(jù)集。針對(duì)這些數(shù)據(jù)集,需要采用新的架構(gòu)來高效率地完成數(shù)據(jù)處理。
維基百科( Wikipedia)中,大數(shù)據(jù)則被定義為巨量數(shù)據(jù),也稱海量數(shù)據(jù)或大資料,是指所涉及的數(shù)據(jù)量規(guī)模巨大到無法人為的在合理時(shí)間內(nèi)達(dá)到截取、管理、處理、并整理成為人類所能解讀的信息。
全球最大電子商務(wù)公司亞馬遜的大數(shù)據(jù)科學(xué)家John Rauser給出了一個(gè)簡單的定義:大數(shù)據(jù)是指任何超過了一臺(tái)計(jì)算機(jī)處理臺(tái)旨力的數(shù)據(jù)量。
而EMC公司給出的定義為數(shù)據(jù)集或信息,其中它的規(guī)模、發(fā)布、位置在不同的孤島上,或它的時(shí)間線要求客戶部署新的架構(gòu)來捕捉、存儲(chǔ)、整合、管理和分析,以便實(shí)現(xiàn)企業(yè)價(jià)值。
目前國內(nèi)普遍將大數(shù)據(jù)解釋為具有數(shù)量巨大、來源多樣、生成極快、且多變等特征并且難以用傳統(tǒng)數(shù)據(jù)體系結(jié)構(gòu)有效處理的包含大量數(shù)據(jù)集的數(shù)據(jù)。