8.1 數(shù)據(jù)生命周期管理及意義
數(shù)據(jù)的生命周期管理最初是由美國的存儲(chǔ)技術(shù)公司StorageTek提出來的,經(jīng)過這些年的發(fā)展和宣傳,目前逐漸開始進(jìn)入市場化階段。數(shù)據(jù)的生命周期管理作為一項(xiàng)企業(yè)信息化戰(zhàn)略,是一項(xiàng)相對長期的工作。
早期銀行的金融產(chǎn)品較少,主要以存貸匯為主,而且數(shù)據(jù)以省(市)為單位分布存放,數(shù)據(jù)量相對較少。此外,由于還沒有數(shù)據(jù)集中挖掘與分析的需求,日常處理對象主要是短期數(shù)據(jù),時(shí)間跨度小,處理的數(shù)據(jù)規(guī)模相對可控。但是,隨著各家銀行的數(shù)據(jù)大集中以及業(yè)務(wù)的快速發(fā)展,客戶群體越來越大,客戶發(fā)生的交易行為也越來越頻繁,尤其是在大數(shù)據(jù)、互聯(lián)網(wǎng)金融時(shí)代,銀行業(yè)集中存放和處理的數(shù)據(jù)量急劇增加,有些銀行的數(shù)據(jù)容量甚至達(dá)到了PB級。有種說法是:“今天一個(gè)現(xiàn)代人一天所吸收的信息,比莎士比亞一生所獲得的信息還要多。”由此可見,當(dāng)今社會(huì)信息量是呈爆發(fā)式增長的。對銀行來說,一方面數(shù)據(jù)成為銀行的重要資產(chǎn),對于分析客戶行為、評價(jià)客戶信用、提升營銷精準(zhǔn)度等方面都起到了重要的作用;但是,另一方面日益增大的數(shù)據(jù)量對系統(tǒng)存儲(chǔ)、訪問效率造成越來越大的壓力。因此,必須權(quán)衡效率和需求之間的關(guān)系,合理保留數(shù)據(jù)。
正常情況下,數(shù)據(jù)生成時(shí)間越長,其獲得的訪問頻率則越低。但是,數(shù)據(jù)總量越來越大,如果將不活躍的數(shù)據(jù)進(jìn)行遷移,則可以降低企業(yè)的擁有成本。
數(shù)據(jù)生命周期中數(shù)據(jù)生成時(shí)間、數(shù)據(jù)訪問頻率、數(shù)據(jù)總量等參數(shù)間的關(guān)系如圖8-1所示。
倘若不對數(shù)據(jù)進(jìn)行有效的數(shù)據(jù)生命周期管理,則會(huì)出現(xiàn)系統(tǒng)問題。例如,數(shù)據(jù)增長過快導(dǎo)致的系統(tǒng)資源浪費(fèi);又如,表數(shù)據(jù)量過大導(dǎo)致訪問效率過慢等情況。以某商業(yè)銀行為例,早期因?yàn)闆]有進(jìn)行勢據(jù)生命周期管理,出現(xiàn)了各種問題,極大地影響了系統(tǒng)服務(wù)效率和客戶服務(wù)水平。從以下兩個(gè)例子可以看出數(shù)據(jù)生命周期管理的重要性。