新聞動(dòng)態(tài)

了解最新新聞動(dòng)態(tài)和行業(yè)資訊

數(shù)據(jù)管理挑戰(zhàn)不斷升級(jí),數(shù)據(jù)平臺(tái)高舉開(kāi)放旗幟

(一)數(shù)據(jù)管理挑戰(zhàn)正在不斷升級(jí)


  10 年前,數(shù)據(jù)庫(kù)管理員(DBA)主要關(guān)心的問(wèn)題是如何優(yōu)化其數(shù)據(jù)庫(kù)管理系統(tǒng)的性能。而今天,DBA們開(kāi)始注重如何實(shí)施高效的數(shù)據(jù)庫(kù)管理。因?yàn)橐坏┕芾韱T可以自動(dòng)化任務(wù)、標(biāo)準(zhǔn)化數(shù)據(jù)格式,制定維護(hù)流程,數(shù)據(jù)庫(kù)能夠自行履行其存儲(chǔ)和檢索數(shù)據(jù)的職責(zé)。

      
        同時(shí),隨著Web 2.0 和其它技術(shù)的發(fā)展與應(yīng)用,數(shù)據(jù)庫(kù)需要處理的數(shù)據(jù)量也在急速增加,其中包括視頻、音頻文件等大容量數(shù)據(jù),而且數(shù)據(jù)已經(jīng)滲透到了日常業(yè)務(wù)運(yùn)營(yíng)的方方面面。因此,今天的DBA們實(shí)際上面臨比10年前更加復(fù)雜的情形與挑戰(zhàn),主要集中在以下幾點(diǎn):


  一是數(shù)據(jù)量飛速增加。由于最近幾年來(lái)數(shù)據(jù)更新速度日益增加,各種新技術(shù)層出不窮,以及數(shù)據(jù)使用方式不斷推陳出新,企業(yè)生成的數(shù)據(jù)量也逐漸呈井噴之勢(shì)?,F(xiàn)在,各大企業(yè)都已經(jīng)采用ERP、CRM等解決方案,因此每天都會(huì)產(chǎn)生大量數(shù)據(jù)。


  二是數(shù)據(jù)關(guān)聯(lián)性增加。新技術(shù)為我們使用數(shù)據(jù)的方式開(kāi)創(chuàng)了更多可能性。在日常業(yè)務(wù)運(yùn)營(yíng)中,從電子商務(wù)網(wǎng)站到庫(kù)存管理,都需要借助數(shù)據(jù)和數(shù)據(jù)庫(kù)管理系統(tǒng)的能力,來(lái)將數(shù)據(jù)迅速傳遞給需要它的應(yīng)用。


  三是服務(wù)器數(shù)量激增帶動(dòng)成本上升。由于順應(yīng)業(yè)務(wù)增長(zhǎng)部署了更多物理服務(wù)器,而服務(wù)器CPU等資源的利用率卻出現(xiàn)大幅下降,從而導(dǎo)致企業(yè)每年都需要從 IT 預(yù)算中支出大量的管理、維護(hù)和散熱成本,使得IT預(yù)算不斷緊縮的企業(yè)面臨更大的壓力。


  四是數(shù)據(jù)挖掘與分析處理的壓力加大。如果這些數(shù)據(jù)不能被實(shí)時(shí)、有效地加以利用,形成對(duì)實(shí)際業(yè)務(wù)決策有用的信息,數(shù)據(jù)增長(zhǎng)反過(guò)來(lái)會(huì)帶來(lái)負(fù)面影響。

(二)挑戰(zhàn)驅(qū)動(dòng)創(chuàng)新


  上述挑戰(zhàn)一方面給企業(yè)帶來(lái)現(xiàn)實(shí)壓力,但另一方面也帶來(lái)了創(chuàng)新機(jī)會(huì)。那么,面向ERP、CRM等關(guān)鍵業(yè)務(wù)的數(shù)據(jù)密集型工作負(fù)載,需要什么樣的軟硬件數(shù)據(jù)管理平臺(tái)呢?筆者認(rèn)為,至少需要滿足以下幾個(gè)方面的要求:


  一是可擴(kuò)展的處理能力。為管理數(shù)據(jù)密集型工作負(fù)載,將海量原始數(shù)據(jù)轉(zhuǎn)化成有用的信息,并提供實(shí)時(shí)分析和查詢服務(wù),需要有非常強(qiáng)大的系統(tǒng)處理能力做支撐,以優(yōu)化復(fù)雜多線程的應(yīng)用性能。


  二是出色的可靠性。由于某個(gè)數(shù)據(jù)庫(kù)出現(xiàn)故障所產(chǎn)生的負(fù)面效應(yīng)可能會(huì)波及整個(gè)企業(yè),影響重大,因此需要平臺(tái)能確保7*24小時(shí)不間斷提供服務(wù)。


  三是靈活的虛擬化性能。為減少物理服務(wù)器的數(shù)量,提高IT的靈活性,通過(guò)虛擬化實(shí)現(xiàn)整合的能力已經(jīng)成為標(biāo)配,同時(shí)還需要通過(guò)虛擬機(jī)實(shí)時(shí)遷移、災(zāi)備等功能來(lái)提高可用性。


  四是成本節(jié)省。對(duì)于許多處在激烈競(jìng)爭(zhēng)市場(chǎng)環(huán)境,IT預(yù)算緊縮的企業(yè)而言,降低包括硬件采購(gòu)、軟件許可證、管理維護(hù)、能耗等方面的成本一直是企業(yè)追求的目標(biāo)。


  (三)基于行業(yè)標(biāo)準(zhǔn)的開(kāi)放數(shù)據(jù)管理平臺(tái)


  2010年,微軟推出了這樣一款全新數(shù)據(jù)管理平臺(tái):在英特爾至強(qiáng)7500服務(wù)器上部署SQL Server 2008 R2所提供的托管型自助式 BI解決方案,可以針對(duì)超大型數(shù)據(jù)集近乎實(shí)時(shí)地分析和查詢復(fù)雜數(shù)據(jù)。


  據(jù)了解,使用微軟自助式BI方案,最終用戶可以利用面向 Excel 的 PowerPivot插件等自助式分析工具,迅速查找到所需信息,進(jìn)行特定分析和建模,幫助用戶近乎實(shí)時(shí)地在大型數(shù)據(jù)集上執(zhí)行復(fù)雜運(yùn)算,從而獲得有用信息,做出更好的業(yè)務(wù)決策。管理員也同樣可以借助SQL Server 2008 R2的StreamInsight技術(shù),在不到一秒內(nèi)橫跨多條數(shù)據(jù)流處理大量事件,幫助企業(yè)通過(guò)歷史數(shù)據(jù)挖掘和持續(xù)了解動(dòng)態(tài)數(shù)據(jù),更迅速地識(shí)別和響應(yīng)新趨勢(shì)。


  因此,這種方案對(duì)事務(wù)處理能力提出非常高的要求,而基于至強(qiáng)7500的服務(wù)器可以擴(kuò)展至8個(gè)以上處理器,每個(gè)處理器可容納8個(gè)內(nèi)核,支持 16 條線程,而且還有1-2TB超大內(nèi)存容量,大大降低延遲,提高數(shù)據(jù)庫(kù)性能和 SQL Server2008 R2 的能力。


  當(dāng)然,數(shù)據(jù)密集型工作負(fù)載,對(duì)于系統(tǒng)的可擴(kuò)展性要求也很高。比如現(xiàn)在的SQL Server 2008 R2可以支持多達(dá)256 顆邏輯處理器(原來(lái)是64顆處理器)和超過(guò) 64 條線程,用戶還可通過(guò) SQL Server 2008 R2將數(shù)據(jù)倉(cāng)庫(kù)容量從數(shù)十萬(wàn)億字節(jié)到數(shù)百萬(wàn)億字節(jié)。對(duì)此,至強(qiáng)7500和至強(qiáng)E7也提供了相應(yīng)的擴(kuò)展性,在單一系統(tǒng)內(nèi),最大可以支持到256顆CPU,從而能夠支持到最苛刻的數(shù)據(jù)密集型應(yīng)用。


  在可靠性上,至強(qiáng)7500 系列的服務(wù)器具備 20多項(xiàng)全新 RAS 特性,這些特性包括處理器間動(dòng)態(tài)工作負(fù)載分配、互聯(lián)錯(cuò)誤檢測(cè)和恢復(fù),以及虛擬環(huán)境中的單個(gè)虛擬機(jī)恢復(fù)等。比如,Windows Server 2008 R2 具備的Windows 硬件錯(cuò)誤體系結(jié)構(gòu)(WHEA)支持至強(qiáng)7500中的機(jī)器校驗(yàn)架構(gòu)恢復(fù)(MCA)特性,可幫助平臺(tái)在不中斷操作系統(tǒng)應(yīng)用的情況下,控制和恢復(fù)內(nèi)存與高速緩存中的多位 ECC 錯(cuò)誤——以前只有成本高昂的 RISC/UNIX 平臺(tái)和大型機(jī)才具備這些功能。


        在TCO方面,X86服務(wù)器的硬件采購(gòu)成本往往只有小型機(jī)的幾分之一,但更重要的是,使用開(kāi)放平臺(tái),有助于節(jié)省大量軟件支持和許可成本。由于基于 UNIX 的軟件通常按處理器內(nèi)核數(shù)量而并非按插座數(shù)量計(jì)價(jià),因此可節(jié)省成倍的成本。此外,由于微軟不額外收取在線分析處理(OLAP)、數(shù)據(jù)挖掘、數(shù)據(jù)壓縮、分區(qū)及其它特性的相關(guān)費(fèi)用,因此相比Oracle等其他平臺(tái),在Windows Server 2008 R2 上運(yùn)行 SQL Server 2008 R2的成本也更低。


       另外,值得一提的是,SQL Server 2008 R2 已經(jīng)支持 Hyper-V 實(shí)時(shí)遷移,允許用戶在確保不停機(jī)的情況下在主機(jī)之間轉(zhuǎn)移正在運(yùn)行中的虛擬機(jī)。SQL Server 2008 R2還支持Sysprep,這樣一來(lái),管理員可以更輕松地創(chuàng)建 SQL Server 圖像,隨時(shí)隨地迅速將它們部署在虛擬機(jī)中。對(duì)此,企業(yè)可以通過(guò)至強(qiáng)7500,以20:1的整合比率更換和整合過(guò)去的單核服務(wù)器,并可在1年內(nèi)通過(guò)能耗、軟件、許可證和維護(hù)成本的節(jié)省收回服務(wù)器更新帶來(lái)的投資。


 (四)小結(jié):走向開(kāi)放


  數(shù)據(jù)管理不再是存儲(chǔ)-檢索的過(guò)程,隨著技術(shù)應(yīng)用的發(fā)展,以至強(qiáng)為核心的X86服務(wù)器,以及微軟SQL Server數(shù)據(jù)庫(kù)軟件也在不斷改進(jìn)企業(yè)處理大規(guī)模數(shù)據(jù)的方式——對(duì)海量數(shù)據(jù)進(jìn)行實(shí)時(shí)分析,并向企業(yè)各級(jí)用戶快速提供有用的信息。比如中國(guó)人壽業(yè)務(wù)決策平臺(tái)正是如此,將分散在公司各處的海量數(shù)據(jù)快速整合在 SQL Server 2008 R2 數(shù)據(jù)倉(cāng)庫(kù)內(nèi),然后提供決策分析時(shí)隨時(shí)調(diào)用。


  以往,專用的數(shù)據(jù)平臺(tái)通常都是基于 RISC 或 SPARC 架構(gòu)而構(gòu)建,上面跑基于UNIX 的軟件,此類平臺(tái)不僅購(gòu)買成本高,在申請(qǐng)?jiān)S可證、實(shí)施維護(hù)和培訓(xùn)方面的成本也較高。對(duì)于注重創(chuàng)新和成本效率的企業(yè)來(lái)說(shuō),今天開(kāi)放的數(shù)據(jù)平臺(tái)提供了新的選擇。但這也意味著使用專有平臺(tái)的企業(yè)需要做好遷移工作——將小型機(jī)換成X86服務(wù)器,將UNIX操作系統(tǒng)換成Linux或Windows,將應(yīng)用和數(shù)據(jù)從原有系統(tǒng)遷移到新的系統(tǒng)中來(lái)。