亚洲欧美成人中文在线网站,国产亚洲情侣一区二区无,欧美污网站,国产成人综合怡春院精品,欧美日韩国产综合一区二区三区,成人亚洲国产综合精品91,国产成人自拍视频在线观看

 首頁 > 新聞 > 專家觀點 >

大數(shù)據熱背后的冷思考

2012-11-22 09:59:31   作者:吳勇毅   來源:CCW    評論:0  點擊:


  繼云計算、社交網絡之后,如今大數(shù)據(Big Data)風起云涌,已成為2012 年信息技術領域最時髦的詞匯之一。而相比大數(shù)據的興起,以前以商業(yè)智能分析而著稱的BI開發(fā)商卻頗為失落。有人大膽預測,未來10年,與大數(shù)據相關的商務智能分析將引領管理信息化的發(fā)展。

  大數(shù)據

  真的那么必須?

  通常所說的大數(shù)據是具有3種特性的數(shù)據,即大數(shù)據量(Volume)、高生成速度(Velocity)和多數(shù)據類型(Variety)。大數(shù)據量指的是數(shù)據海量,如今有許多企業(yè)已經面臨單日數(shù)據量以數(shù)十、數(shù)百TB的速度增加,而總數(shù)據量也達到了PB(Petabyte)等級,這樣的數(shù)據量已讓傳統(tǒng)的數(shù)據庫難以處理;高生成速度是指企業(yè)數(shù)據增加的速度越來越快,諸如移動化、社交網絡的廣泛應用,使得數(shù)據增加的速度比傳統(tǒng)的企業(yè)應用程序要快很多,一旦數(shù)據增生速度加快,數(shù)據處理、分析的速度也得跟上;多數(shù)據類型是指數(shù)據的多樣性,時下人們上互聯(lián)網不只是看看資訊,同時也在不斷地產出數(shù)據:上傳照片、上傳視頻、發(fā)微博;另一方面,IT深入工作生活中的各個角落,各種各樣的傳感器、監(jiān)控器也時刻不斷產生各種數(shù)據,數(shù)據的形式已日趨復雜、多樣了。這就催生了大數(shù)據技術的強烈需求。

  雖然如何解決日漸緊迫的大數(shù)據處理已成了企業(yè)管理信息化、現(xiàn)代化的必然需求,但國內的大數(shù)據領域到底有多活躍?大數(shù)據真的如一些廠商所描繪的那么強大、好用,成為每個企業(yè)所必需的嗎?

  在一片叫好聲中,部分專家和業(yè)內人士顯得小心謹慎,甚至不乏非議。一些專家認為,除了大量的研討會和各類公司宣稱進軍大數(shù)據領域的雄心之外,其實際進展至今難見成效。許多企業(yè)CIO認為,國內能利用大數(shù)據背后的價值的行業(yè)主要集中在金融、電信、能源、證券、煙草等超大型、壟斷型企業(yè),其他行業(yè)談大數(shù)據為時尚早,大數(shù)據在企業(yè)的應用并不是說只要開放了數(shù)據、應用一些技術就可以輕易地發(fā)現(xiàn)“金礦”。目前國內大數(shù)據應用似乎正在呈現(xiàn)這樣的狀態(tài):投資人活躍,技術和服務供應商熱心,媒體高調,而大量應用企業(yè)迷惑。

  有人更是批評“大數(shù)據是在既有的方案上包裝了一下,實質是新瓶裝舊酒,只不過更時髦”,海量數(shù)據時代的數(shù)據應用并沒有給多少企業(yè)帶來革命性的變化,在 MapReduce(Hadoop中采用的編程模型,用于大規(guī)模數(shù)據集的并行運算)出現(xiàn)之前,也有企業(yè)能夠輕松地對數(shù)據進行大規(guī)模并行計算了,而 NoSQL 的出現(xiàn)也只是為處理數(shù)據的方式帶來了更多選擇罷了,并沒有革命性、實質性的飛躍。比如,某廠商說,利用其大數(shù)據技術,電子商務網站就能知道“什么地方的人買東西最瘋狂”或是“什么型號手機最好賣”,這就是大數(shù)據分析的結果。對此有專家反駁“難道同樣基于數(shù)據倉庫系統(tǒng)的BI分析出來的結果和基于這個大數(shù)據出來的結果會有不同?”

  的確,從某些大數(shù)據應用中能挖掘出新的價值,但這個價值只是附加價值,沒有理由去夸大它,更沒有理由去無端地想象。大數(shù)據是機會,但現(xiàn)階段還只是少數(shù)人的機會,更多的是巨頭們的商業(yè)謀略。”廈門一位電子公司CIO也認為,“一些企業(yè)所需要的數(shù)據挖掘,傳統(tǒng)列式數(shù)據就能很好地處理。與其參加各種口沫橫飛的會議,還不如和工程師聊聊可以運用什么更實用的工具來解決具體問題。”

  大數(shù)據當立

  BI當下?

  讓大數(shù)據取代BI也是當下熱議的話題。實際上,大數(shù)據與BI之間的確存在著天然聯(lián)系,但并不是互相替代、排斥的關系。大數(shù)據與BI一個主要區(qū)別在于:與傳統(tǒng)基于事務的數(shù)據倉庫系統(tǒng)相比較,其能在BI的基礎上進行更大容量數(shù)據和非結構化數(shù)據處理,大數(shù)據分析不僅關注結構化的歷史數(shù)據,它們更傾向于去對Web、社交網絡、RFID傳感器等非結構化海量數(shù)據進行更好地分析。整體相比BI而言,大數(shù)據更寬泛。

  以EMC公司的 Greenplum核心產品線為例,它分為Greenplum Database(數(shù)據倉庫)、Greenplum HD(Hadoop分析)和Greenplum DCA(數(shù)據計算設備),后者還是基于高性價比的工業(yè)標準x86服務器的MPP(大規(guī)模并行處理)分布式可擴展架構。這三個產品歸于一個產品線也可以看出傳統(tǒng)BI和大數(shù)據之間的內在聯(lián)系。

  誠然,海量增長的非結構化、半結構化數(shù)據中確實有值得深入挖掘的價值,但這并不等于人們就要采用全新的方法、工具來處理它們。正如需求是漸進式的增長一樣,業(yè)務的變革也要以漸進式為主。

  筆者認為,大數(shù)據的創(chuàng)新性、先進性與前瞻性,不容否定,值得肯定,但當有人提出“大數(shù)據當立,BI當下”之論,就顯得過分武斷。在如今細分制勝的時代,功能并不是越多越好,功能過多反而顯得累贅,增加無謂費用。Gartner研究公司BI分析師RitaSallam曾表示,“大數(shù)據讓BI更有價值和更有利于業(yè)務發(fā)展。我們總是會需要看看過去的數(shù)據,當你擁有大數(shù)據時,你更應該這樣做。BI并不會被大數(shù)據取代消失,它的作用通過大數(shù)據被放大了。至少在相當長的時期內,大數(shù)據還難于取代傳統(tǒng)BI。”

  時至今日,各種關于大數(shù)據與BI軟件誰優(yōu)誰劣的交鋒仍不斷泛起,對用戶而言,必須認真權衡,到底利用大數(shù)據后能給企業(yè)帶來了多少額外的價值?這種增加的價值是否能讓企業(yè)的投入值得?而且更為重要的一點是,是否只要使用大數(shù)據就一定能夠給企業(yè)帶來以前不可能實現(xiàn)的價值?這些是當下用戶們最需要重點考慮的。

分享到: 收藏

專題