讀古今文學網 > OpenStack系統架構設計實戰 > 9.1.3 Sahara的主要特點 >

9.1.3 Sahara的主要特點

1)因契合大數據與雲計算融合的發展趨勢而備受關注。

雲計算和大數據目前都屬於IT領域中最受矚目的方向,二者的結合更是吸引眼球的話題。Sahara作為一個開源的大數據與雲計算的融合方案,必然也備受關注。

OpenStack和Hadoop的融合,既最大限度地提高了服務器的資源利用率,又大大降低了大數據處理的准入門檻。可以預見,作為雲計算和大數據的橋樑之一,Sahara將會推動OpenStack雲平台和Hadoop的整合,逐步進入大數據處理市場,借助雲計算平台和大數據處理技術,更快速地把數據轉換為商業價值。

2)遵循了OpenStack體系開放靈活、避免重複設計的基本設計思想。

Sahara充分繼承了OpenStack體系的「模塊化」、「可配置」設計思想,保證了Sahara的使用靈活性與可擴展性。通過開放靈活的架構設計,Sahara大量功能和機制都基於可選擇、可配置的模塊化插件實現。例如,通過對Engine的配置,Sahara可以支持不同的集群編配機制,既可以使用Sahara自有的direct-engine,也可以使用Heat。利用plug-in機制,Sahara可以方便地支持不同的Hadoop/Spark版本、部署方式和工具(本文暫不考慮Spark等,下同)。

同時,作為在OpenStack上原生開發出來的PaaS層組件,Sahara盡可能地重用了OpenStack自身提供的IaaS層組件及其服務,充分避免重複設計實現相關特性。例如,利用Nova實現虛擬機群的配置啟動,利用Heat實現編配服務,集成Ceilometer提供監控能力,在Horinzon中擴展人機界面等。這種設計思想一方面符合開源項目設計中「不重複發明輪子」「站在巨人肩膀上」的原則,另一方面也和AWS EMR的思路相一致。這應該也是Sahara能夠快速發展成熟的重要原因之一。

3)提供了簡捷的BDaaS解決方案。

儘管Sahara目前尚缺少實際大規模應用的檢驗,但已經具備了BDaaS基本功能。同時,作為OpenStack中的一個組件,Sahara的安裝和應用非常簡便。在熟悉OpenStack之後,接受Sahara幾乎沒有太高的技術門檻。

4)為在OpenStack上的開發應用提供了實例。

在雲計算的場景下,如何在雲操作系統上開發應用,如何利用操作系統的資源抽像和管理能力為最終的用戶服務,一直是比較有挑戰的待探索話題。AWS的生態圈在這方面略勝一籌。

Sahara提供了一個整合利用各種雲操作系統模塊資源(各種雲服務)對重要應用(Hadoop)進行雲化的實例,這對推動OpenStack,乃至雲計算走向實用、迅速落地有著舉足輕重的意義。

5)獲得了大部分OpenStack關鍵廠商的支持與推動。

Mirantis、RedHat和Hortonworks三家企業的大力參與,以及Intel、IBM、HP、SUSE等業界大公司的陸續支持和投入,讓Sahara的發展不容小覷。

此外,根據社區規則,兩個項目之間不能出現所涉及範疇重疊。因此Sahara作為OpenStack社區唯一BDaaS模塊的地位不可動搖。

6)Sahara面臨著一些挑戰。

·Sahara的管理平面性能存在問題,創建和發佈集群的等待時間有待測試。

·在複雜管理的成功率方面,目前Sahara中沒有看到明確的處理機制,這是一個缺失。

·Sahara搭建的Hadoop在虛擬化環境下的性能有待優化。

·Auto-scaling缺失。目前Sahara要擴展需要人工執行。

·Sahara最大的亮點在EDP,其價值有待進一步挖掘。