9.1 Sahara概述
9.1.1 Sahara的定位
The Sahara project provides a simple means to provision a data-intensive application cluster(Hadoop or Spark)on top of OpenStack。
這是WiKi百科上關於Sahara的第一句話,由此可見,Sahara的基本定位是基於OpenStack提供簡單的Hadoop或Spark集群管理方式。目前,伴隨著項目的不斷演進,Sahara所涵蓋的範疇也有所擴大。
從服務能力看,Sahara已經開始從利用OpenStack的IaaS能力、提供簡單的大數據工具集群創建和管理服務,擴展到提供分析即服務(Analytic-as-a-Service)層面的大數據業務應用能力。Sahara v0.3中引入的EDP(Elastic Data Processing)就是一個明確的體現。
從承載業務類型看,Sahara也從單一Hadoop工具範疇,拓展到支持Spark等其他新興大數據工具。
因此,整體而言,Sahara的定位是成為OpenStack上唯一的BigData-as-a-Service服務模塊,整合利用OpenStack自身的各個模塊和服務,向用戶提供簡單、便捷的大數據業務能力。