讀古今文學網 > OpenStack系統架構設計實戰 > 第9章 OpenStack大數據服務(Sahara) >

第9章 OpenStack大數據服務(Sahara)

9.1 Sahara概述

9.1.1 Sahara的定位

The Sahara project provides a simple means to provision a data-intensive application cluster(Hadoop or Spark)on top of OpenStack。

這是WiKi百科上關於Sahara的第一句話,由此可見,Sahara的基本定位是基於OpenStack提供簡單的Hadoop或Spark集群管理方式。目前,伴隨著項目的不斷演進,Sahara所涵蓋的範疇也有所擴大。

從服務能力看,Sahara已經開始從利用OpenStack的IaaS能力、提供簡單的大數據工具集群創建和管理服務,擴展到提供分析即服務(Analytic-as-a-Service)層面的大數據業務應用能力。Sahara v0.3中引入的EDP(Elastic Data Processing)就是一個明確的體現。

從承載業務類型看,Sahara也從單一Hadoop工具範疇,拓展到支持Spark等其他新興大數據工具。

因此,整體而言,Sahara的定位是成為OpenStack上唯一的BigData-as-a-Service服務模塊,整合利用OpenStack自身的各個模塊和服務,向用戶提供簡單、便捷的大數據業務能力。