Pentaho BI

Pentaho BI由一個BI 平台和傳送最終用戶BI 能力的庫組成的一個伺服器。提供企業級報表、多維分析、儀錶盤、數據挖掘和,幫助組織更加有效率的運營。

基本介紹

  • 中文名:Pentaho BI
  • 提供:企業級的報表、多維分析
  • 工作流功能:儀錶盤、數據挖掘等
  • 伺服器組件:BI 平台和傳送用戶BI 能力的庫
簡介,伺服器組件,平台,軟體層次結構,

簡介

Pentaho產品提供了方便的發布選項,使得它可以作為嵌入式的組件、自定義的BI套用方案以及一個完整的開箱即用的集成BI平台。

伺服器組件

伺服器運行於一個J2EE 兼容的web 伺服器(如Apache,JBOSS AS,WebSphere,WebLogic 和Oracle AS)上。Pentaho 伺服器使得BI 平台的很多功能以一種一致的,熟悉的外觀和行為展示給用戶。例如,一個組件產生了用戶可以訪問的報表列表,另一個以日曆的方式列出了任務相關的最終期限,第三個顯示了用戶需要完成的當前任務。每個組件產生的內容和每個用戶的角色相關。Pentaho 伺服器包含用於報表,分析,商業規則,email 和桌面通知以及工作流的引擎和組件。這些組件被集成在一起,用於解決商業智慧型問題。
在一個解決方案(Solution)中,每個子系統的行為,相互作用和用戶互動被解決方案(Solution)定義文檔的一個集合所定義。解決方案(Solution)定義文檔是XML 文檔,它包含:
業務流程的定義(XPDL標準)
活動的定義,這些活動按需作為部分流程執行,或被web 服務調用,其包含以下定義:
數據源,查詢,報表模板,傳送和通知規則,商業規則,儀錶盤和分析視圖。
以上所有的項之間的關係
伺服器中的組件依賴於一個解決方案(Solution)引擎,可獲得可用解決方案(Solution)
文檔,安全支持,報表,工作流項,數據,和審計信息。在伺服器上可以執行多於一個的解決方案(Solution)。解決方案(Solution)定義文檔可從一個伺服器複製到另一個,並可被自由分發。伺服器包含如下部分:
高級系統管理的基礎設施。這包括系統監控(SMNP)服務,使用報表,Web 服務支持,配置確認工具,和診斷工具。
高級流程性能報表和分析的系統和組件。這包括工作流任務上涉及到的工作流項目,單獨任務,employees 和services 上屬性的切片和切塊(slice-and-dice),what-if 和數據挖掘能力。
支持Enterprise Application Integration (EAI),用於和operational 套用live集成,以及Extract, Transform, and Load (ETL) 能力,用於創建數據倉庫和數據集市。

平台

Pentaho BI 平台不同於傳統的BI 產品,它是一個以流程為中心的,面向解決方案(Solution)的框架。其目的在於將一系列企業級BI產品、開源軟體、API等等組件集成起來,方便商務智慧型套用的開發。它的出現,使得一系列的面向商務智慧型的獨立產品如Jfree、Quartz等等,能夠集成在一起,構成一項項複雜的、完整的商務智慧型解決方案。
Pentaho BI 平台,Pentaho Open BI 套件的核心架構和基礎,是以流程為中心的,因為其中樞控制器是一個工作流引擎。工作流引擎使用流程定義來定義在BI 平台上執行的商業智慧型流程。流程可以很容易的被定製,也可以添加新的流程。BI 平台包含組件和報表,用以分析這些流程的性能。目前,Pentaho的主要組成元素包括報表生成、分析、數據挖掘和工作流管理等等。這些組件通過J2EE、WebService、SOAP、HTTP、Java、JavaScript、Portals等技術集成到Pentaho平台中來。Pentaho的發行,主要以Pentaho SDK的形式進行。
Pentaho SDK共包含五個部分:Pentaho平台、Pentaho示例資料庫、可獨立運行的Pentaho平台、Pentaho解決方案示例和一個預先配製好的Pentaho網路伺服器。其中Pentaho平台是Pentaho平台最主要的部分,囊括了Pentaho平台原始碼的主體;Pentaho資料庫為Pentaho平台的正常運行提供的數據服務,包括配置信息、Solution相關的信息等等,對於Pentaho平台來說它不是必須的,通過配置是可以用其它資料庫服務取代的;可獨立運行的Pentaho平台是Pentaho平台的獨立運行模式的示例,它演示了如何使Pentaho平台在沒有套用伺服器支持的情況下獨立運行;Pentaho解決方案示例是一個Eclipse工程,用來演示如何為Pentaho平台開發相關的商業智慧型解決方案。
Pentaho BI 平台構建於伺服器,引擎和組件的基礎之上。這些提供了系統的J2EE 伺服器,安全,portal,工作流,規則引擎,圖表,協作,內容管理,數據集成,分析和建模功能。這些組件的大部分是基於標準的,可使用其他產品替換之。Pentaho伺服器組件是整套系統的基礎,

軟體層次結構

Pentaho平台是Pentaho運行系統中的核心部分,它本身是一個Web套用,部署於一個J2EE兼容的套用伺服器上。它又作為Solution的伺服器存在著,是Solution中各個Action序列的解釋執行者。Pentaho平台大致可分為三個層次:界面層、核心層和插
件層。界面層是外部用戶訪問Pentaho服務的接口,主要包含三個部分:UDDI、Web頁面、Navigation Component。UDDI為外部應用程式或Web Service訪問Pentaho服務提供接口;Web頁面則為用戶通過瀏覽器訪問Pentaho服務提供接口;Navigation Component實質上是一組Servelet,它主要用於顯示當前部署在Pentaho平台上的Solution中所包含的
各個Action序列,用戶可在其中選擇需要執行的Action序列。
核心層主要由Solution Engine和它的Runtime環境組成。Solution Engine實質上是一個解釋執行Action序列描述檔案的解釋器,它接收來自用戶界面的請求,這個請求通常是要求執行Solution中的某個Action序列。Solution Engine連同其Runtime環境就負責解釋執行這些Action序列。解釋執行過程中,出於調試和性能分析的需要,引入了一個Audit機制,該機制類似一個日誌記錄系統,記錄Pentaho平台運行過程中的一些動態過程。Solution Engine和Audit機制的運行都需要訪問許多相關的數據資源,這些數據資源被稱為"資源庫",也就是圖中的各個Repository。
外掛程式層主要包括了集成到Pentaho平台中的各種BI產品,如Quartz、Jfree等等。從圖3中可以看出,外掛程式層又可分為兩類模組,一類叫作Component模組,這種模組是外掛程式層與核心層的接口模組,它們將各種不同的外掛程式的功能以一個統一的接口提供給上層使用,起到一個功能抽象的作用。另一類則是形形色色的BI外掛程式的具體實現,這通常由第三方開發者提供。各種外掛程式運行過程中可能會用到自身的私有數據,這些數據在Pentaho平台中也被抽象成為資源庫(Responsory),這使得不同的外掛程式可以以一種統一的方式訪問自己的數據。

相關詞條

熱門詞條

聯絡我們