甲骨文推出 Oracle 雲端數據科學平台

週二, 2020年3月17日 17:51
打印

Oracle Corporation Logo

 

甲骨文推出 Oracle 雲端數據科學平台

香港,3月16日 - 甲骨文宣佈發佈Oracle雲端數據科學平台(Oracle Cloud Data Science Platform)。該平台的核心服務為Oracle雲端基礎設施數據科學平台(Oracle Cloud Infrastructure Data Science),旨在幫助企業以合作方式構建、訓練、管理和部署機器學習模型,提高數據科學項目的成功率。與其他專注於數據科學家個人使用的產品不同,Oracle雲端基礎設施數據科學平台提供共享項目、模型目錄、團隊安全性策略、複用性和可審計性等功能,協助數據科學團隊提高效率。此外,Oracle雲端基礎設施數據科學平台可以透過AutoML演算法選擇和優化、模型評估、模型說明等功能,自動選擇最佳的訓練數據集。

· 協助數據科學團隊輕鬆快速地合作、構建和部署強大的機器學習模型
· Oracle自動數據庫的機器學習算法新增對Python的支持,減少對數據流動的需求
· 該平台提供七個新服務及功能,包括新的數據目錄服務 (用於發現、查找、組織、擴增和建立數據資產)、新的大數據服務 (用於提供完整的Cloudera Hadoop 實施)、支持透過SQL 訪問HDFS的新服務,以及用於運行Apache Spark 應用的全託管式服務

目前,眾多企業僅能從數據的巨大潛能中挖掘出一小部分,這是因為他們的數據科學團隊仍無法輕鬆使用合適的數據和工具來建構、部署有效的機器學習模型,導致模型開發時間過長,難以持續滿足企業對準確性和可靠性的更高需求,因而無法投入生產。

甲骨文數據和AI服務產品開發高級副總裁Greg Pavlik表示:「有效的機器學習模型是數據科學項目取得成功的基礎,但不同類型的大量數據會阻礙項目的實施。使用Oracle雲端基礎設施數據科學平台,讓我們實現整個工作流程的自動化並建立強大的團隊合作支持,以此提高各數據科學家的效率,確保數據科學項目為企業創造真正的價值。」


專為數據科學團隊和科學家量身打造

Oracle雲端基礎設施數據科學平台提供自動化的數據科學工作流程,透過下列功能節省時間並減少錯誤:

· AutoML自動演算法選擇和優化 — 可針對多種演算法和超參數配置,自動運行測試過程。這項功能可以檢查結果的準確性,並確認目前選擇的模型和配置是最佳方案,不僅可以為數據科學家節省大量時間,更重要的是,能夠賦予不同水平的數據科學家專家級的能力。

· 自動選擇預測性特性 — 透過自動識別大型數據集裡的關鍵預測性特性,從而簡化特性設計。

· 模型評估 —一套全面的評估指標和合適的可視化工具,以便針對新數據來衡量模型性能,並且可以持續對模型進行排序,在生產環境中採取最佳行動。除了原始性能之外,模型評估還將考慮預期的基準線行為(baseline behavior),並運用成本模型將誤報和漏報的不同影響計算其中。

· 模型說明 — 針對預測中的影響因素,Oracle雲端基礎設施數據科學平台可對它們的對應權重和重要性提供自動說明。Oracle雲端基礎設施數據科學平台首次提供了商業化、與模型無關的說明。舉例來說,借助欺詐檢測模型,數據科學家可以解釋哪些因素是欺詐的最大動因,以便企業修改流程或實施保護措施。

眾所皆知,要將有效的機器學習模型成功投入生產,僅憑一人之力是無法實現的,這需要多個數據科學家進行團隊合作完成。Oracle雲端基礎設施數據科學平台提供強大的團隊合作功能,包括:

·         共享項目 — 幫助用戶安排、啟用版本控制並可靠地共享團隊工作內容,包括數據和notebook 會話。

·         模型目錄 — 使團隊成員可靠地共享已經建構的模型,以及那些修改和部署它們所需的工件。

·         針對團隊的安全功能 — 允許使用者控制對模型、代碼和數據的訪問權限,這已經與Oracle Cloud Infrastructure Identity and Access Management全面整合。

·         複用性和可審計功能 — 支持企業追蹤所有相關資產,即便成員離開團隊,企業也可以重現和審計所有模型。

藉助Oracle雲端基礎設施數據科學平台,企業可以提高部署模型的速度和成功率,產生企業級結果和性能指標進行預測分析,從而取得正面的業務成果。

全面的數據服務和機器學習服務

Oracle雲端數據科學平台包含七項新服務,提供全面的端到端體驗加速實現數據科學成果。這七項新服務為:

·         Oracle雲端基礎設施數據科學平台:支持用戶使用Python以及其他開源工具和函式庫(包括TensorFlow、Keras和Jupyter)在Oracle雲端上建立、訓練和管理新的機器學習模型。

 

·         Oracle自動數據庫新增的機器學習功能:機器學習演算法緊密整合在Oracle自動數據庫中,並新增了對Python和AutoML的支持。接下來,這些演算法將與Oracle雲端基礎設施數據科學平台整合,支援數據科學家使用開源和可擴展的數據庫中(in-database)演算法來開發模型。這種將演算法應用於Oracle數據庫中數據的獨特方法可減少數據的準備和流動的工作,從而加速實現成果。

·         Oracle雲端基礎設施數據目錄:允許用戶在Oracle雲端上發掘、查詢、組織、擴展和追蹤數據。Oracle雲端基礎設施數據目錄採用內置業務術語表,用戶可輕鬆管理和找到合適的可靠數據。

·         Oracle大數據服務:提供完整實施的Cloudera Hadoop,與其他Hadoop產品相比,該服務大幅簡化管理,只需一鍵即可使群集具有高可用性與安全性。Oracle大數據服務還包含適用於Spark的機器學習,企業可以使用一個產品在記憶體中運行Spark機器學習,盡可能減少數據流動。

·         Oracle Cloud SQL:支援對HDFS、Hive、Kafka、NoSQL和對象儲存中的數據進行SQL查詢。CloudSQL的獨特之處在於,與Oracle數據庫進行對話的任何用戶、應用或分析工具,都可以透明地使用其他數據儲存中的數據,獲得下推(push down)、橫向擴展(scale-out)處理的優勢,可最大程度地減少數據流動。

·         Oracle雲端基礎設施數據流:完全託管的大數據服務,使用者無需部署或管理基礎設施即可運行Apache Spark應用,從而幫助企業更快地取得大數據和AI應用程式。與其他Hadoop和Spark服務不同,Oracle雲端基礎設施數據流提供了單一窗口追蹤所有Spark作業讓高成本任務可以輕鬆識別、排除問題。

·         適用於數據科學的Oracle雲端基礎設施虛擬機器:以GPU為基礎的預設環境,具有常見的IDE、notebook和框架,可以在15分鐘內啟動並運行,每天收費30美元。


關於甲骨文
Oracle雲端在銷售、服務、市場營銷、人力資源、財務、供應鏈和製造領域提供全面的集成應用,及基於Oracle自動數據庫打造的具有高度自動效能和安全性的第二代基礎設施。如需了解更多關於甲骨文公司(NYSE:ORCL)的資訊,請瀏覽:www.oracle.comwww.oracle.com/hk

 

 

 

 

 

( 內容由有關方面代表提供 )