設(shè)置
  • 日夜間
    隨系統(tǒng)
    淺色
    深色
  • 主題色

VMWare 推出開源 AI 分析平臺 Greenplum 7,提升可擴(kuò)展性及多負(fù)載處理能力

2023/10/13 18:01:37 來源:IT之家 作者:漾仔(實(shí)習(xí)) 責(zé)編:漾仔

IT之家 10 月 13 日消息,據(jù) VMWare 中國研發(fā)中心公眾號發(fā)文,VMware Greenplum 7 目前已經(jīng)正式推出,這是一個“統(tǒng)一分析和人工智能”平臺,支持向量數(shù)據(jù)并行處理,號稱“可與最新大語言模型方法(LLM)集成”、“能夠可幫助企業(yè)充分利用其數(shù)據(jù)資源”。

圖片

▲ 圖源 VMWare 中國研發(fā)中心

VMware 聲稱,Greenplum 核心是以開源 PostgreSQL 項(xiàng)目為基礎(chǔ),將商業(yè)智能(BI)和人工智能(AI)功能無縫集成在同一平臺上,能夠統(tǒng)一數(shù)據(jù)分析和人工智能需求,所有的操作都可以通過用戶熟悉的 SQL 數(shù)據(jù)庫界面來實(shí)現(xiàn)。

VMware 認(rèn)為,Greenplum 在部署方面具有顯著的靈活性,在數(shù)據(jù)處理上也有一定優(yōu)勢,能夠管理“各種類型的數(shù)據(jù)”,此外還集成了增強(qiáng)的安全功能,從而使企業(yè)能夠高效快速地應(yīng)對復(fù)雜的挑戰(zhàn)。

IT之家附 VMware Greenplum 7 主要更新內(nèi)容如下:

開放源代碼和 PostgreSQL 12 的衍生

VMware Greenplum 7 建立在開源代碼的基礎(chǔ)上,利用了現(xiàn)代 PostgreSQL 版本的功能、可靠性和靈活性。與前一版本相比,Greenplum 7 植根于 PostgreSQL 12,并整合了近 5 年以來 PostgreSQL 的發(fā)布版本。

多種索引類型

VMware Greenplum 7 支持多種索引類型,包括 B 樹索引、哈希索引、位圖索引、塊范圍索引、文本索引、地理空間索引和 AI 向量索引。該功能可優(yōu)化數(shù)據(jù)檢索和查詢性能。Greenplum 查詢優(yōu)化器自 2009 年以來不斷改進(jìn),在第 6 版中取得了良好的性能記錄,在第 7 版中得到了擴(kuò)展,提供了全面的索引選擇支持。

利用 PXF 增強(qiáng)數(shù)據(jù)聯(lián)合

VMware Greenplum 7 中的平臺擴(kuò)展框架(PXF) 經(jīng)過改進(jìn),實(shí)現(xiàn)了卓越的數(shù)據(jù)聯(lián)合。企業(yè)現(xiàn)在可以通過 JDBC 查詢亞馬遜簡單存儲服務(wù)(S3)對象存儲、Hadoop 分布式文件系統(tǒng)(HDFS)和其他關(guān)系數(shù)據(jù)庫中的數(shù)據(jù)集。它利用 PostgreSQL 的外來數(shù)據(jù)封裝器 API 來并行訪問遠(yuǎn)程數(shù)據(jù)源,提供抽象數(shù)據(jù)模型來管理遠(yuǎn)程數(shù)據(jù)的安全性和統(tǒng)計(jì)數(shù)據(jù),以優(yōu)化查詢。

增強(qiáng)文本搜索

VMware Greenplum 7 擴(kuò)展了文本搜索功能,同時支持詞法搜索和人工智能驅(qū)動的語義搜索,以提供更準(zhǔn)確的搜索結(jié)果。詞法搜索支持基于關(guān)鍵字的傳統(tǒng)文本搜索,對于語義搜索,則由人工智能和向量 embeddings 提供支持。

升級地理空間分析

VMware Greenplum 7 通過集成 PostGIS 版本 3 升級了地理空間分析功能。這一改進(jìn)大大提高了地理空間查詢的速度和特征豐富度。

行級安全權(quán)限

該功能是對 VMware Greenplum 中已有的基于角色的安全模型以及表級和列級權(quán)限的補(bǔ)充。

用于增強(qiáng)數(shù)據(jù)建模的生成列

VMware Greenplum 7 中引入了生成列,從而改進(jìn)了數(shù)據(jù)抽象和建模,解決了安全特征保留數(shù)據(jù)屏蔽等用例問題。

改進(jìn)的 DBA 查詢功能

Greenplum 7 對 DBA 查詢功能進(jìn)行了大量改進(jìn),包括 UPSERT 支持、帶有事務(wù)的用戶定義函數(shù),以及對 ALTER TABLE 的改進(jìn)以減少數(shù)據(jù)重寫。

增強(qiáng)的半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)分析

Greenplum 7 除支持 XML 文檔外,還支持半結(jié)構(gòu)化數(shù)據(jù)處理,如增強(qiáng)的 JSON 和數(shù)組數(shù)據(jù)處理功能。全文搜索和基于文本的詞法搜索索引可實(shí)現(xiàn)高效的文本存儲、索引和搜索。此外,向量嵌入可實(shí)現(xiàn)非結(jié)構(gòu)化數(shù)據(jù)的濃縮和高效表示,允許跨多種語言對匹配的文檔、圖像和視頻進(jìn)行相似性搜索,包括多語言搜索。

PostgreSQL 擴(kuò)展生態(tài)系統(tǒng)

更全面的 PostgreSQL 擴(kuò)展支持,如高級密碼檢查、模糊字符串匹配、Hyperloglog、用于網(wǎng)絡(luò)數(shù)據(jù)的 Ip4r、用于媒體數(shù)據(jù)的 Isn、納秒時間戳、稀疏向量、用于透視的 Tablefunc、用于唯一標(biāo)識符的 UUID 以及用于人工智能向量嵌入的 pg_vector,已全部支持。

先進(jìn)的資源管理

Greenplum 7 引入了一系列高級資源管理功能。這些功能可確保在高負(fù)載情況下的穩(wěn)健性能。

VMware vSphere 部署模型

Greenplum 7 可以參考推薦的架構(gòu)部署在裸機(jī)或公共云環(huán)境中。也可利用 Greenplum 7 版本中提供的自動部署模式無縫集成到 vSphere 私有云環(huán)境中。

多數(shù)據(jù)中心災(zāi)難恢復(fù)解決方案

作為多數(shù)據(jù)中心災(zāi)難恢復(fù)解決方案的一部分,數(shù)據(jù)通過事務(wù)日志歸檔進(jìn)行復(fù)制,從而實(shí)現(xiàn)比 Greenplum 以前版本更高效、更低的恢復(fù)點(diǎn)目標(biāo)(RPO)和恢復(fù)時間目標(biāo)(RTO)災(zāi)難恢復(fù)解決方案。

新的擴(kuò)展 PostgresML

提供新的用戶定義函數(shù),使用戶可以在 VMware Greenplum 中使用數(shù)以萬計(jì)的開源人工智能 / 機(jī)器學(xué)習(xí)預(yù)訓(xùn)練模型。

參考

廣告聲明:文內(nèi)含有的對外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。

相關(guān)文章

關(guān)鍵詞:人工智能,greenplum,vmware

軟媒旗下網(wǎng)站: IT之家 最會買 - 返利返現(xiàn)優(yōu)惠券 iPhone之家 Win7之家 Win10之家 Win11之家

軟媒旗下軟件: 軟媒手機(jī)APP應(yīng)用 魔方 最會買 要知