IT之家 10 月 13 日消息,據(jù) VMWare 中國研發(fā)中心公眾號發(fā)文,VMware Greenplum 7 目前已經(jīng)正式推出,這是一個“統(tǒng)一分析和人工智能”平臺,支持向量數(shù)據(jù)并行處理,號稱“可與最新大語言模型方法(LLM)集成”、“能夠可幫助企業(yè)充分利用其數(shù)據(jù)資源”。
VMware 聲稱,Greenplum 核心是以開源 PostgreSQL 項(xiàng)目為基礎(chǔ),將商業(yè)智能(BI)和人工智能(AI)功能無縫集成在同一平臺上,能夠統(tǒng)一數(shù)據(jù)分析和人工智能需求,所有的操作都可以通過用戶熟悉的 SQL 數(shù)據(jù)庫界面來實(shí)現(xiàn)。
VMware 認(rèn)為,Greenplum 在部署方面具有顯著的靈活性,在數(shù)據(jù)處理上也有一定優(yōu)勢,能夠管理“各種類型的數(shù)據(jù)”,此外還集成了增強(qiáng)的安全功能,從而使企業(yè)能夠高效快速地應(yīng)對復(fù)雜的挑戰(zhàn)。
IT之家附 VMware Greenplum 7 主要更新內(nèi)容如下:
開放源代碼和 PostgreSQL 12 的衍生
VMware Greenplum 7 建立在開源代碼的基礎(chǔ)上,利用了現(xiàn)代 PostgreSQL 版本的功能、可靠性和靈活性。與前一版本相比,Greenplum 7 植根于 PostgreSQL 12,并整合了近 5 年以來 PostgreSQL 的發(fā)布版本。
多種索引類型
VMware Greenplum 7 支持多種索引類型,包括 B 樹索引、哈希索引、位圖索引、塊范圍索引、文本索引、地理空間索引和 AI 向量索引。該功能可優(yōu)化數(shù)據(jù)檢索和查詢性能。Greenplum 查詢優(yōu)化器自 2009 年以來不斷改進(jìn),在第 6 版中取得了良好的性能記錄,在第 7 版中得到了擴(kuò)展,提供了全面的索引選擇支持。
利用 PXF 增強(qiáng)數(shù)據(jù)聯(lián)合
VMware Greenplum 7 中的平臺擴(kuò)展框架(PXF) 經(jīng)過改進(jìn),實(shí)現(xiàn)了卓越的數(shù)據(jù)聯(lián)合。企業(yè)現(xiàn)在可以通過 JDBC 查詢亞馬遜簡單存儲服務(wù)(S3)對象存儲、Hadoop 分布式文件系統(tǒng)(HDFS)和其他關(guān)系數(shù)據(jù)庫中的數(shù)據(jù)集。它利用 PostgreSQL 的外來數(shù)據(jù)封裝器 API 來并行訪問遠(yuǎn)程數(shù)據(jù)源,提供抽象數(shù)據(jù)模型來管理遠(yuǎn)程數(shù)據(jù)的安全性和統(tǒng)計(jì)數(shù)據(jù),以優(yōu)化查詢。
增強(qiáng)文本搜索
VMware Greenplum 7 擴(kuò)展了文本搜索功能,同時支持詞法搜索和人工智能驅(qū)動的語義搜索,以提供更準(zhǔn)確的搜索結(jié)果。詞法搜索支持基于關(guān)鍵字的傳統(tǒng)文本搜索,對于語義搜索,則由人工智能和向量 embeddings 提供支持。
升級地理空間分析
VMware Greenplum 7 通過集成 PostGIS 版本 3 升級了地理空間分析功能。這一改進(jìn)大大提高了地理空間查詢的速度和特征豐富度。
行級安全權(quán)限
該功能是對 VMware Greenplum 中已有的基于角色的安全模型以及表級和列級權(quán)限的補(bǔ)充。
用于增強(qiáng)數(shù)據(jù)建模的生成列
VMware Greenplum 7 中引入了生成列,從而改進(jìn)了數(shù)據(jù)抽象和建模,解決了安全特征保留數(shù)據(jù)屏蔽等用例問題。
改進(jìn)的 DBA 查詢功能
Greenplum 7 對 DBA 查詢功能進(jìn)行了大量改進(jìn),包括 UPSERT 支持、帶有事務(wù)的用戶定義函數(shù),以及對 ALTER TABLE 的改進(jìn)以減少數(shù)據(jù)重寫。
增強(qiáng)的半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)分析
Greenplum 7 除支持 XML 文檔外,還支持半結(jié)構(gòu)化數(shù)據(jù)處理,如增強(qiáng)的 JSON 和數(shù)組數(shù)據(jù)處理功能。全文搜索和基于文本的詞法搜索索引可實(shí)現(xiàn)高效的文本存儲、索引和搜索。此外,向量嵌入可實(shí)現(xiàn)非結(jié)構(gòu)化數(shù)據(jù)的濃縮和高效表示,允許跨多種語言對匹配的文檔、圖像和視頻進(jìn)行相似性搜索,包括多語言搜索。
PostgreSQL 擴(kuò)展生態(tài)系統(tǒng)
更全面的 PostgreSQL 擴(kuò)展支持,如高級密碼檢查、模糊字符串匹配、Hyperloglog、用于網(wǎng)絡(luò)數(shù)據(jù)的 Ip4r、用于媒體數(shù)據(jù)的 Isn、納秒時間戳、稀疏向量、用于透視的 Tablefunc、用于唯一標(biāo)識符的 UUID 以及用于人工智能向量嵌入的 pg_vector,已全部支持。
先進(jìn)的資源管理
Greenplum 7 引入了一系列高級資源管理功能。這些功能可確保在高負(fù)載情況下的穩(wěn)健性能。
VMware vSphere 部署模型
Greenplum 7 可以參考推薦的架構(gòu)部署在裸機(jī)或公共云環(huán)境中。也可利用 Greenplum 7 版本中提供的自動部署模式無縫集成到 vSphere 私有云環(huán)境中。
多數(shù)據(jù)中心災(zāi)難恢復(fù)解決方案
作為多數(shù)據(jù)中心災(zāi)難恢復(fù)解決方案的一部分,數(shù)據(jù)通過事務(wù)日志歸檔進(jìn)行復(fù)制,從而實(shí)現(xiàn)比 Greenplum 以前版本更高效、更低的恢復(fù)點(diǎn)目標(biāo)(RPO)和恢復(fù)時間目標(biāo)(RTO)災(zāi)難恢復(fù)解決方案。
新的擴(kuò)展 PostgresML
提供新的用戶定義函數(shù),使用戶可以在 VMware Greenplum 中使用數(shù)以萬計(jì)的開源人工智能 / 機(jī)器學(xué)習(xí)預(yù)訓(xùn)練模型。
參考
廣告聲明:文內(nèi)含有的對外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。