高效能 SQL 叢集引擎 PGSpider 2.0.0 發布

發布於 2021-12-27,作者:Toshiba
相關開源專案

我們剛發布了 PGSpider v2.0.0。

PGSpider 是一個用於分散式大數據的高效能 SQL 叢集引擎。 PGSpider 可以使用外部資料包裝器 (FDW) 存取多個資料來源,並垂直檢索分散式資料來源。
PGSpider 的使用方式與 PostgreSQL 相同。 您可以使用任何客戶端應用程式,例如 libpq 和 psql。

此版本改進了以下項目:

  • 發布完整原始碼
  • 舊版本需要將修補程式應用於 PostgreSQL
  • 基於 PostgreSQL 14.0
  • 下推目標列表中的 SQL 函式
  • 如果查詢中的所有表都位於單一資料來源中,則下推 JOIN
  • 變更程式名稱 ('pgspider') 和預設連接埠號碼 (4813)

PGSpider 支援以下功能:

多租戶
使用者可以輕鬆地透過一個 SQL 取得多個表中的記錄。 如果每個資料來源中都有具有相似結構描述的表,PGSpider 可以將它們視為單一虛擬表:我們稱其為多租戶表。

平行處理
PGSpider 平行執行查詢並從子節點獲取結果。
PGSpider 將多租戶表擴展到子表,並為每個子表建立新的執行緒以存取相應的資料來源。

下推
WHERE 子句和彙總函式會下推到子節點。 當使用 AVG、STDDEV 和 VARIANCE 時,下推到多租戶表會發生錯誤。 PGSPider 改進了此錯誤,PGSpider 可以執行它們。 如果查詢中的所有表都位於單一資料來源中,則 JOIN 也會下推。

這是由 Toshiba Software Engineering & Technology Center 開發的。
請參閱儲存庫以取得詳細資訊,並告訴我們您的意見反應。

原始碼儲存庫:https://github.com/pgspider/pgspider

此致,
片山 大雅 (TAIGA Katayama)