PostgreSQL 中的物化檢視像檢視一樣使用規則系統,但將結果持久化為類似表的形式。主要區別在於
CREATE MATERIALIZED VIEW mymatview AS SELECT * FROM mytab;
和
CREATE TABLE mymatview AS SELECT * FROM mytab;
物化檢視不能稍後直接更新,並且用於建立物化檢視的查詢儲存方式與檢視的查詢儲存方式完全相同,以便可以使用
REFRESH MATERIALIZED VIEW mymatview;
PostgreSQL 系統目錄中關於物化檢視的資訊與表或檢視的資訊完全相同。因此,對於解析器來說,物化檢視就是一個關係,就像表或檢視一樣。當查詢中引用物化檢視時,資料會像從表中一樣直接從物化檢視返回;規則僅用於填充物化檢視。
雖然訪問物化檢視中儲存的資料通常比直接訪問底層表或透過檢視訪問快得多,但資料並非總是最新的;然而,有時並不需要最新資料。考慮一個記錄銷售的表
CREATE TABLE invoice ( invoice_no integer PRIMARY KEY, seller_no integer, -- ID of salesperson invoice_date date, -- date of sale invoice_amt numeric(13,2) -- amount of sale );
如果人們想要能夠快速地繪製歷史銷售資料的圖表,他們可能想要彙總資料,並且他們可能不在乎當前日期不完整的資料
CREATE MATERIALIZED VIEW sales_summary AS SELECT seller_no, invoice_date, sum(invoice_amt)::numeric(13,2) as sales_amt FROM invoice WHERE invoice_date < CURRENT_DATE GROUP BY seller_no, invoice_date; CREATE UNIQUE INDEX sales_summary_seller ON sales_summary (seller_no, invoice_date);
這個物化檢視可能有助於顯示為銷售人員建立的儀表板中的圖表。可以使用以下 SQL 語句安排一個作業來更新統計資料,每個晚上執行一次
REFRESH MATERIALIZED VIEW sales_summary;
物化檢視的另一個用途是允許透過外部資料封裝器(foreign data wrapper)更快地訪問從遠端系統帶來的資料。下面是一個使用 file_fdw
的簡單示例,附帶了計時資訊,但由於這使用了本地系統的快取,因此與訪問遠端系統相比,效能差異通常會比這裡顯示的更大。請注意,我們還利用了在物化檢視上建立索引的能力,而 file_fdw
不支援索引;對於其他型別的外部資料訪問,此優勢可能不適用。
設定
CREATE EXTENSION file_fdw; CREATE SERVER local_file FOREIGN DATA WRAPPER file_fdw; CREATE FOREIGN TABLE words (word text NOT NULL) SERVER local_file OPTIONS (filename '/usr/share/dict/words'); CREATE MATERIALIZED VIEW wrd AS SELECT * FROM words; CREATE UNIQUE INDEX wrd_word ON wrd (word); CREATE EXTENSION pg_trgm; CREATE INDEX wrd_trgm ON wrd USING gist (word gist_trgm_ops); VACUUM ANALYZE wrd;
現在我們來拼寫一個單詞。直接使用 file_fdw
SELECT count(*) FROM words WHERE word = 'caterpiler'; count ------- 0 (1 row)
使用 EXPLAIN ANALYZE
,我們看到
Aggregate (cost=21763.99..21764.00 rows=1 width=0) (actual time=188.180..188.181 rows=1.00 loops=1) -> Foreign Scan on words (cost=0.00..21761.41 rows=1032 width=0) (actual time=188.177..188.177 rows=0.00 loops=1) Filter: (word = 'caterpiler'::text) Rows Removed by Filter: 479829 Foreign File: /usr/share/dict/words Foreign File Size: 4953699 Planning time: 0.118 ms Execution time: 188.273 ms
如果改為使用物化檢視,查詢會快得多
Aggregate (cost=4.44..4.45 rows=1 width=0) (actual time=0.042..0.042 rows=1.00 loops=1) -> Index Only Scan using wrd_word on wrd (cost=0.42..4.44 rows=1 width=0) (actual time=0.039..0.039 rows=0.00 loops=1) Index Cond: (word = 'caterpiler'::text) Heap Fetches: 0 Index Searches: 1 Planning time: 0.164 ms Execution time: 0.117 ms
無論哪種方式,這個詞都拼錯了,所以讓我們來看看我們可能想要什麼。再次使用 file_fdw
和 pg_trgm
SELECT word FROM words ORDER BY word <-> 'caterpiler' LIMIT 10; word --------------- cater caterpillar Caterpillar caterpillars caterpillar's Caterpillar's caterer caterer's caters catered (10 rows)
Limit (cost=11583.61..11583.64 rows=10 width=32) (actual time=1431.591..1431.594 rows=10.00 loops=1) -> Sort (cost=11583.61..11804.76 rows=88459 width=32) (actual time=1431.589..1431.591 rows=10.00 loops=1) Sort Key: ((word <-> 'caterpiler'::text)) Sort Method: top-N heapsort Memory: 25kB -> Foreign Scan on words (cost=0.00..9672.05 rows=88459 width=32) (actual time=0.057..1286.455 rows=479829.00 loops=1) Foreign File: /usr/share/dict/words Foreign File Size: 4953699 Planning time: 0.128 ms Execution time: 1431.679 ms
使用物化檢視
Limit (cost=0.29..1.06 rows=10 width=10) (actual time=187.222..188.257 rows=10.00 loops=1) -> Index Scan using wrd_trgm on wrd (cost=0.29..37020.87 rows=479829 width=10) (actual time=187.219..188.252 rows=10.00 loops=1) Order By: (word <-> 'caterpiler'::text) Index Searches: 1 Planning time: 0.196 ms Execution time: 198.640 ms
如果您可以容忍遠端資料週期性地更新到本地資料庫,效能上的好處可能是顯著的。
如果您在文件中看到任何不正確、與您使用該特定功能時的經驗不符或需要進一步說明的內容,請使用此表單報告文件問題。