PostgreSQL,MySQL,oracle沒(méi)有默認(rèn)排序 ,不指定排序的話多次查詢(xún)返回的數(shù)據(jù)順序是有可能不一樣的。
城關(guān)ssl適用于網(wǎng)站、小程序/APP、API接口等需要進(jìn)行數(shù)據(jù)傳輸應(yīng)用場(chǎng)景,ssl證書(shū)未來(lái)市場(chǎng)廣闊!成為創(chuàng)新互聯(lián)的ssl證書(shū)銷(xiāo)售渠道,可以享受市場(chǎng)價(jià)格4-6折優(yōu)惠!如果有意向歡迎電話聯(lián)系或者加微信:13518219792(備注:SSL證書(shū)合作)期待與您的合作!
要按照數(shù)據(jù)塊排序要加一句order by rowid ,
不然量很大的情況每次執(zhí)行順序都有可能不一樣。
這個(gè)是自增序列的工作方式,就是每次都是向后追加,要是實(shí)現(xiàn)你要的功能就不能用自增列
select * from (select 除了時(shí)間所有字段寫(xiě)出來(lái),to_date('COMMENTTIME','yyyy-mm-dd hh24:mi:ss') time from T_SCHOOL_RECORDCOMMENT where RECORDID = :p_cid) order by time desc;
這樣試試,但是你的時(shí)間字段用該保存為date類(lèi)型,這樣好像很麻煩。。
PostgreSQL自帶有一個(gè)簡(jiǎn)易的全文檢索引擎,可以實(shí)現(xiàn)小規(guī)模數(shù)據(jù)量的全文檢索功能。本文我們將引導(dǎo)介紹一下這個(gè)功能,對(duì)于小數(shù)據(jù)量的搜索這個(gè)功能是足夠使用的,而無(wú)需搭建額外的ES等重量級(jí)的全文檢索服務(wù)器。
PG的全文檢索操作符是 @@ ,當(dāng)一個(gè) tsvector (文檔)和 tsquery (條件)匹配時(shí)返回 true ,并且前后順序無(wú)影響:
和普通的SQL查詢(xún)一樣,只要在 WHERE 條件中使用這個(gè)符號(hào)就代表使用全文檢索條件篩選文檔了。如:
@@ 操作符支持隱式轉(zhuǎn)換,對(duì)于 text 類(lèi)型可以無(wú)需強(qiáng)類(lèi)型轉(zhuǎn)換( ::tsvector 或 to_tsvector(config_name, text) ),所以這個(gè)操作符實(shí)際支持的參數(shù)類(lèi)型是這樣的:
tsquery 查詢(xún)條件并不是簡(jiǎn)單的正則,而是一組搜索術(shù)語(yǔ),使用并且使用布爾操作符 (AND)、 | (OR)和 ! (NOT)來(lái)組合它們,還有短語(yǔ)搜索操作符 - (FOLLOWED BY)。更詳細(xì)的語(yǔ)法參見(jiàn) 此文檔 。
此外,PostgreSQL還提供了兩個(gè)相對(duì)簡(jiǎn)化的版本 plainto_tsquery 和 phraseto_tsquery 。
plainto_tsquery ( plainto_tsquery([ config regconfig, ] querytext text) returns tsquery )用戶(hù)將未格式化的 text 經(jīng)過(guò)分詞之后,插入 符號(hào)轉(zhuǎn)為 tsquery :
phraseto_tsquery ( phraseto_tsquery([ config regconfig, ] querytext text) returns tsquery )行為和 plainto_tsquery 行為類(lèi)似,但是分詞之后不是插入 而是 - (FOLLOWED BY):
使用索引可以加快全文檢索的速度。對(duì)于全文檢索來(lái)說(shuō),可選的索引類(lèi)型是 GIN (通用倒排索引)和 GIST (通用搜索樹(shù)),官方文檔更推薦使用 GIN索引 。創(chuàng)建一個(gè) GIN 索引的范例:
也可以是一個(gè)連接列:
還可以單獨(dú)創(chuàng)建一個(gè) tsvector 列,為這個(gè)列創(chuàng)建索引:
除了普通的 ORDER BY 條件之外,PostgreSQL為全文檢索提供了兩個(gè)可選的排序函數(shù) ts_rank([ weights float4[], ] vector tsvector, query tsquery [, normalization integer ]) returns float4 和 ts_rank_cd([ weights float4[], ] vector tsvector, query tsquery [, normalization integer ]) returns float4 ,以便實(shí)現(xiàn)基于 權(quán)重 的排序。
此外,對(duì)于PostgreSQL 9.6以上的版本還可以使用 RUM index 排序。(注意,這個(gè)是擴(kuò)展,默認(rèn)不包含)。
PostgreSQL默認(rèn)的分詞字典中并不包含中文分詞字典,因此我們必須手工引入。目前一個(gè)比較好的項(xiàng)目是 zhparser ,同時(shí)這個(gè)插件也是阿里云的RDS默認(rèn)包含的。安裝和啟用沒(méi)什么好說(shuō)的。值得一提的是分詞配置參數(shù)。
在 CREATE EXTENSION 之后,必須配置分詞參數(shù)才能正確進(jìn)行分詞和查找,否則什么都查不到。官方文檔提供的一個(gè)配置策略是:
n,v,a,i,e,l 這幾個(gè)字母分別表示一種token策略,只啟用了這幾種token mapping,其余則被屏蔽。具體支持的參數(shù)和含義可以用 \dFp+ zhparser 顯示:
WITH simple 表示詞典使用的是內(nèi)置的simple詞典,即僅做小寫(xiě)轉(zhuǎn)換。根據(jù)需要可以靈活定義詞典和token映射,以實(shí)現(xiàn)屏蔽詞和同義詞歸并等功能。
比如我們看下面這個(gè)例子:
可以看到 江淮 這個(gè)詞組在查詢(xún)的時(shí)候被忽略了,我們啟用 j (abbreviation,簡(jiǎn)稱(chēng))再看看結(jié)果:
所以實(shí)際使用中要設(shè)置合理的token types,過(guò)少將導(dǎo)致搜索結(jié)果不準(zhǔn)確,過(guò)多將導(dǎo)致性能下降。此外,還有一些諸如 短詞復(fù)合: zhparser.multi_short = f 這一類(lèi)的控制分詞結(jié)果的選項(xiàng),根據(jù)實(shí)際使用酌情開(kāi)啟。
一、索引的類(lèi)型:
PostgreSQL提供了多種索引類(lèi)型:B-Tree、Hash、GiST和GIN,由于它們使用了不同的算法,因此每種索引類(lèi)型都有其適合的查詢(xún)類(lèi)型,缺省時(shí),CREATE INDEX命令將創(chuàng)建B-Tree索引。
1. B-Tree:
CREATE TABLE test1 (
id integer,
content varchar
);
CREATE INDEX test1_id_index ON test1 (id);
B-Tree索引主要用于等于和范圍查詢(xún),特別是當(dāng)索引列包含操作符" 、=和"作為查詢(xún)條件時(shí),PostgreSQL的查詢(xún)規(guī)劃器都會(huì)考慮使用B-Tree索引。在使用BETWEEN、IN、IS NULL和IS NOT NULL的查詢(xún)中,PostgreSQL也可以使用B-Tree索引。然而對(duì)于基于模式匹配操作符的查詢(xún),如LIKE、ILIKE、~和 ~*,僅當(dāng)模式存在一個(gè)常量,且該常量位于模式字符串的開(kāi)頭時(shí),如col LIKE 'foo%'或col ~ '^foo',索引才會(huì)生效,否則將會(huì)執(zhí)行全表掃描,如:col LIKE '%bar'。
2. Hash:
CREATE INDEX name ON table USING hash (column);
散列(Hash)索引只能處理簡(jiǎn)單的等于比較。當(dāng)索引列使用等于操作符進(jìn)行比較時(shí),查詢(xún)規(guī)劃器會(huì)考慮使用散列索引。
這里需要額外說(shuō)明的是,PostgreSQL散列索引的性能不比B-Tree索引強(qiáng),但是散列索引的尺寸和構(gòu)造時(shí)間則更差。另外,由于散列索引操作目前沒(méi)有記錄WAL日志,因此一旦發(fā)生了數(shù)據(jù)庫(kù)崩潰,我們將不得不用REINDEX重建散列索引。
3. GiST:
GiST索引不是一種單獨(dú)的索引類(lèi)型,而是一種架構(gòu),可以在該架構(gòu)上實(shí)現(xiàn)很多不同的索引策略。從而可以使GiST索引根據(jù)不同的索引策略,而使用特定的操作符類(lèi)型。
4. GIN:
GIN索引是反轉(zhuǎn)索引,它可以處理包含多個(gè)鍵的值(比如數(shù)組)。與GiST類(lèi)似,GIN同樣支持用戶(hù)定義的索引策略,從而可以使GIN索引根據(jù)不同的索引策略,而使用特定的操作符類(lèi)型。作為示例,PostgreSQL的標(biāo)準(zhǔn)發(fā)布中包含了用于一維數(shù)組的GIN操作符類(lèi)型,如:、=、等。
二、復(fù)合索引:
PostgreSQL中的索引可以定義在數(shù)據(jù)表的多個(gè)字段上,如:
CREATE TABLE test2 (
major int,
minor int,
name varchar
}
CREATE INDEX test2_mm_idx ON test2 (major, minor);
1. B-Tree類(lèi)型的復(fù)合索引:
在B-Tree類(lèi)型的復(fù)合索引中,該索引字段的任意子集均可用于查詢(xún)條件,不過(guò),只有當(dāng)復(fù)合索引中的第一個(gè)索引字段(最左邊)被包含其中時(shí),才可以獲得最高效率。
2. GiST類(lèi)型的復(fù)合索引:
在GiST類(lèi)型的復(fù)合索引中,只有當(dāng)?shù)谝粋€(gè)索引字段被包含在查詢(xún)條件中時(shí),才能決定該查詢(xún)會(huì)掃描多少索引數(shù)據(jù),而其他索引字段上的條件只是會(huì)限制索引返回的條目。假如第一個(gè)索引字段上的大多數(shù)數(shù)據(jù)都有相同的鍵值,那么此時(shí)應(yīng)用GiST索引就會(huì)比較低效。
3. GIN類(lèi)型的復(fù)合索引:
與B-Tree和GiST索引不同的是,GIN復(fù)合索引不會(huì)受到查詢(xún)條件中使用了哪些索引字段子集的影響,無(wú)論是哪種組合,都會(huì)得到相同的效率。
使用復(fù)合索引應(yīng)該謹(jǐn)慎。在大多數(shù)情況下,單一字段上的索引就已經(jīng)足夠了,并且還節(jié)約時(shí)間和空間。除非表的使用模式非常固定,否則超過(guò)三個(gè)字段的索引幾乎沒(méi)什么用處。
三、組合多個(gè)索引:
PostgreSQL可以在查詢(xún)時(shí)組合多個(gè)索引(包括同一索引的多次使用),來(lái)處理單個(gè)索引掃描不能實(shí)現(xiàn)的場(chǎng)合。與此同時(shí),系統(tǒng)還可以在多個(gè)索引掃描之間組成AND和OR的條件。比如,一個(gè)類(lèi)似WHERE x = 42 OR x = 47 OR x = 53 OR x = 99的查詢(xún),可以被分解成四個(gè)獨(dú)立的基于x字段索引的掃描,每個(gè)掃描使用一個(gè)查詢(xún)子句,之后再將這些掃描結(jié)果OR在一起并生成最終的結(jié)果。另外一個(gè)例子是,如果我們?cè)趚和y上分別存在獨(dú)立的索引,那么一個(gè)類(lèi)似WHERE x = 5 AND y = 6的查詢(xún),就會(huì)分別基于這兩個(gè)字段的索引進(jìn)行掃描,之后再將各自掃描的結(jié)果進(jìn)行AND操作并生成最終的結(jié)果行。
為了組合多個(gè)索引,系統(tǒng)掃描每個(gè)需要的索引,然后在內(nèi)存里組織一個(gè)BITMAP,它將給出索引掃描出的數(shù)據(jù)在數(shù)據(jù)表中的物理位置。然后,再根據(jù)查詢(xún)的需要,把這些位圖進(jìn)行AND或者OR的操作并得出最終的BITMAP。最后,檢索數(shù)據(jù)表并返回?cái)?shù)據(jù)行。表的數(shù)據(jù)行是按照物理順序進(jìn)行訪問(wèn)的,因?yàn)檫@是位圖的布局,這就意味著任何原來(lái)的索引的排序都將消失。如果查詢(xún)中有ORDER BY子句,那么還將會(huì)有一個(gè)額外的排序步驟。因?yàn)檫@個(gè)原因,以及每個(gè)額外的索引掃描都會(huì)增加額外的時(shí)間,這樣規(guī)劃器有時(shí)候就會(huì)選擇使用簡(jiǎn)單的索引掃描,即使有多個(gè)索引可用也會(huì)如此。
四、唯一索引:
CREATE UNIQUE INDEX name ON table (column [, ...]);
五、表達(dá)式索引:
表達(dá)式索引主要用于在查詢(xún)條件中存在基于某個(gè)字段的函數(shù)或表達(dá)式的結(jié)果與其他值進(jìn)行比較的情況,如:
SELECT * FROM test1 WHERE lower(col1) = 'value';
此時(shí),如果我們僅僅是在col1字段上建立索引,那么該查詢(xún)?cè)趫?zhí)行時(shí)一定不會(huì)使用該索引,而是直接進(jìn)行全表掃描。如果該表的數(shù)據(jù)量較大,那么執(zhí)行該查詢(xún)也將會(huì)需要很長(zhǎng)時(shí)間。解決該問(wèn)題的辦法非常簡(jiǎn)單,在test1表上建立基于col1字段的表達(dá)式索引,如:
CREATE INDEX test1_lower_col1_idx ON test1 (lower(col1));
SELECT * FROM people WHERE (first_name || ' ' || last_name) = 'John Smith';
和上面的例子一樣,盡管我們可能會(huì)為first_name和last_name分別創(chuàng)建獨(dú)立索引,或者是基于這兩個(gè)字段的復(fù)合索引,在執(zhí)行該查詢(xún)語(yǔ)句時(shí),這些索引均不會(huì)被使用,該查詢(xún)能夠使用的索引只有我們下面創(chuàng)建的表達(dá)式索引。
CREATE INDEX people_names ON people ((first_name || ' ' || last_name));
CREATE INDEX命令的語(yǔ)法通常要求在索引表達(dá)式周?chē)鷷?shū)寫(xiě)圓括弧,就像我們?cè)诘诙€(gè)例子里顯示的那樣。如果表達(dá)式只是一個(gè)函數(shù)調(diào)用,那么可以省略,就像我們?cè)诘谝粋€(gè)例子里顯示的那樣。
從索引維護(hù)的角度來(lái)看,索引表達(dá)式要相對(duì)低效一些,因?yàn)樵诓迦霐?shù)據(jù)或者更新數(shù)據(jù)的時(shí)候,都必須為該行計(jì)算表達(dá)式的結(jié)果,并將該結(jié)果直接存儲(chǔ)到索引里。然而在查詢(xún)時(shí),PostgreSQL就會(huì)把它們看做WHERE idxcol = 'constant',因此搜索的速度等效于基于簡(jiǎn)單索引的查詢(xún)。通常而言,我們只是應(yīng)該在檢索速度比插入和更新速度更重要的場(chǎng)景下使用表達(dá)式索引。
六、部分索引:
部分索引(partial index)是建立在一個(gè)表的子集上的索引,而該子集是由一個(gè)條件表達(dá)式定義的(叫做部分索引的謂詞)。該索引只包含表中那些滿足這個(gè)謂詞的行。
由于不是在所有的情況下都需要更新索引,因此部分索引會(huì)提高數(shù)據(jù)插入和數(shù)據(jù)更新的效率。然而又因?yàn)椴糠炙饕绕胀ㄋ饕。虼丝梢愿玫奶岣叽_實(shí)需要索引部分的查詢(xún)效率。見(jiàn)以下三個(gè)示例:
1. 索引字段和謂詞條件字段一致:
CREATE INDEX access_log_client_ip_ix ON access_log(client_ip)
WHERE NOT (client_ip inet '192.168.100.0' AND client_ip inet '192.168.100.255');
下面的查詢(xún)將會(huì)用到該部分索引:
SELECT * FROM access_log WHERE url = '/index.html' AND client_ip = inet '212.78.10.32';
下面的查詢(xún)將不會(huì)用該部分索引:
一個(gè)不能使用這個(gè)索引的查詢(xún)可以是
SELECT * FROM access_log WHERE client_ip = inet '192.168.100.23';
2. 索引字段和謂詞條件字段不一致:
PostgreSQL支持帶任意謂詞的部分索引,唯一的約束是謂詞的字段也要來(lái)自于同樣的數(shù)據(jù)表。注意,如果你希望你的查詢(xún)語(yǔ)句能夠用到部分索引,那么就要求該查詢(xún)語(yǔ)句的條件部分必須和部分索引的謂詞完全匹配。 準(zhǔn)確說(shuō),只有在PostgreSQL能夠識(shí)別出該查詢(xún)的WHERE條件在數(shù)學(xué)上涵蓋了該索引的謂詞時(shí),這個(gè)部分索引才能被用于該查詢(xún)。
CREATE INDEX orders_unbilled_index ON orders(order_nr) WHERE billed is not true;
下面的查詢(xún)一定會(huì)用到該部分索引:
SELECT * FROM orders WHERE billed is not true AND order_nr 10000;
那么對(duì)于如下查詢(xún)呢?
SELECT * FROM orders WHERE billed is not true AND amount 5000.00;
這個(gè)查詢(xún)將不像上面那個(gè)查詢(xún)這么高效,畢竟查詢(xún)的條件語(yǔ)句中沒(méi)有用到索引字段,然而查詢(xún)條件"billed is not true"卻和部分索引的謂詞完全匹配,因此PostgreSQL將掃描整個(gè)索引。這樣只有在索引數(shù)據(jù)相對(duì)較少的情況下,該查詢(xún)才能更有效一些。
下面的查詢(xún)將不會(huì)用到部分索引。
SELECT * FROM orders WHERE order_nr = 3501;
3. 數(shù)據(jù)表子集的唯一性約束:
CREATE TABLE tests (
subject text,
target text,
success boolean,
...
);
CREATE UNIQUE INDEX tests_success_constraint ON tests(subject, target) WHERE success;
該部分索引將只會(huì)對(duì)success字段值為true的數(shù)據(jù)進(jìn)行唯一性約束。在實(shí)際的應(yīng)用中,如果成功的數(shù)據(jù)較少,而不成功的數(shù)據(jù)較多時(shí),該實(shí)現(xiàn)方法將會(huì)非常高效。
七、檢查索引的使用:
見(jiàn)以下四條建議:
1. 總是先運(yùn)行ANALYZE。
該命令將會(huì)收集表中數(shù)值分布狀況的統(tǒng)計(jì)。在估算一個(gè)查詢(xún)返回的行數(shù)時(shí)需要這個(gè)信息,而規(guī)劃器則需要這個(gè)行數(shù)以便給每個(gè)可能的查詢(xún)規(guī)劃賦予真實(shí)的開(kāi)銷(xiāo)值。如果缺乏任何真實(shí)的統(tǒng)計(jì)信息,那么就會(huì)使用一些缺省數(shù)值,這樣肯定是不準(zhǔn)確的。因此,如果還沒(méi)有運(yùn)行ANALYZE就檢查一個(gè)索引的使用狀況,那將會(huì)是一次失敗的檢查。
2. 使用真實(shí)的數(shù)據(jù)做實(shí)驗(yàn)。
用測(cè)試數(shù)據(jù)填充數(shù)據(jù)表,那么該表的索引將只會(huì)基于測(cè)試數(shù)據(jù)來(lái)評(píng)估該如何使用索引,而不是對(duì)所有的數(shù)據(jù)都如此使用。比如從100000行中選1000行,規(guī)劃器可能會(huì)考慮使用索引,那么如果從100行中選1行就很難說(shuō)也會(huì)使用索引了。因?yàn)?00行的數(shù)據(jù)很可能是存儲(chǔ)在一個(gè)磁盤(pán)頁(yè)面中,然而沒(méi)有任何查詢(xún)規(guī)劃能比通過(guò)順序訪問(wèn)一個(gè)磁盤(pán)頁(yè)面更加高效了。與此同時(shí),在模擬測(cè)試數(shù)據(jù)時(shí)也要注意,如果這些數(shù)據(jù)是非常相似的數(shù)據(jù)、完全隨機(jī)的數(shù)據(jù),或按照排序順序插入的數(shù)據(jù),都會(huì)令統(tǒng)計(jì)信息偏離實(shí)際數(shù)據(jù)應(yīng)該具有的特征。
3. 如果索引沒(méi)有得到使用,那么在測(cè)試中強(qiáng)制它的使用也許會(huì)有些價(jià)值。有一些運(yùn)行時(shí)參數(shù)可以關(guān)閉各種各樣的查詢(xún)規(guī)劃。
4. 強(qiáng)制使用索引用法將會(huì)導(dǎo)致兩種可能:一是系統(tǒng)選擇是正確的,使用索引實(shí)際上并不合適,二是查詢(xún)計(jì)劃的開(kāi)銷(xiāo)計(jì)算并不能反映現(xiàn)實(shí)情況。這樣你就應(yīng)該對(duì)使用和不使用索引的查詢(xún)進(jìn)行計(jì)時(shí),這個(gè)時(shí)候EXPLAIN ANALYZE命令就很有用了。
網(wǎng)站名稱(chēng):postgresql排序的簡(jiǎn)單介紹
文章出自:http://www.ekvhdxd.cn/article2/dscsooc.html
成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供靜態(tài)網(wǎng)站、ChatGPT、建站公司、網(wǎng)站內(nèi)鏈、面包屑導(dǎo)航、服務(wù)器托管
聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶(hù)投稿、用戶(hù)轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請(qǐng)盡快告知,我們將會(huì)在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如需處理請(qǐng)聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時(shí)需注明來(lái)源: 創(chuàng)新互聯(lián)