Like Share Discussion Bookmark Smile

J.J. Huang   2020-05-14   Java 阿里Java開發手冊   瀏覽次數:次   DMCA.com Protection Status

《阿里Java開發手冊》 | MySQL 資料庫 - 索引規約

【強制】業務上具有唯一特性的欄位,即使是組合欄位,也必須建成唯一索引。
說明:不要以為唯一索引影響了 insert 速度,這個速度損耗可以忽略,但提高查找速度是明顯的;另外,即使在應用層做了非常完善的校驗控制,只要沒有唯一索引,根據墨菲定律,必然有髒資料產生。


【強制】超過三個表禁止 join。需要 join 的欄位,資料類型保持絕對一致;多表關聯查詢時,保證被關聯的欄位需要有索引。
說明:即使雙表 join 也要注意表索引、SQL 性能。


【強制】在 varchar 欄位上建立索引時,必須指定索引長度,沒必要對全欄位建立索引,根據實際文本區分度決定索引長度。
說明:索引的長度與區分度是一對矛盾體,一般對字符串類型資料,長度為 20 的索引,區分度會高達 90% 以上,可以使用 count(distinct left(列名, 索引長度))/count(*) 的區分度來確定。


【強制】頁面搜索嚴禁左模糊或者全模糊,如果需要請走搜索引擎來解決。
說明:索引文件具有 B-Tree 的最左前綴匹配特性,如果左邊的值未確定,那麼無法使用此索引。


【推薦】如果有 order by 的場景,請注意利用索引的有序性。 order by 最後的欄位是組合索引的一部分,並且放在索引組合順序的最後,避免出現 file_sort 的情況,影響查詢性能。
正例:where a=? and b=? order by c; 索引:a_b_c
反例:索引如果存在範圍查詢,那麼索引有序性無法利用,如:WHERE a>10 ORDER BY b; 索引a_b 無法排序。


【推薦】利用覆蓋索引來進行查詢操作,避免回表。
說明:如果一本書需要知道第 11 章是什麼標題,會翻開第 11 章對應的那一頁嗎?目錄瀏覽一下就好,這個目錄就是起到覆蓋索引的作用。
正例:能夠建立索引的種類分為主鍵索引、唯一索引、普通索引三種,而覆蓋索引只是一種查詢的一種效果,用 explain 的結果,extra 列會出現:using index。


【推薦】利用延遲關聯或者子查詢優化超多分頁場景。
說明:MySQL 並不是跳過 offset 行,而是取 offset+N 行,然後返回放棄前 offset 行,返回 N 行,那當 offset 特別大的時候,效率就非常的低下,要麼控制返回的總頁數,要麼對超過特定閾值的頁數進行 SQL 改寫。
正例:先快速定位需要獲取的 id 段,然後再關聯:
SELECT a.* FROM 表 1 a, (select id from 表 1 where 條件 LIMIT 100000,20 ) b where a.id=b.id


【推薦】SQL 性能優化的目標:至少要達到 range 級別,要求是 ref 級別,如果可以是 consts 最好。
說明:

  • consts 單表中最多只有一個匹配行(主鍵或者唯一索引),在優化階段即可讀取到資料。
  • ref 指的是使用普通的索引(normal index)。
  • range 對索引進行範圍檢索。

反例:explain 表的結果,type=index,索引物理文件全掃描,速度非常慢,這個 index 級別比較 range 還低,與全表掃描是小巫見大巫。


【推薦】建組合索引的時候,區分度最高的在最左邊。
正例:如果 where a=? and b=?,a 列的幾乎接近於唯一值,那麼只需要單建 idx_a 索引即可。
說明:存在非等號和等號混合判斷條件時,在建索引時,請把等號條件的列前置。如:where c>? and d=? 那麼即使 c 的區分度更高,也必須把 d 放在索引的最前列,即建立組合索引 idx_d_c。


【推薦】防止因欄位類型不同造成的隱式轉換,導致索引失效。


【參考】建立索引時避免有如下極端誤解:

  • 索引寧濫勿缺。認為一個查詢就需要建一個索引。
  • 吝嗇索引的建立。認為索引會消耗空間、嚴重拖慢記錄的更新以及行的新增速度。
  • 抵制惟一索引。認為惟一索引一律需要在應用層通過“先查後插”方式解決。

心得

看完這篇「索引規約」後,索引在資料查詢的時候是非常重要的,尤其是在查詢大量資料的表時候,更為明顯。當然並不是索引越多越好。記得以前的實務經驗還有因為索引造成搜尋速度變慢,解決辦法是重建索引。

至於其他提到的幾點,因為我沒有太多這方面的實作和研究,可能不能體會出它的差異,這部分會盡量針對其規約去做開發。

結語

文章越看越多,技術越學越多,就會發現自己的不足;技術學到後面都會想要將基礎再重新在打得更加扎實。

以前在開發覺得理所當然的事情,例如:命名規則、命名規範,照著別人怎麼說就怎麼做的想法,並沒有好好去想為什麼要這樣設計和規範。
於是乎同事們推薦《阿里巴巴Java開發手冊》來做閱讀,書中提到種種規範《正確範例》、《錯誤範例》還有解釋定義說明;我相信在閱讀完這一系列後,一定會更加扎實且實在。

如對此書有興趣,建議去購買官方認證的書籍,給予官方支持。

註:如有侵權,通知即刪。


註:以上參考了
Alibaba-Java-Coding-Guidelines Github
Alibaba-Java-Coding-Guidelines English Version