↖  Java開發手冊-阿里巴巴-嵩山版-17:(二) 索引规约..


-loading- -loading- -loading-

2020-12-26 , 1530 , 104 , 178

听音频 🔊 . 看视频 🎦

五、(二) MySQL索引规约


 1. 【强制】业务上具有唯一特性的字段,即使是组合字段,也必须建成唯一索引。 

说明:不要以为唯一索引影响了insert速度,这个速度损耗可以忽略,但提高查找速度是明显的;另外,即使在应用层做了非常完善的校验控制,只要没有唯一索引,根据墨菲定律,必然有脏数据产生。

2. 【强制】超过三个表禁止join。需要join的字段,数据类型保持绝对一致;多表关联查询时,保证被关联的字段需要有索引。 

说明:即使双表join也要注意表索引、SQL性能。

3. 【强制】在varchar字段上建立索引时,必须指定索引长度,没必要对全字段建立索引,根据实际文本区分度决定索引长度。

说明:索引的长度与区分度是一对矛盾体,一般对字符串类型数据,长度为20的索引,区分度会高达90%以上,可以使用count(distinct left(列名, 索引长度))/count(*)的区分度来确定。


4. 【强制】页面搜索严禁左模糊或者全模糊,如果需要请走搜索引擎来解决。 

说明:索引文件具有B-Tree的最左前缀匹配特性,如果左边的值未确定,那么无法使用此索引。

5. 【推荐】如果有order by的场景,请注意利用索引的有序性。order by 最后的字段是组合索引的一部分,并且放在索引组合顺序的最后,避免出现file_sort的情况,影响查询性能。 

正例:

where a=? and b=? order by c; 索引:a_b_c 

反例:

索引如果存在范围查询,那么索引有序性无法利用,如:WHERE a>10 ORDER BY b; 索引a_b无法排序。


6. 【推荐】利用覆盖索引来进行查询操作,避免回表。 

说明:如果一本书需要知道第11章是什么标题,会翻开第11章对应的那一页吗?目录浏览一下就好,这个目录就是起到覆盖索引的作用。 

正例:

能够建立索引的种类分为主键索引、唯一索引、普通索引三种,而覆盖索引只是一种查询的一种效果,用explain的结果,extra列会出现:using index。


7. 【推荐】利用延迟关联或者子查询优化超多分页场景。 

说明:MySQL并不是跳过offset行,而是取offset+N行,然后返回放弃前offset行,返回N行,那当offset特别大的时候,效率就非常的低下,要么控制返回的总页数,要么对超过特定阈值的页数进行SQL改写。 

正例:

先快速定位需要获取的id段,然后再关联: SELECT t1.* FROM 表1 as t1, (select id from 表1 where 条件 LIMIT 100000,20 ) as t2 where t1.id=t2.id

-loading- -loading--loading-



8. 【推荐】SQL性能优化的目标:至少要达到 range 级别,要求是ref级别,如果可以是consts最好。 说明: 

UfqiLong

1) consts 单表中最多只有一个匹配行(主键或者唯一索引),在优化阶段即可读取到数据。 

2) ref 指的是使用普通的索引(normal index)。 

3) range 对索引进行范围检索。 

反例:

explain表的结果,type=index,索引物理文件全扫描,速度非常慢,这个index级别比较range还低,与全表扫描是小巫见大巫。


9. 【推荐】建组合索引的时候,区分度最高的在最左边。 

正例:

如果where a=? and b=?,a列的几乎接近于唯一值,那么只需要单建idx_a索引即可。 

说明:存在非等号和等号混合判断条件时,在建索引时,请把等号条件的列前置。如:where c>? and d=? 那么即使c的区分度更高,也必须把d放在索引的最前列,即建立组合索引idx_d_c。


10. 【推荐】防止因字段类型不同造成的隐式转换,导致索引失效。

11. 【参考】创建索引时避免有如下极端误解: 

1) 索引宁滥勿缺。认为一个查询就需要建一个索引。 

2) 吝啬索引的创建。认为索引会消耗空间、严重拖慢记录的更新以及行的新增速度。 

3) 抵制惟一索引。认为惟一索引一律需要在应用层通过“先查后插”方式解决。


----

(三)SQL語句


 1. 【强制】不要使用count(列名)或count(常量)来替代count(*),count(*)是SQL92定义的标准统计行数的语法,跟数据库无关,跟NULL和非NULL无关。 

说明:count(*)会统计值为NULL的行,而count(列名)不会统计此列为NULL值的行。


2. 【强制】count(distinct col) 计算该列除NULL之外的不重复行数,注意 count(distinct col1, col2) 如果其中一列全为NULL,那么即使另一列有不同的值,也返回为0。

3. 【强制】当某一列的值全是NULL时,count(col)的返回结果为0,但sum(col)的返回结果为NULL,因此使用sum()时需注意NPE问题。 

正例:

可以使用如下方式来避免sum的NPE问题:SELECT IFNULL(SUM(column), 0) FROM table;


4. 【强制】使用ISNULL()来判断是否为NULL值。 

说明:NULL与任何值的直接比较都为NULL。 

1) NULL<>NULL的返回结果是NULL,而不是false。 

2) NULL=NULL的返回结果是NULL,而不是true。 

3) NULL<>1的返回结果是NULL,而不是true。

反例:

在SQL语句中,如果在null前换行,影响可读性。select * from table where column1 is null and column3 is not null; 而`ISNULL(column)`是一个整体,简洁易懂。从性能数据上分析,`ISNULL(column)`执行效率更快一些。


5. 【强制】代码中写分页查询逻辑时,若count为0应直接返回,避免执行后面的分页语句。

-loading- -loading--loading-


UfqiLong

6. 【强制】不得使用外键与级联,一切外键概念必须在应用层解决。 

说明:(概念解释)学生表中的student_id是主键,那么成绩表中的student_id则为外键。

如果更新学生表中的student_id,同时触发成绩表中的student_id更新,即为级联更新。

外键与级联更新适用于单机低并发,不适合分布式、高并发集群;

级联更新是强阻塞,存在数据库更新风暴的风险;外键影响数据库的插入速度。


7. 【强制】禁止使用存储过程,存储过程难以调试和扩展,更没有移植性。

8. 【强制】数据订正(特别是删除或修改记录操作)时,要先select,避免出现误删除,确认无误才能执行更新语句。


9. 【强制】对于数据库中表记录的查询和变更,只要涉及多个表,都需要在列名前加表的别名(或表名)进行限定。 

说明:对多表进行查询记录、更新记录、删除记录时,如果对操作列没有限定表的别名(或表名),并且操作列在多个表中存在时,就会抛异常。 

正例:

select t1.name from table_first as t1 , table_second as t2 where t1.id=t2.id; 

反例:在某业务中,由于多表关联查询语句没有加表的别名(或表名)的限制,正常运行两年后,最近在某个表中增加一个同名字段,在预发布环境做数据库变更后,线上查询语句出现出1052异常:Column 'name' in field list is ambiguous。


10. 【推荐】SQL语句中表的别名前加as,并且以t1、t2、t3、...的顺序依次命名。 

说明:1)别名可以是表的简称,或者是依照表在SQL语句中出现的顺序,以t1、t2、t3的方式命名。2)别名前加as使别名更容易识别。 

正例:

elect t1.name from table_first as t1, table_second as t2 where t1.id=t2.id;


11. 【推荐】in操作能避免则避免,若实在避免不了,需要仔细评估in后边的集合元素数量,控制在1000个之内。

12. 【参考】因国际化需要,所有的字符存储与表示,均采用utf8字符集,那么字符计数方法需要注意。 说明: 

SELECT LENGTH("轻松工作"); 返回为12 

SELECT CHARACTER_LENGTH("轻松工作"); 返回为4 

如果需要存储表情,那么选择utf8mb4来进行存储,注意它与utf8编码的区别。


13. 【参考】TRUNCATE TABLE 比 DELETE 速度快,且使用的系统和事务日志资源少,但TRUNCATE无事务且不触发trigger,有可能造成事故,故不建议在开发代码中使用此语句。 

说明:TRUNCATE TABLE 在功能上与不带 WHERE 子句的 DELETE 语句相同。



秀丽山川河流风景如画美色迷人

+手冊 +规约 +索引 +嵩山 +正例

本页Url

↖回首页 +当前续 +尾续 +修订 +评论✍️


👍19 仁智互见 👎1
  • 还没有评论. → +评论
  • -loading- -loading- -loading-


    🔗 连载目录

    🤖 智能推荐

    Java開發手冊-阿里巴巴-嵩山版

    诸城竹山、临朐嵩山获评2023年山东省生态旅游区 诸城竹山、临朐嵩山获评2023年山东省生态旅游区 12

    到2035年,嵩山实验室这样建 12

    登封:何以为中?以和为“中”! 10

    接待游客272万人次!登封中秋国庆假期文旅市场超“燃” 接待游客272万人次!登封中秋国庆假期文旅市场超“燃” 3

    “泗洪大米”入选首批《中国农耕农品记忆索引名录》 2

    (寻味中华丨文博)嵩阳书院:古韵悠悠,文风不息 (寻味中华丨文博)嵩阳书院:古韵悠悠,文风不息 2

    “格式化”等于彻底删除文件?NO!NO!NO! “格式化”等于彻底删除文件?NO!NO!NO! 1

    博物馆里的文化年 1

    自由谈/《奥本海默》:另类人物传记电影葛若凡 1

    -loading- -loading- -loading-


    🔥 相关精选

    当下地产行业的真实表现 0

    “泗洪大米”入选首批《中国农耕农品记忆索引名录》 0

    潍坊临朐乡村旅游精品线路获全国推介 潍坊临朐乡村旅游精品线路获全国推介 0

    秸秆处置再引热议,“禁烧令”的成本与收益该怎么算? 0

    全力拼经济 奋战开门红丨河南多地打造夜游新体验 0

    天安门简笔画怎么画(天安门简笔画方法) 0

    老黄再曝惊人语录:LLM幻觉有解,AGI五年内必来! 0

    关于中交海洋建设开发有限公司等13家水运工程设计、施工企业的资质申报材料公示 0

    业主在住宅小区内不得有哪些行为,共同维护小区和谐稳定? 0

    博物馆里的文化年 0

    -loading- -loading- -loading-

     


    + 烟锅 烟锅
    AddToFav   
    新闻 经典 官宣