索引与Order By

眉间皱痕 提交于 2019-12-04 20:26:43

Order By 将对结果进行排序,这里的排序最大的特点是资源密集型,尽管多数时候它同时也是CPU密集型的。
数据库在进行排序时,必须缓冲临时结果,读取到所有输入,并在完整的排序操作后才能产生第一个输出。这些操作要么在内存中就能处理掉,要么需要借助磁盘空间(各RDBMS实现不同),但都避免不了不少的内存消耗,后者更是涉及耗时的磁盘IO。

 

而连接是不同的,它无需缓冲整个中间结果集,中间结果的每一条记录可以立即传递到下一个join操作,连接是流水线操作。

 

索引,特别是B树索引,可以看成是数据的一种有序存储方式。这意味着Order By其实是可以利用索引中的有序数据,这有2层意思,一是Order By可以避免自己排序操作,索引中的数据已经是有序的,二是无需缓冲结果集,可以流水线处理。

 

数据库可以从两个方向读取索引,当索引中的顺序与Order By子句中指定的顺序相反时,不会影响流水线处理。MySQL忽略索引声明中的ASC与DESC修饰。(当索引多列时排序方向的影响可能需要进一步分析)为了适用索引,Order By字段必须包含于Where子句使用的索引中。

 

一些有排序处理的操作也适用,如Group By,虽然SQL标准没有要求,但实际上多数DBMS实现时会在Group By上构建一个临时索引并在此基础上进行排序,所以没有指令时Group By输出可能也是有序的。

易学教程内所有资源均来自网络或用户发布的内容,如有违反法律规定的内容欢迎反馈
该文章没有解决你所遇到的问题?点击提问,说说你的问题,让更多的人一起探讨吧!