SQL优化

jopen 14年前

做了很多年有关数据库的开发工作，现在把我对sql优化的一些经验分享下。(由于我主要使用mysql，对其它结构化数据库不太熟悉，所以可能具有片面性，欢迎拍砖)

sql优化的方面：

1、设计好的数据库结构

2、分表与分区

3、创建正确的索引

4、减少访问的次数

5、减少不必要的返回数据

6、书写高效的sql

1、设计好的数据库结构

好的数据库结构不同的业务有不同的看法，这里主要说一条，好的数据库设计应高保留重构的可能性。

2、分表与分区

(1)、分表

分表就是将一张大表分成多张小表。

分表的作用是提高数据库的读写性能。

(2)、分区

分区是将一张表分成多个区块。多个区块可以在不同磁盘上。

分区的作用是提高磁盘的读写性能。

3、创建正确的索引

要创建正确的索引，有几点是值得注意的：

(1)、根据业务中调用频繁的sql的where语句建立索引。

(2)、索引的列的大小会对影响性能

(3)、联合索引中索引列的顺序是很关键的

(4)、索引并不是越多越好

4、减少访问的次数

如果你需要对1000条数据进行处理，可能的情况下当然是一次取出来再处理，而不是取一条处理一条。减少了访问次数也就减少了磁盘I/O，在很多应用里面，磁盘I/O都是性能的瓶颈。

5、减少不必要的返回数据

减少不必要的返回数据既指返回数据的条数，也指返回的数据字段。减少不必要的返回数据也就减少了网络传输时间和磁盘I/O。

6、书写高效的sql

(1)、尽量不要使用IS NULL或者IS NOT NULL

因为索引是不索引空的，因此他们将不使用索引。

(2)、尽量不要使用NOT

NOT也是不能使用索引的。

(3)、用EXISTS替代IN、用NOT EXISTS替代NOT IN

IN 是把外表和内表作hash连接，而EXISTS是对外表作loop循环，每次loop循环再对内表进行查询。因此使用EXISTS的时候不要忘了在子查询中加上外表字段与子表字段的联合条件，否则效率同样会很低。IN与EXISTS同样与两张表的数据量有一定的关系。

NOT EXISTS使用全表扫描，效率很低。

(4)、LIKE操作符

尽量不要使用'%www'的这种通配符前置的查询，因为不会使用索引。

(5)、用UNION ALL 替代 UNION

UNION需要排序删除重复，UNION ALL仅仅合并。

(6)、尽量少用OR

(7)、WHERE后面条件的顺序

前面的条件尽量减少数据，还有顺序也与索引有关。虽然新的数据库引擎会做一些优化，但是同样可以减少引擎优化的时间。