再谈PHP开发者常犯的10个MySQL错误

fmms 12年前
     <p>文章来源:<a href="/misc/goto?guid=4958326172032071916" target="_blank">http://www.liheran.com/?p=387</a></p>    <p>最近看到一篇文章:《<a href="/misc/goto?guid=4958326172812362783">PHP开发者常犯的10个MySQL错误</a>》,发现文中不少内容陈旧,随着时间推移技术发展变化而变得不适用。为了防止误导新手,特本着与时俱进的精神写出此文,绝非对原文作者的不尊重。</p>    <p><span style="font-weight:bold;">1.使用MyISAM而不是InnoDB</span><br /> 完全错误,反驳理由:<br /> 首先原文说MyISAM是默认使用的,而实际上到了MySQL 5.5.x,InnoDB已经成为了默认的表引擎。<br /> <br /> 另外,简单的使用InnoDB不是解决所有问题的方法,盲目的使用甚至会使应用性能下降10%乃至40%。<br /> <br /> 最佳方法还是针对具体业务具体处理,例如论坛中版块表,新闻分类表,各种码表等长时间不操作的表,还是要用性能优异的MyISAM引擎。<br /> 而需要用到事务处理的例如用户、账目、流水等严格要求数据完整性和时序性的,则需要用InnoDB引擎,并且应用也要用好事务处理机制。当然,事务处理必然要带来大量的性能损耗,但是这在简单高并发应用上是必须的。<br /> <br /> 最后,外键约束在公共web互联网应用上一般是不用的,因为他会严重影响性能。数据完整性还是靠程序员或者应用架构本身的健壮来维护。而正规的第三范式只是在企业内部MIS系统和12306这种网站上使用。<br /> <br style="font-weight:bold;" /> <span style="font-weight:bold;">2.使用PHP的mysql方法</span><br /> 不完全错,但要酌情选用:<br /> mysqli固然好,但是不是所有的服务器都为PHP编译了mysqli的支持。<br /> 当你的应用如果是能确定只用自己部署的服务器,而应用也是完全自己开发,则mysqli是最好的选择。<br /> 但是一旦你的应用有可能部署在虚拟主机或者由其他人部署(例如分布式项目),还是老老实实使用mysql函数集吧,好好封装一下或者使用成熟框架杜绝sql注入。<br /> <br style="font-weight:bold;" /> <span style="font-weight:bold;">3.不过滤用户输入</span><br /> 这一点不用说了,要么MagicQuote,要么选用成熟框架。sql注入老话题了。<br /> <br style="font-weight:bold;" /> <span style="font-weight:bold;">4.不使用UTF-8</span><br /> 大部分情况下对,但也要认真考虑:<br /> 要知道,一个UTF-8字符占3个字节,所以比GBK等其他编码的文件大33%。换句话说,相同的网页用UTF-8编码如果是100KB,那么换成GBK 编码则只有66KB。所以即便你的PHP确定要用UTF-8,那么前端页面也要根据情况选择需要的编码。但是,如果PHP用UTF-8,前端模版是 GBK,再加上模版引擎不强大,那么转码工作够你受的。所以尽可能的选用自己需要的编码,而不是简单的选择UTF-8了事。<br /> 最后啰嗦一句:UTF-8下:strlen("我")=3,而GBK下:strlen("我")=2<br /> <br /> <span style="font-weight:bold;">5.该用SQL的地方使用PHP</span><br /> 同样酌情考虑:<br /> 例如,有些人习惯在建表时,默认值填写CURRENT_TIMESTAMP,用来达到注册时间、发帖时间的效果。 或者在时间判断的SQL语句中,写类似SELECT x FROM tab1 WHERE regdate < UNIX_TIMESTAMP()。那么我只能说,你为系统埋下了很隐蔽的BUG。因为数据库和应用往往不在同一台机器上,时间很容易出现偏差。当你一套 应用的时间参照不准确时,就会出现很大的问题。<br /> 正确做法是:不要使用MySQL的任何时间函数,而是在应用里计算时间。如果是分布式应用,一定要有时间服务器来统一管理时间。<br /> 而文中说的一些MySQL数学函数 ,也是要慎用。因为在大型应用中,数据库的负担往往是最大的,而复杂的WHERE语句又是造成慢查询的元凶。所以,要把计算尽可能的放在廉价的、不影响全局稳定的应用服务器上,而不是核心数据库上。<br /> <br /> <span style="font-weight:bold;">6.不优化查询</span><br /> 这点也不用说了,大型应用上甚至不允许使用各种JOIN,哪怕生写两条查询,查回来在用PHP合并数据。<br /> <br /> <span style="font-weight:bold;">7.使用错误的数据类型</span><br /> INT,TinyINT,VARCHAR,CHAR,TEXT这些字段类型的合理选用无可厚非。<br /> 而Date、DateTime、TIMESTAMP这三种类型,在大型应用中是绝对不可以使用的,而是要用INT(10) UNSIGNED代替。<br /> 一个是性能,另外就是应用中尤其是PHP对UNIX_TIMESTAMP时间戳的转化实在太方便了。用Date要输出各种时间格式反而麻烦。<br /> <br style="font-weight:bold;" /> <span style="font-weight:bold;">8.在SELECT查询中使用*</span><br /> 共勉<br /> <br /> <span style="font-weight:bold;">9.索引不足或者过度索引</span><br /> 索引是必须的,但是如果索引都解决不了的查询,考虑memcache或者nosql解决方案吧。<br /> <br /> <span style="font-weight:bold;">10.不备份</span><br /> 这条是作者凑数么?<br /> <br style="font-weight:bold;" /> <span style="font-weight:bold;">11.另外:不考虑其他数据库</span><br /> 这条相当正确。应用中不仅要针对应用选择其他数据库,甚至还要针对具体的业务类型,在同一套应用中并行使用多种数据库。哪怕不是数据库,而是其他各种缓存、内存存储等解决方案。</p>