2018年,让你的数据库变更快的十个建议
1、小心设计数据库
第一个技巧也许看来理所当然,但事实上大部分数据库的问题都来自于设计不好的数据库结构。
譬如我曾经遇见过将客户端信息和支付信息储存在同一个数据库列中的例子。对于系统和用数据库的开发者来说,这很糟糕。
新建数据库时,应当将信息储存在不同的表里,采用标准的命名方式,并采用主键。
来源: http://www.simple-talk.com/sql/database-administration/ten-common-database-design-mistakes/
2、清楚你需要优化的地方
如果你想优化某个查询语句,清楚的知道这个语句的结果是非常有帮助的。采用 EXPLAIN 语句,你将获得很多有用的信息,下面来看个例子:
- EXPLAIN SELECT * FROM ref_table,other_table WHERE ref_table.key_column=other_table.column;
来源: http://dev.mysql.com/doc/refman/5.0/en/using-explain.html
3、最快的查询语句… 是那些你没发送的语句
每次你向数据库发送一条语句,你都会用掉很多服务器资源。所以在很高流量的网站中,最好的方法是将你的查询语句缓存起来。
有许多种缓存语句的方法,下面列出了几个:
AdoDB: AdoDB 是一个 PHP 的数据库简化库。使用它,你可以选用不同的数据库系统 (MySQL, PostGreSQL, Interbase 等等),而且它就是为了速度而设计的。AdoDB 提供了简单但强大的缓存系统。还有,AdoDB 拥有 BSD 许可,你可以在你的项目中免费使用它。对于商业化的项目,它也有 LGPL 许可。
Memcached:Memcached 是一种分布式内存缓存系统,它可以减轻数据库的负载,来加速基于动态数据库的网站。
CSQL Cache: CSQL 缓存是一个开源的数据缓存架构。我没有试过它,但它看起来非常的棒。
4、不要 select 你不需要的
获取想要的数据,一种非常常见的方式就是采用 * 字符,这会列出所有的列。
- SELECT * FROM wp_posts;
然而,你应该仅列出你需要的列,如下所示。如果在一个非常小型的网站,譬如,一分钟一个用户访问,可能没有什么分别。然而如果像 Cats Who Code 这样大流量的网站,这就为数据库省了很多事。
- SELECT title, excerpt, author FROM wp_posts;
5、采用 LIMIT
仅获得某个特定行数的数据是非常常见的。譬如博客每页只显示十篇文章。这时,你应该使用 LIMIT,来限定你想选定的数据的行数。
如果没有 LIMIT,表有 100,000 行数据,你将会遍历所有的行数,这对于服务器来说是不必要的负担。
- SELECT title, excerpt, author FROM wp_posts LIMIT 10;
6、避免循环中的查询
当在 PHP 中使用 SQL 时,可以将 SQL 放在循环语句中。但这么做给你的数据库增加了负担。
下面的例子说明了 “在循环语句中嵌套查询语句” 的问题:
- foreach ($display_order as $id => $ordinal){
- $sql = "UPDATE categories SET display_order = $ordinal WHERE id = $id";
- mysql_query($sql);
- }
你可以这么做:
- UPDATE categories
- SET display_order = CASE id
- WHEN 1 THEN 3
- WHEN 2 THEN 4
- WHEN 3 THEN 5
- END WHERE id IN (1,2,3)
来源: http://www.karlrixon.co.uk/articles/sql/update-multiple-rows-with-different-values-and-a-single-sql-query/
7、采用 join 来替换子查询
程序员可能会喜欢用子查询,甚至滥用。下面的子查询非常有用:
- SELECT a.id,
- (SELECT MAX(created)
- FROM posts
- WHERE author_id = a.id)
- AS latest_post FROM authors a
虽然子查询很有用,但 join 语句可以替换它,join 语句执行起来更快。
- SELECT a.id, MAX(p.created) AS latest_post
- FROM authors a
- INNER JOIN posts p
- ON (a.id = p.author_id)
- GROUP BY a.id
来源: http://20bits.com/articles/10-tips-for-optimizing-mysql-queries-that-dont-suck/
8、小心使用通配符
通配符非常好用,在搜索数据的时候可以用通配符来代替一个或多个字符。我不是说不能用,而是,应该小心使用,并且不要使用全词通配符 (full wildcard),前缀通配符或后置通配符可以完成相同的任务。
事实上,在百万数量级的数据上采用全词通配符来搜索会让你的数据库当机。
- #Full wildcard
- SELECT * FROM TABLE WHERE COLUMN LIKE '%hello%'; #Postfix wildcard
- SELECT * FROM TABLE WHERE COLUMN LIKE 'hello%'; #Prefix wildcard
- SELECT * FROM TABLE WHERE COLUMN LIKE '%hello';
来源: http://hungred.com/useful-information/ways-optimize-sql-queries/
9、采用 UNION 来代替 OR
下面的例子采用 OR 语句来:
- SELECT * FROM a, b WHERE a.p = b.q or a.x = b.y;
UNION 语句,你可以将 2 个或更多 select 语句的结果拼在一起。下面的例子返回的结果同上面的一样,但是速度要快些:
- SELECT * FROM a, b WHERE a.p = b.q
- UNION
- SELECT * FROM a, b WHERE a.x = b.y
来源: http://www.bcarter.com/optimsql.htm
10. 使用索引
数据库索引和你在图书馆中见到的索引类似:能让你更快速的获取想要的信息,正如图书馆中的索引能让读者更快的找到想要的书一样。
可以在一个列上创建索引,也可以在多个列上创建。索引是一种数据结构,它将表中的一列或多列的值以特定的顺序组织起来。
下面的语句在 Product 表的 Model 列上创建索引。这个索引的名字叫作 idxModel
- CREATE INDEX idxModel ON Product (Model);
责任编辑:售电衡衡
-
碳中和战略|赵英民副部长致辞全文
2020-10-19碳中和,碳排放,赵英民 -
两部门:推广不停电作业技术 减少停电时间和停电次数
2020-09-28获得电力,供电可靠性,供电企业 -
国家发改委、国家能源局:推广不停电作业技术 减少停电时间和停电次数
2020-09-28获得电力,供电可靠性,供电企业
-
碳中和战略|赵英民副部长致辞全文
2020-10-19碳中和,碳排放,赵英民 -
深度报告 | 基于分类监管与当量协同的碳市场框架设计方案
2020-07-21碳市场,碳排放,碳交易 -
碳市场让重庆能源转型与经济发展并进
2020-07-21碳市场,碳排放,重庆
-
两部门:推广不停电作业技术 减少停电时间和停电次数
2020-09-28获得电力,供电可靠性,供电企业 -
国家发改委、国家能源局:推广不停电作业技术 减少停电时间和停电次数
2020-09-28获得电力,供电可靠性,供电企业 -
2020年二季度福建省统调燃煤电厂节能减排信息披露
2020-07-21火电环保,燃煤电厂,超低排放
-
四川“专线供电”身陷违法困境
2019-12-16专线供电 -
我国能源替代规范法律问题研究(上)
2019-10-31能源替代规范法律 -
区域链结构对于数据中心有什么影响?这个影响是好是坏呢!