mysql 随机选择一条记录

aifeng

2011-11-29

关注关注

mysql随机选择一条记录

博客分类：

数据库

MySQLSQLBlog

转自：

http://hi.baidu.com/why_question_how/blog/item/d3e20a44e8b032046b63e58c.html

MySQL：快速随机选取一条记录的思考

2010年07月14日星期三10:43

MySQL：快速随机选取一条记录的思考

标签：MySQL随机分类：mysql2010-03-0412:23

本文讨论的是如何从MySQL一个数据表中提取一条随机的效率，同时要保证效率最高。

方法一

这是最原始最直观的语法，如下：

SELECT*FROMfooORDERBYRAND()LIMIT1

当数据表中数据量较小时，此方法可行。但当数据量到达一定程度，比如100万数据或以上，就有很大的性能问题。如果你通过EXPLAIN来分析这个语句，会发现虽然MySQL通过建立一张临时表来排序，但由于ORDERBY和LIMIT本身的特性，在排序未完成之前，我们还是无法通过LIMIT来获取需要的记录。亦即，你的记录有多少条，就必须首先对这些数据进行排序。

方法二

看来对于大数据量的随机数据抽取，性能的症结出在ORDERBY上，那么如何避免？方法二提供了一个方案。

首先，获取数据表的所有记录数：

SELECTcount(*)ASnum_rowsFROMfoo

然后，通过对应的后台程序记录下此记录总数（假定为num_rows）。

然后执行：

SELECT*FROMfooLIMIT[0到num_rows之间的一个随机数],1

上面这个随机数的获得可以通过后台程序来完成。此方法的前提是表的ID是连续的或者自增长的。

这个方法已经成功避免了ORDERBY的产生。

方法三

有没有可能不用ORDERBY，用一个SQL语句实现方法二？可以，那就是用JOIN。

SELECT*FROMBarBJOIN(SELECTCEIL(MAX(ID)*RAND())ASIDFROMBar)ASmONB.ID>=m.IDLIMIT1;

此方法实现了我们的目的，同时，在数据量大的情况下，也避免了ORDERBY所造成的所有记录的排序过程，因为通过JOIN里面的SELECT语句实际上只执行了一次，而不是N次（N等于方法二中的num_rows）。而且，我们可以在筛选语句上加上“大于”符号，还可以避免因为ID好不连续所产生的记录为空的现象。

还有更好的方案吗？有待总结。

第二篇文章

转自：

http://blog.csdn.net/zxl315/archive/2008/05/12/2435368.aspx

在mysql中查询5条不重复的数据，使用以下：

SELECT*FROM`table`ORDERBYRAND()LIMIT5

就可以了。但是真正测试一下才发现这样效率非常低。一个15万余条的库，查询5条数据，居然要8秒以上

搜索Google，网上基本上都是查询max(id)*rand()来随机获取数据。

SELECT*

FROM`table`ASt1JOIN(SELECTROUND(RAND()*(SELECTMAX(id)FROM`table`))ASid)ASt2

WHEREt1.id>=t2.id

ORDERBYt1.idASCLIMIT5;

但是这样会产生连续的5条记录。解决办法只能是每次查询一条，查询5次。即便如此也值得，因为15万条的表，查询只需要0.01秒不到。

上面的语句采用的是JOIN，mysql的论坛上有人使用

SELECT*

FROM`table`

WHEREid>=(SELECTFLOOR(MAX(id)*RAND())FROM`table`)

ORDERBYidLIMIT1;

我测试了一下，需要0.5秒，速度也不错，但是跟上面的语句还是有很大差距。总觉有什么地方不正常。

于是我把语句改写了一下。

SELECT*FROM`table`

WHEREid>=(SELECTfloor(RAND()*(SELECTMAX(id)FROM`table`)))

ORDERBYidLIMIT1;

这下，效率又提高了，查询时间只有0.01秒

最后，再把语句完善一下，加上MIN(id)的判断。我在最开始测试的时候，就是因为没有加上MIN(id)的判断，结果有一半的时间总是查询到表中的前面几行。

完整查询语句是：

SELECT*FROM`table`

WHEREid>=(SELECTfloor(RAND()*((SELECTMAX(id)FROM`table`)-(SELECTMIN(id)FROM`table`))+(SELECTMIN(id)FROM`table`)))

ORDERBYidLIMIT1;

SELECT*

FROM`table`ASt1JOIN(SELECTROUND(RAND()*((SELECTMAX(id)FROM`table`)-(SELECTMIN(id)FROM`table`))+(SELECTMIN(id)FROM`table`))ASid)ASt2

WHEREt1.id>=t2.id

ORDERBYt1.idLIMIT1;

最后对这两个语句进行分别查询10次，

前者花费时间0.147433秒

后者花费时间0.015130秒

看来采用JOIN的语法比直接在WHERE中使用函数效率还要高很多

mysql mysql临时表 select orderby mysql数据库

安科网

mysql 随机选择一条记录

aifeng

aifeng

相关推荐

Mysql临时表及分区表区别详解

Mysql 实现字段拼接的三个函数

详解 MySQL中count函数的正确使用方法

MySQL主从复制原理以及需要注意的地方

Mysql联表update数据的示例详解

mysql 8.0.22 安装配置图文教程

MySQL用truncate命令快速清空一个数据库中的所有表

修改MySQL8.0 默认的数据目录(快捷操作无配置)

阿里云服务器安装Mysql数据库的详细教程

MySQL中的undo日志

php7连接MySQL实现简易查询程序的方法

JDBC连接MySQL

Uber为什么放弃Postgres选择迁移到MySQL？

聊聊MySQL中的参数

shell脚本定时备份MySQL数据库数据并保留指定时间

Mysql误删数据解决方案及kill语句原理

MySQL 如何修改root用户的密码

通过实例解析MySql CURRENT_TIMESTAMP函数

mysql主从复制配置过程

Golang操作MySql数据库的完整步骤记录

aifeng