(转贴)来谈谈SQL数据库中"简单的"SELECT TOP—可能有你从未注意到的细节

摘要:
首先,博客公园的网友Jerome Wong表示,他提出了这样一个问题。他写SQL语句已经好几年了,从未注意到这一点。例如,数据表如下:ID EMPNO NAME AGE 1 26929 Jerome 282 28394 Quince 273 20983 Green 304 27189 Mike 305 23167 Arishy 306 26371 Yager 29我编写了SQL语句来获取第三和第四个数据,并测试了分页游戏。

首先从博客园的Jerome Wong网友说起

他提出了一个这样的问题

本人写了好几年SQL语句了,从来没注意到这件事情。

例如:

数据表如下:

ID  EMPNO  NAME  AGE  

1   26929   Jerome   28
2   28394   Quince  27
3   20983   Green   30
4   27189   Mike     30
5   23167   Arishy   30
6   26371   Yager   29

我写了SQL语句想取得第3、4笔数据,测试分页玩的。

select  top 2 * from (select top 4 * from Member ) m  order by m.RowID desc

我执行中间那一段子查询:select top 4 * from Member

取得的是:

1   26929   Jerome   28
2   28394   Quince  27
3   20983   Green   30
4   27189   Mike     30

但是整个SQL语句的结果却是:

5   23167   Arishy   30
6   26371   Yager   29

真的不知道到底怎么会出现这种情况,请高手指教。

其实不管你是新手还是高手在写程序当中经常会碰到类似这样的细节问题

下面我就对Jerome Wong网友所提出的问题针对select top做出一系列的分析(在这里要感谢Jerome Wong网友提出的这个问题)

准备工作

(转贴)来谈谈SQL数据库中"简单的"SELECT TOP—可能有你从未注意到的细节第1张(转贴)来谈谈SQL数据库中"简单的"SELECT TOP—可能有你从未注意到的细节第2张代码
if object_id('zhuisuo')is not null
drop table zhuisuo
go
create table zhuisuo
(
id
int null,
name
varchar(20) null
)
insert into zhuisuo values(1,'追索1')
insert into zhuisuo values(2,'追索2')
insert into zhuisuo values(3,'追索3')
insert into zhuisuo values(4,'追索4')
insert into zhuisuo values(5,'追索5')
insert into zhuisuo values(6,'追索6')
insert into zhuisuo values(7,'追索7')
insert into zhuisuo values(8,'追索8')
insert into zhuisuo values(9,'追索9')
insert into zhuisuo values(10,'追索10')
go

下面我们来简单写两句Select语句

select top 2 * from (select top 4 * from zhuisuo) m order by m.id desc

select top 2 * from (select top 4 * from zhuisuo order by id asc) m order by m.id desc

执行结果大家会发现

(转贴)来谈谈SQL数据库中"简单的"SELECT TOP—可能有你从未注意到的细节第3张

平常很多人会认为这两条语句执行的结果会一样

怎么会这样呢?

(转贴)来谈谈SQL数据库中"简单的"SELECT TOP—可能有你从未注意到的细节第4张

从这个查询计划中大家可以清楚的看到

第一种扫描完zhuisuo表后先降序(top N Sort)然后在4行范围中取前2行

第二种扫描完zhuisuo表后先升序取4行(top N Sort)然后再把这4行降序取2行(top N Sort)

在这里就不得不简单的说说SQL语句中出现的表子查询了

表子查询,而出现在from子句中的表我们称为派生表

派生表是虚拟的,未被物理具体化,也就是说当编译的时候

如(select top 2 * from (select top 4 * from zhuisuo) m order by m.id desc )

外部查询和内部查询会被合并,并生成一个计划

这时再看看上面的执行计划就一目了然了

(注意事项:在派生表里面一般不允许使用order by除非指定了top

也就是说select top 2 * from (select * from zhuisuo order by id asc) m order by m.id desc这句语句是不能执行的)

派生表是个拟表要被外部引用,而order by返回的不是表而是游标.所以只用order by的话是被限制的
然而为什么使用top加order by又可以了
是因为top可以从order by返回的游标里选择指定数量生成一个表并返回

接下来我再举例关于top需要注意的细节

1、使用top返回随机行,很多人会想到用RAND函数从而得到这样一个语句

select top 4 id,name from zhuisuo order by rand();

经过多次查询后,你会失望的发现它没有返回随机行

这是因为每个查询只调用它一次而不是每行调用它一次

(转贴)来谈谈SQL数据库中"简单的"SELECT TOP—可能有你从未注意到的细节第5张

这时我们可以把RAND改为Newid

select top 4 id,name from zhuisuo order by newid();

这时就会得到你想要的结果了,在这里我们可以意识到NEWID具有更好的分布特性

(转贴)来谈谈SQL数据库中"简单的"SELECT TOP—可能有你从未注意到的细节第6张

2、注意insert中使用top

insert top (4) into zhuisuo

select * from zhuisuo order by id desc

很多网友会解释为把zhuisuo表中最后4条插入表

但执行完毕后又会让你失望了,插入的是最前面的4条

正确的倒叙插入top方法应该是

insert into zhuisuo
select  top (4) * from zhuisuo order by id desc

这两条语句又有什么区别

(转贴)来谈谈SQL数据库中"简单的"SELECT TOP—可能有你从未注意到的细节第7张

其实第上面那条语句更本就没有排序(Top N Sort)

3、有时我想删除数据表里面时间最近的5条数据怎么办

delete 和update使用top的时候不能使用order by

现在我们可以这样来解决

delete zhuisuo
where id in (select top(5) id from zhuisuo order by id desc)

update zhuisuo
set name='追索'+name
where id in (select top(5) id from zhuisuo order by id desc)

 这是变相实现Top N sort更新或删除数据 但这不是最优的方法因为这还要根具id去匹配

这时我们可以使用这种方法

with cte_del as
(
select top(5) * from zhuisuo order by id desc)
delete from cte_del

with cte_del as
(
select top(5) * from zhuisuo order by id desc)
update cte_del set name='追索'+name

4、top除了这些还有更多的用处,就比如之前我使用Top N sort 加 apply回答过一个网友的问题

如何查询某用户近一个月内正确率大于60%的阅读记录,每天只显示符合条件正确率最高的那个

(转贴)来谈谈SQL数据库中"简单的"SELECT TOP—可能有你从未注意到的细节第8张

在这里我只稍微提一下关于apply 也有很多有意思的细节 今后有时间我会用随笔形式写出来

最后附上一张关于我用序号表示逻辑查询处理的步骤 

(转贴)来谈谈SQL数据库中"简单的"SELECT TOP—可能有你从未注意到的细节第9张

文章以实用为主,今天就写到这里,你学到了吗?

免责声明:文章转载自《(转贴)来谈谈SQL数据库中"简单的"SELECT TOP—可能有你从未注意到的细节》仅用于学习参考。如对内容有疑问,请及时联系本站处理。

上篇EasyExcel调试记录zookeeper的安装下篇

宿迁高防,2C2G15M,22元/月;香港BGP,2C5G5M,25元/月 雨云优惠码:MjYwNzM=

相关文章

Spring框架之jdbc源码完全解析

Spring框架之jdbc源码完全解析        Spring JDBC抽象框架所带来的价值将在以下几个方面得以体现:        1、指定数据库连接参数        2、打开数据库连接        3、声明SQL语句        4、预编译并执行SQL语句        5、遍历查询结果(如果需要的话)        6、处理每一次遍历操作...

html 设置Select options值进行绑定

<select id="cdms"> <option value="">请选择...</option> <option value="0x00">高频整流</option>...

Jquery中用offset().top和offsetTop的比较

今天,想测试一个div与顶部的距离,用的是.offsetTop,但是offsetTop获得的值,怎么都打印不出来。折腾了半天,打印的结果都是undefined,虽然网上很多资料都说返回的是数值。虽然这个函数永不了,但是黄显钦找到了一个可以替代offsetTop的函数。那就是jquery的offset().top   我们先来了解一下,什么是offset(...

10条技巧优化数据库速度

  大多数网站的内容都存在数据库里,用户通过请求来访问内容。数据库非常的快,有许多技巧能让你优化数据库的速度,使你不浪费服务器的资源。在这篇文章中,我收录了十个优化数据库速度的技巧。   1、小心设计数据库   第一个技巧也许看来理所当然,但事实上大部分数据库的问题都来自于设计不好的数据库结构。   譬如我曾经遇见过将客户端信息和支付信息储存在同一个数据库...

游标小例

一,游标的 作用: 当在存储过程,函数,批处理,触发器中 使用 select 返回多条记录时,游标提供了一个可以对记录进行逐条处理的 方法.二,游标的使用方法:1,使用Declare Cursor语句,根据Select语句创建游标.有两种操作方法,效果是一样的,请注意他们的区别 :第一种:声明变量,然后设置游标Declare @MyVariable Cur...

利用epoll实现异步IO

  之前异步IO一直没搞明白,大致的理解就是在一个大的循环中,有两部分:第一部分是监听事件;第二部分是处理事件(通过添加回调函数的方式)。就拿网络通信来说,可以先通过调用 select 模块中的 select 监听各个 socket 。当 socket 有事件到来时,针对相应的事件做出处理,就这么一直循环下去。所以异步IO也被称为事件驱动IO。原理其实我说...