存储引擎相关文章

摘要:
N/VARCHARcolumnin行:此类型与上面的类型基本相同。另一个优点是它可以超过8000字节。当超过8000字节时,它会自动保存在溢出页面中。它需要额外的io来访问它。与FILESTREAM相比,此字节的上限为2GB。如果表中有LOB数据列,则聚集索引重建不能处于联机模式。提交事务后,后台有一个幽灵清理器来清理这些标记的幽灵记录。但是,pfs上的标记不会通知处理程序进行处理。其中cfgupdate是从19001.1到最后更新日期的偏移量。cfgupdtime中的单位为3.3ms。

分享大师的blog,并且把主要内容写出来,不敢翻译,以备看了之后忘记可以温习,也推广一下大师的博客

Importance of choosing the right LOB storage technique

本文大意:
    N/CHAR:当数据长度都是固定的比较好用,并且可以用来限制列的大小,避免太长而分页导致碎片生产,缺点应用程序比较难辨认,如果数据长度比列定义的小,那么就可能会造成磁盘空间浪费,io量变大,内存空间浪费
     N/VARCHAR (1-8000):对于varchar小于8000个字节,那么已经避免了浪费空间的缺点,但是如果大小变化会造成分页导致碎片,在sql server2005以后,一个表的列字节和可以超过8060个字节,超过的部分会被保存溢出页中,那么当读取这个数据的时候,就会多一次io,也会导致判断是在数据页中还是在溢出页中造成困难,若这个数据比较大,将近8000个字节,那么一个页中只能保存很少的页,如果这个数据不太常用,那么就不太高效了。
     N/VARCHAR (MAX) column in-row:这个类型基本和上面的差不多,多了一个好处就是可以超过8000个字节,当大于8000个字节后自动保存在溢出页,访问它需要额外的io,和FILESTREAM比这个字节上限为2GB,如果表中有LOB数据列,那么聚集索引重建不能再online模式下。
     N/VARCHAR (MAX) column out-of-row:这个类型的缺点是访问需要额外的io,当对这一列排序是就会出现大量io。如果不是很常用放在溢出页是比较好的选择,但是任然有24字节大小的指针,还有一个好处是通过TEXTIMAGE_ON可以把溢出页放到另外一个文件组中,这样2边的io就可以做到不影响。
      N/TEXT column in-row:已经被放弃使用,效果和 N/VARCHAR (MAX)非溢出页一样
      N/TEXT column out-of-row:已经放弃使用和上面一样
     使用分开的表,需要的时候使用join获取:这个方法对于不太使用到的很有好处,但是需要更多的前端设计和复杂的sql,另外一个好处是主表可以使用online索引创建
     FILESTREAM column:这个类型当列数据超过1mb时使用FILESTREAM,从文件系统中获取数据比从buffer pool中获取要快,详细可以看白皮书

Inside the Storage Engine: Ghost cleanup in depth

本文大意:
     ghost记录清理进程是后台运行的,主要是清理在聚集表下,记录被删除后形成的ghost记录。当在聚集索引下删除记录,并没有真正的删除只是标记为ghost记录,这样删除会变得更快,回滚只需要撤销标记。当事务提交后后台有ghost清理程序来清理这些被标记为ghost记录。并且会保留最后一个数据页的最有一条ghost记录以免页没释放。当记录被删除会在pfs上标记ghost,在数据页头上也会标记。但是pfs上的标记并不会通知处理程序处理。只有到下一次扫描到这个页时才会处理,或者等到每5秒一次的清理进程激活,清理进程就会扫描pfs页,并对ghost页处理。若没有需要清理的了就跳入下一个数据库。若这次扫描没有发现有ghost记录,那么会设置上一个标记,下5秒唤醒就跳过这个数据库。

Ghost cleanup redux

本文大意:
     作者使用一个例子说明当启动快照隔离级别是heap表的删除或产生ghost记录。当删除heap中的记录,这条记录会被标记为ghost并且长度变为14个字节(6(xsn)+8(tempdb中文件,页,行的实际指针))。之后很快就会被当成ghost数据清理(稍微详细的也可以看sql server 技术内幕系列)

Turning off the ghost cleanup task for a performance gain

本文大意:
     (sql server 2008中ghost清理工具没10秒执行)可以使用tf661来关闭ghost清理工具的运行,这样会减少因为清理需要把页保存在buffer pool,生产日志,造成物理io。如果对于delete量比较大的数据库可以启用tf661,这样ghost页就不会被清理。

Do changes to index keys really do in-place updates?

本文大意:
     指出了sql server2008 internals 里面的关于in-place update的错误,但是我没找到,里面指出对于索引key的修改不会有使用 in-place update 应该是 out-place update。作者做了一个测试说明对key修改不会发生in-place update,而是使用out-place update(也就是先delete 再insert)。当对一个慢的页进行out-place update时,会发生分页现象。从事务日志的角度分析全过程:
     0.把更新的记录设置为ghost
     1.分配一个新页a(将作为root页或索引页) a,修改IAM页。
     2.格式化这个页(也就是格式化96位的头等等)
     3.把原数据页的索引插入到页a中
     4.把也a设置为root页或者索引页
     5.分配一个新页b(讲作为叶子节点)
     6.讲第二行移动到页b中
     7.把修改的记录插入到页b中
作者说随后就会把原先页中的ghost清理,但是我的测试中始终都没有被清理

本文大意:
     有2个方法可以跟踪每个列的被修改次数sys.sysrccol需要使用DAC才能访问到这个元数据表。还有一个是sys.system_internals_partition_columns不需要使用DAC但是是非归档的视图。有流传可以使用sysindex中的rowmodctr显然是不行的这个在统计信息更新的时候会被清空掉。

本文大意:
     很多dba都会备份系统数据库并且在另外一个服务器上面还原来检查备份的正确性,并使用dbcc checkdb进行检查。当master数据库被还原并使用dbcc checkdb 检查时会出现1:10 的一致性错误,因为1:10 保存的是config块是master特有的,报错的原因是这个页被分配但是找不到所属的单元。里面存放了sp_configure的内容。在sql server 启动时会读入这个页的内容,如果读不到就会报错。

New script: When were the sp_configure options last changed?

本文大意:
     作者分享了关于获取最后一次修改sp_configure的时间。使用dbcc config 可以看到sp_configure cfgupddate,cfgupdtime更新日期和更新时间。其中cfgupddate是从1900.1.1到最后一次更新日期的偏移。cfgupdtime中的单位是3.3ms。只有当服务重启,或者有重大改变(不太清楚什么样的改变是重大改变)时才会修改config块。
本文大意:
     sql server 2012 开始fn_dblog就带上父事务的id,好处是可以直接看fn_dblog就可以知道sql server内部做了什么操作儿不是靠猜测。本文最后,出现一条事务id是0000:00000000的记录,主要操作是吧在pfs设置为页空不是事务的一部分,也不可能让事务来维护这个设置,如果让事务维护必将照成堵塞。
本文大意:
     create/alter index指定了maxdop的时候,如果是非分区表上DOP = MIN(64, CPUs)在分区表上dop=MIN(Partitions, MIN(64, CPUS))

免责声明:文章转载自《存储引擎相关文章》仅用于学习参考。如对内容有疑问,请及时联系本站处理。

上篇checksum建立的索引填充因子设置问题下篇

宿迁高防,2C2G15M,22元/月;香港BGP,2C5G5M,25元/月 雨云优惠码:MjYwNzM=

相关文章

C# Sqlite事务

在 C#中执行Sqlite数据库事务有两种方式:Sql代码和C#代码 1.Sql代码: BEGIN… COMMIT /ROLLBACK 2.C#代码: using (SQLiteConnection conn =SqliteHelper.GetSQLiteConnection()) { DbTrans...

Mybatis-连接池与事务

Mybatis 的连接池技术 Mybatis 将它自己的数据源分为三类: UNPOOLED 不使用连接池的数据源 POOLED 使用连接池的数据源 JNDI 使用 JNDI 实现的数据源 Mybatis 中数据源的配置 MyBatis 在初始化时,根据的 type 属性来创建相应类型的的数据源 DataSource,即: type=”POOLE...

数据库事务介绍

数据库锁的基本原理 为了保证数据的完事性和一致性,数据库系统采用锁来实现事务的隔离性。各种大型数据库采用的锁基本理论是一致的,但在具体实现上各有差别。 从并发事务锁定的关系上看,可以分为共享锁定和独占锁定。从锁定的对象不同,一般可以分为表锁定和行锁定。 锁 共享锁用于读取数据操作,它是非独占的,允许其他事务同时读取其锁定的资源,但不允许其他事务更...

并发事务之丢失更新

7 并发事务问题之丢失更新 丢失更新:一个事务的更新被另一个事务的更新覆盖了; 时间点 事务1 事务2 t1 开始事务 t2 开始事务 t3 查询pid=p1的记录结果为[pid=p1,pname=zhangSan,age=23,sex=male] t4 查询pid=p1的记录结果为[pid=p1,pname=zh...

spring,hibernate,struts的面试笔试题

1 Action是不是线程安全的?如果不是 有什么方式可以保证Action的线程安全?如果是,说明原因不是声明局部变量,或者扩展RequestProcessor,让每次都创建一个Action,或者在spring中用scope=”prototype”来管理 2.MVC,分析一下struts是如何实现MVC的m:JavaBean 或结合 EJB 组件或者poj...

SQL Server 2005 镜像构建手册 (转)

文章来源:http://www.cnblogs.com/killkill/archive/2008/05/23/1205792.html 一、 镜像简介 1、 简介 数据库镜像是将数据库事务处理从一个SQL Server数据库移动到不同SQL Server环境中的另一个SQL Server数据库中。镜像不能直接访问;它只用在错误恢复的情况下才可以被访问...