[转]二维码生成原理,一维码生成原理

摘要：

下面，就举例说明将“ABCDE123”转换成为版本1、LevelH的QR码转换方法。如："123456"将分成"123"和"456"，分别被编码成10bit的二进制数。“123”的10bit二进制表示法为：0001111011，实际上就是二进制的123。

原文链接：QR码生成原理-QR Code（ISO 18004）编码方式

一、什么是QR码

QR码属于矩阵式二维码中的一个种类，由DENSO(日本电装)公司开发，由JIS和ISO将其标准化。QR码的样子其实在很多场合已经能够被看到了，我这还是贴个图展示一下：

这个图如果被正确解码，应该看到我的名字和邮箱。

二、QR码的特点

说到QR码的特点：

一是高速读取(QR就是取自“Quick Response”的首字母)，对读取速度的体验源自于我手机上的一个软件，象上面贴出的码图，通过摄像头从拍摄到解码到显示内容也就三秒左右，对摄像的角度也没有什么要求；

二是高容量、高密度；理论上内容经过压缩处理后可以存7089个数字，4296个字母和数字混合字符，2953个8位字节数据，1817个汉字；

三是支持纠错处理；纠错处理相对复杂，目前我还没有深入了解，按照QR码的标准文档说明，QR码的纠错分为4个级别，分别是：

level L :最大7%的错误能够被纠正；

level M :最大15%的错误能够被纠正；

level Q :最大25%的错误能够被纠正；

level H :最大30%的错误能够被纠正；

四是结构化；看似无规则的图形，其实对区域有严格的定义，下图就是一个模式2、版本1的QR图结构(关于QR码的"模式"、"版本"将在后面进行介绍)：

在上图21*21的矩阵中，黑白的区域在QR码规范中被指定为固定的位置，称为寻像图形（finder pattern）和定位图形(timing pattern)。寻像图形和定位图形用来帮助解码程序确定图形中具体符号的坐标。

黄色的区域用来保存被编码的数据内容以及纠错信息码。

蓝色的区域，用来标识纠错的级别（也就是Level L到Level H)和所谓的"Mask pattern",这个区域被称为“格式化信息”（format information）。

五是扩展能力。QR码的Structure Append特点，使一个QR码可以分解成多个QR码，反之，也可以将多个QR码的数据组合到一个QR码中来：

三、QR码的模式和版本

前面提到过QR码的模式（Model）和版本（Version)。QR码分为Model1和Model2两种模式，Model1是对QR的初始定义，Model2是对Model1的扩展，目前使用较为普遍的是Model2，本文的所有说明也仅用于Model2。

QR图的大小(size)被定义为版本（Version)，版本号从1到40。版本1就是一个21*21的矩阵，每增加一个版本号，矩阵的大小就增加4个模块(Module)，因此，版本40就是一个177*177的矩阵。（版本越高，意味着存储的内容越多，纠错能力也越强）。

四、QR码支持的编码内容

QR码支持编码的内容包括纯数字、数字和字符混合编码、8位字节码和包含汉字在内的多字节字符。其中：

数字：每三个为一组压缩成10bit。

字母数字混合:每两个为一组，压缩成11bit。

8bit字节数据：无压缩直接保存。

多字节字符：每一个字符被压缩成13bit。

五、QR码编码原理（编码）

编码就是把常见的数字、字符等转换成QR码的方法。说具体的编码之前，先说一下QR码的最大容量问题。

5.1 最大容量

QR码的最大容量取决于选择的版本、纠错级别和编码模式（Mode:数字、字符、多字节字符等）。以版本1、纠错级别为Level Q的QR码为例，可以存储27个纯数字，或17个字母数字混合字符或11个8bit字节数据。如果要存储同样多的内容同时提高纠错级别，则需要采用更高的版本。版本1~9数据容量、纠错码容量对照如下表：

(version)	(error correcting level)	(count of data code words)	count of EC code words	(numeric)	(alphanumeric)	8bit
1	L	19	7	41	25	17
	M	16	10	34	20	14
	Q	13	13	27	16	11
	H	9	17	17	10	7
2	L	34	10	77	47	32
	M	28	16	63	38	26
	Q	22	22	48	29	20
	H	16	28	34	20	14
3	L	55	15	127	77	53
	M	44	26	101	61	42
	Q	34	36	77	47	32
	H	26	44	58	35	24
4	L	80	20	187	114	78
	M	64	36	149	90	62
	Q	48	52	111	67	46
	H	36	64	82	50	34
5	L	108	26	255	154	106
	M	86	48	202	122	84
	Q	62	72	144	87	60
	H	46	88	106	64	44
6	L	136	36	322	195	134
	M	108	64	255	154	106
	Q	76	96	175	108	74
	H	60	112	139	84	58
7	L	156	40	370	224	154
	M	124	72	293	178	122
	Q	88	108	207	125	86
	H	66	130	154	93	64
8	L	194	48	461	279	192
	M	154	88	365	221	152
	Q	110	132	259	157	108
	H	86	156	202	122	84
9	L	232	60	552	335	230
	M	182	110	432	262	180
	Q	132	160	312	189	130
	H	100	192	235	143	98

如果要了解更详细的QR码容量信息，可以到电装的网站去看看：

http://www.denso-wave.com/qrcode/vertable1-e.html。

下面，就举例说明将“ABCDE123”转换成为版本1、Level H的QR码转换方法。

5.2 模式标识符(Mode Indicator)

QR码的模式（Mode)就是前文提到的数字、字符、8bit字节码、多字节码等。对于不同的模式，都有对应的模式标识符（Mode Indicator)来帮助解码程序进行匹配,模式标识符是4bit的二进制数：

1、数字模式（numeric mode）: 0001

2、混合字符模式（alphanumeric mode）: 0010

3、8bit byte mode: 0100

4、日本汉字（KANJI mode）: 1000

5、中国汉字(GB2312):1101

由于示例文本串是混合字符，因此将选择alphanumeric mode，其标识码为：0010

5.3 文本串计数标识符（Character count indicator)

文本串计数标识符用来存储源内容字符串的长度，在版本1-9的QR码中，文本串长度标识符自身的长度被定义为：

数字: 10bit

混合字符: 9bit

8bit字节码: 8bit

多字节码: 8bit

在本例中，源文本串的长度为8个字符，混合字符的长度为9bit，因此将字符个数8编码为9位二进制表示：000001000

加上混合字符模式标识码，总的编码为0010 000001000

5.4 数据内容编码

1、数字模式下的编码

在数字模式下，数据被限制为3个数字一段，分成若干段。如："123456"将分成"123"和"456"，分别被编码成10bit的二进制数。“123”的10bit二进制表示法为：0001111011，实际上就是二进制的123。

当数据的长度不足3个数字时，如果只有1个数字则用4bit，如果有2个数字就用7个bit来表示。
如："9876"被分成"987"和"6"两段，因此被表示为"1111011011 0110"。

2、混合字符模式下的编码

混合字符模式编码，其字符对照表如下：

0	0	A	10	K	20	U	30	+	40
1	1	B	11	L	21	V	31	-	41
2	2	C	12	M	22	W	32	.	42
3	3	D	13	N	23	X	33	/	43
4	4	E	14	O	24	Y	34	:	44
5	5	F	15	P	25	Z	35
6	6	G	16	Q	26	[sp]	36
7	7	H	17	R	27	$	37
8	8	I	18	S	28	%	38
9	9	J	19	T	29	*	3

编码方式为：

源码被分成两个字符一段，如下所示，每段的第一个字符乘上45，再用第二个数字相加。因此每段变成了11bit的2进制码，如果字符个数只有1个，则用6bit表示。

示例：

		"AB"	"CD"	"E1"	"23"
		45*10+11	45*12+13	45*14+1	45*2+3
		461	553	631	93
0010	000001000	00111001101	01000101001	01001110111	00001011101

3、8bit字节数据不经编码转换直接保存。

5.5 编码终止符(Terminator)

如果编码后的字符长度不足当前版本和纠错级别所存储的容量，则在后续补"0000",如果容量已满则无需添加终止符。此时得到的编码串为：

0010 000001000 00111001101 01000101001 01001110111 00001011101 0000

5.6 编成8bit码字(Code words)

将以上的编码再按8bit一组，形成码字(code words):

00100000 01000001 11001101 01000101 00101001 11011100 00101110 10000

如果尾部数据不足8bit,则在尾部充0:

00100000 01000001 11001101 01000101 00101001 11011100 00101110 10000000

如果编码后的数据不足版本及纠错级别的最大容量，则在尾部补充"11101100"和"00010001",直到全部填满。最后，版本1、Level H下的"ABCDE123"的QR码是：

00100000 01000001 11001101 01000101 00101001 11011100 00101110 10000000 11101100

十进制表示法为：

32 65 205 69 41 220 46 128 236

QR码编码原理（日本汉字和中文编码）

一、日本汉字(KANJI)是两个字节表示的字符码，编码的方式是将其转换为13字节的二进制码制。

转换步骤为：

1、对于JIS值为8140(hex)到9FFC(hex)之间字符：

a)将待转换的JIS值减去8140(hex)；

b)将高位字节乘以C0(hex);

c）将b)步骤生成的数据加上低位字节;

d)将结果转换为13位二进制串。

2、对于JIS值为E040(hex)到EBBF(hex)之间的字符：

a)将待转换的JIS值减去C140(hex);

b)将高位字节乘以C0(hex);

c)将b)步骤生成的数据加上低位字节;

d)将结果转换为13位二进制串。

二、中文汉字的与日文汉字转换步骤相似：

1、对于第一字节为0xA1~0xAA之间,第二字节在0xA1~0xFE之间字符：

a)第一字节减去0xA1；

b)上一步结果乘以0x60;

c）第二字节减去0xA1;

d)将b)步骤的结果加上c步骤的结果;

e)将结果转换为13位二进制串。

1、对于第一字节为0xB0~0xFA之间,第二字节在0xA1~0xFE之间字符：

a)第一字节减去0xA6；

b)上一步结果乘以0x60;

c）第二字节减去0xA1;

d)将b)步骤的结果加上c步骤的结果;

e)将结果转换为13位二进制串。

【转】二维码生成原理

相关文章

ANSI 和 UNICODE 的函数对应表

URL特殊字符需转义

管理aix的密码策略

c++读写二进制文件

window.location.hash在firefox下中文自动转码为UTF-8问题

课上测试三

最新文章

随机推荐

思享工具箱导航

JSON工具

格式化转换

加解密编码

文本数字

网络

站长

计算

其他

对照列表