【转】二维码生成原理

摘要:
下面,就举例说明将“ABCDE123”转换成为版本1、LevelH的QR码转换方法。如:"123456"将分成"123"和"456",分别被编码成10bit的二进制数。“123”的10bit二进制表示法为:0001111011,实际上就是二进制的123。

原文链接:QR码生成原理-QR Code(ISO 18004)编码方式

一、什么是QR码

QR码属于矩阵式二维码中的一个种类,由DENSO(日本电装)公司开发,由JIS和ISO将其标准化。QR码的样子其实在很多场合已经能够被看到了,我这还是贴个图展示一下:

QR码生成原理-QR<wbr>Code(ISO<wbr>18004)编码方式

这个图如果被正确解码,应该看到我的名字和邮箱。

二、QR码的特点

说到QR码的特点:

一是高速读取(QR就是取自“Quick Response”的首字母),对读取速度的体验源自于我手机上的一个软件,象上面贴出的码图,通过摄像头从拍摄到解码到显示内容也就三秒左右,对摄像的角度也没有什么要求;

二是高容量、高密度;理论上内容经过压缩处理后可以存7089个数字,4296个字母和数字混合字符,2953个8位字节数据,1817个汉字;

三是支持纠错处理;纠错处理相对复杂,目前我还没有深入了解,按照QR码的标准文档说明,QR码的纠错分为4个级别,分别是:

level L :最大7%的错误能够被纠正;

level M :最大15%的错误能够被纠正;

level Q :最大25%的错误能够被纠正;

level H :最大30%的错误能够被纠正;

四是结构化;看似无规则的图形,其实对区域有严格的定义,下图就是一个模式2、版本1的QR图结构(关于QR码的"模式"、"版本"将在后面进行介绍):

QR码生成原理-QR<wbr>Code(ISO<wbr>18004)编码方式

在上图21*21的矩阵中,黑白的区域在QR码规范中被指定为固定的位置,称为寻像图形(finder pattern) 和 定位图形(timing pattern)。寻像图形和定位图形用来帮助解码程序确定图形中具体符号的坐标。

黄色的区域用来保存被编码的数据内容以及纠错信息码。

蓝色的区域,用来标识纠错的级别(也就是Level L到Level H)和所谓的"Mask pattern",这个区域被称为“格式化信息”(format information)。

五是扩展能力。QR码的Structure Append特点,使一个QR码可以分解成多个QR码,反之,也可以将多个QR码的数据组合到一个QR码中来:

QR码生成原理-QR<wbr>Code(ISO<wbr>18004)编码方式

三、QR码的模式和版本

前面提到过QR码的模式(Model)和版本(Version)。QR码分为Model1和Model2两种模式,Model1是对QR的初始定义,Model2是对Model1的扩展,目前使用较为普遍的是Model2,本文的所有说明也仅用于Model2。

QR图的大小(size)被定义为版本(Version),版本号从1到40。版本1就是一个21*21的矩阵,每增加一个版本号,矩阵的大小就增 加4个模块(Module),因此,版本40就是一个177*177的矩阵。(版本越高,意味着存储的内容越多,纠错能力也越强)。

四、QR码支持的编码内容

QR码支持编码的内容包括纯数字、数字和字符混合编码、8位字节码和包含汉字在内的多字节字符。其中:

数字:每三个为一组压缩成10bit。

字母数字混合:每两个为一组,压缩成11bit。

8bit字节数据:无压缩直接保存。

多字节字符:每一个字符被压缩成13bit。

五、QR码编码原理(编码)

编码就是把常见的数字、字符等转换成QR码的方法。说具体的编码之前,先说一下QR码的最大容量问题。

5.1 最大容量

QR码的最大容量取决于选择的版本、纠错级别和编码模式(Mode:数字、字符、多字节字符等)。以版本1、纠错级别为Level Q的QR码为例,可以存储27个纯数字,或17个字母数字混合字符或11个8bit字节数据。如果要存储同样多的内容同时提高纠错级别,则需要采用更高的 版本。版本1~9数据容量、纠错码容量对照如下表:

(version)

(error correcting level)

(count of data code words)

count of EC code words

(numeric)

(alphanumeric)

8bit

1

L

19

7

41

25

17

M

16

10

34

20

14

Q

13

13

27

16

11

H

9

17

17

10

7

2

L

34

10

77

47

32

M

28

16

63

38

26

Q

22

22

48

29

20

H

16

28

34

20

14

3

L

55

15

127

77

53

M

44

26

101

61

42

Q

34

36

77

47

32

H

26

44

58

35

24

4

L

80

20

187

114

78

M

64

36

149

90

62

Q

48

52

111

67

46

H

36

64

82

50

34

5

L

108

26

255

154

106

M

86

48

202

122

84

Q

62

72

144

87

60

H

46

88

106

64

44

6

L

136

36

322

195

134

M

108

64

255

154

106

Q

76

96

175

108

74

H

60

112

139

84

58

7

L

156

40

370

224

154

M

124

72

293

178

122

Q

88

108

207

125

86

H

66

130

154

93

64

8

L

194

48

461

279

192

M

154

88

365

221

152

Q

110

132

259

157

108

H

86

156

202

122

84

9

L

232

60

552

335

230

M

182

110

432

262

180

Q

132

160

312

189

130

H

100

192

235

143

98

如果要了解更详细的QR码容量信息,可以到电装的网站去看看:

http://www.denso-wave.com/qrcode/vertable1-e.html

下面,就举例说明将“ABCDE123”转换成为版本1、Level H的QR码转换方法。

5.2 模式标识符(Mode Indicator)

QR码的模式(Mode)就是前文提到的数字、字符、8bit字节码、多字节码等。对于不同的模式,都有对应的模式标识符(Mode Indicator)来帮助解码程序进行匹配,模式标识符是4bit的二进制数:

1、数字模式(numeric mode): 0001

2、混合字符模式(alphanumeric mode): 0010

3、8bit byte mode: 0100

4、日本汉字(KANJI mode): 1000

5、中国汉字(GB2312):1101

由于示例文本串是混合字符,因此将选择alphanumeric mode,其标识码为:0010

5.3 文本串计数标识符(Character count indicator)

文本串计数标识符用来存储源内容字符串的长度,在版本1-9的QR码中,文本串长度标识符自身的长度被定义为:

数字: 10bit

混合字符: 9bit

8bit字节码: 8bit

多字节码: 8bit

在本例中,源文本串的长度为8个字符,混合字符的长度为9bit,因此将字符个数8编码为9位二进制表示:000001000

加上混合字符模式标识码,总的编码为0010 000001000

5.4 数据内容编码

1、数字模式下的编码

在数字模式下,数据被限制为3个数字一段,分成若干段。如:"123456"将分成"123"和"456",分别被编码成10bit的二进制数。“123”的10bit二进制表示法为:0001111011,实际上就是二进制的123。

当数据的长度不足3个数字时,如果只有1个数字则用4bit,如果有2个数字就用7个bit来表示。
如:"9876"被分成"987"和"6"两段,因此被表示为"1111011011 0110"。

2、混合字符模式下的编码

混合字符模式编码,其字符对照表如下:

0

0

A

10

K

20

U

30

+

40

1

1

B

11

L

21

V

31

-

41

2

2

C

12

M

22

W

32

.

42

3

3

D

13

N

23

X

33

/

43

4

4

E

14

O

24

Y

34

:

44

5

5

F

15

P

25

Z

35

6

6

G

16

Q

26

[sp]

36

7

7

H

17

R

27

$

37

8

8

I

18

S

28

%

38

9

9

J

19

T

29

*

3

编码方式为:

源码被分成两个字符一段,如下所示,每段的第一个字符乘上45,再用第二个数字相加。因此每段变成了11bit的2进制码,如果字符个数只有1个,则用6bit表示。

示例:

"AB"

"CD"

"E1"

"23"

45*10+11

45*12+13

45*14+1

45*2+3

461

553

631

93

0010

000001000

00111001101

01000101001

01001110111

00001011101

3、8bit字节数据不经编码转换直接保存。

5.5 编码终止符(Terminator)

如果编码后的字符长度不足当前版本和纠错级别所存储的容量,则在后续补"0000",如果容量已满则无需添加终止符。此时得到的编码串为:

0010 000001000 00111001101 01000101001 01001110111 00001011101 0000

5.6 编成8bit码字(Code words)

将以上的编码再按8bit一组,形成码字(code words):

00100000 01000001 11001101 01000101 00101001 11011100 00101110 10000

如果尾部数据不足8bit,则在尾部充0:

00100000 01000001 11001101 01000101 00101001 11011100 00101110 10000000

如果编码后的数据不足版本及纠错级别的最大容量,则在尾部补充"11101100"和"00010001",直到全部填满。最后,版本1、Level H下的"ABCDE123"的QR码是:

00100000 01000001 11001101 01000101 00101001 11011100 00101110 10000000 11101100

十进制表示法为:

32 65 205 69 41 220 46 128 236

QR码编码原理(日本汉字和中文编码)

一、日本汉字(KANJI)是两个字节表示的字符码,编码的方式是将其转换为13字节的二进制码制。

转换步骤为:

1、对于JIS值为8140(hex)到9FFC(hex)之间字符:

a)将待转换的JIS值减去8140(hex);

b)将高位字节乘以C0(hex);

c)将b)步骤生成的数据加上低位字节;

d)将结果转换为13位二进制串。

2、对于JIS值为E040(hex)到EBBF(hex)之间的字符:

a)将待转换的JIS值减去C140(hex);

b)将高位字节乘以C0(hex);

c)将b)步骤生成的数据加上低位字节;

d)将结果转换为13位二进制串。

二、中文汉字的与日文汉字转换步骤相似:

1、对于第一字节为0xA1~0xAA之间,第二字节在0xA1~0xFE之间字符:

a)第一字节减去0xA1;

b)上一步结果乘以0x60;

c)第二字节减去0xA1;

d)将b)步骤的结果加上c步骤的结果;

e)将结果转换为13位二进制串。

1、对于第一字节为0xB0~0xFA之间,第二字节在0xA1~0xFE之间字符:

a)第一字节减去0xA6;

b)上一步结果乘以0x60;

c)第二字节减去0xA1;

d)将b)步骤的结果加上c步骤的结果;

e)将结果转换为13位二进制串。

免责声明:文章转载自《【转】二维码生成原理》仅用于学习参考。如对内容有疑问,请及时联系本站处理。

上篇C#与C++数据类型比较及结构体转换[整理]跨域(三)——JSONP下篇

宿迁高防,2C2G15M,22元/月;香港BGP,2C5G5M,25元/月 雨云优惠码:MjYwNzM=

相关文章

ANSI 和 UNICODE 的函数对应表

ANSI        UNICODE           通用(char.h)    (wchar.h)        (tchar.h) char         wchar_t          TCHARchar *       wchar_t *        PTCHAR (PTSTR,LPWSTR,PWSTR,WCHAR) printf   ...

URL特殊字符需转义

URL特殊字符需转义1、空格换成加号(+)2、正斜杠(/)分隔目录和子目录3、问号(?)分隔URL和查询4、百分号(%)制定特殊字符5、#号指定书签6、&号分隔参数转义字符的原因:如果你的表单使用get方法提交,并且提交的参数中有“&”等特殊符的话,如果不做处理,在service端就会将&后面的作为另外一个参数来看待。例如表单的ac...

管理aix的密码策略

aix 中/etc/security/user 存放用户的概要 常用参数参数如下1.account_locked defines whether the account is locked.locked accounts can not be used for login .possible values:true or false.定义账户是否被锁,被锁...

c++读写二进制文件

要读取文件必须包含<fstream>头文件,这里包含了C++读写文件的方法,可以使用fstream 类,这个类可以对文件进行读写操作。   1、打开文件。   打开文件可以有两种方式,第一种可以使用fstream 类的构造函数。 ios::in :输入文件(同ios_base::in) ios::out :输出文件(同ios_base::out...

window.location.hash在firefox下中文自动转码为UTF-8问题

1.window.location.hash window.location.hash这个属性主要是读取和写入网页位置的,我们经常会用来控制网页单页面跳转或者是控制网页位置。然而这个属性在firefox下遇到中文时却会被自动转码为UTF-8,这是火狐等相似浏览器对中文url的一些处理的不同。以下介绍一个方法可以fixed掉这个问题。 2.解码函数 前面已经...

课上测试三

xxd命令主要用来查看文件对应的十六进制形式,也可以讲文件对应的十六进制形式输出到一个指定的文件。 使用此命令所支持的特有选项,亦可以以二进制的形式查看文件。 关于此命令经常使用的选项主要有: (1)-a : 它的作用是自动跳过空白内容,默认是关闭的 (2)-c : 它的后面加上数字表示每行显示多少字节的十六进制数,默认是16bytes,最大是256byt...