关于GaussDB(DWS)的正则表达式知多少?人人都能看得懂的详解来了!

摘要:
POSIX1003.2中定义的正则表达式RE是GaussDB支持的正则表达式,它有两种形式:扩展RE或ERE,以及基本RE或BRE。GaussDB支持这两种形式,并实现了一些在编程语言中广泛使用但不包含在POSIX标准中的扩展。GaussDB正则表达式的主要语法与其他编程语言支持的语法相同。本文不再赘述。本文介绍GaussDB的特殊形式和语法。表2列出了表1中flags参数的所有选项。本文由华为云社区《你对GaussDB正则表达式了解多少》的原作者王晓娟8分享。

摘要:GaussDB(DWS)除了支持标准的POSIX正则表达式句法,还拥有一些特殊句法和选项,这些你可了解?本文便为你讲解这些特殊句法和选项。

概述

正则表达式(Regular Expression,简称RE),通常被用来检索、替换那些符合某个模式(规则)的文本。正则表达式使用比较灵活,功能强大,因此经常被用到进行文本的搜索和替换中,帮助开发人员快速进行批量文本查询和处理。比如常用的linux的grep命令,许多程序设计语言比如Perl、Tcl也都支持正则表达式进行字符串操作。

GaussDB(DWS)支持的正则表达式

POSIX 1003.2中定义的正则表达式RE有两种形式:扩展RE或ERE(大致为egrep的RE),和基本RE或BRE(大致为ed的RE),GaussDB(DWS)都支持这两种形式,并实现了在编程语言(如Perl和Tcl)中广泛使用而POSIX标准中未包含的一些扩展。使用这些非POSIX扩展的RE在本文中称为高级RE或ARE。ARE几乎是ERE的超集,但是BRE有几种符号不相容性(而且是有限的)。

GaussDB(DWS)的正则表达式的主要句法和在其他程序语言中支持的句法功能相同,此文不再赘述。本文中对GaussDB(DWS)拥有的特殊形式和句法进行说明。

GuassDB(DWS)支持的正则表达式函数

GaussDB(DWS)提供了支持POSIX正则表达式的函数,如表1所示。

表1 GaussDB(DWS)中的正则表达式函数

 

关于GaussDB(DWS)的正则表达式知多少?人人都能看得懂的详解来了!第1张

 

从表1中看到,GuassDB(DWS)支持的正则表达式函数都有一个可选的flags参数,该参数的可选项及其含义是什么呢?下面将展开进行详细举例说明。

GaussDB(DWS)正则表达式函数的flags参数详解

表2中列举了表1中flags参数的所有可选项。

表2 GaussDB(DWS)正则表达式函数的flags参数的选项说明

 

关于GaussDB(DWS)的正则表达式知多少?人人都能看得懂的详解来了!第2张

 

g选项表2中给出的flags参数选项描述,非常简洁,理解起来比较困难。下面通过一些示例,来直观帮助理解上面这些flags参数选项的含义。

示例1-1:未指定’g‘选项,仅对第一个匹配项进行替换

 

关于GaussDB(DWS)的正则表达式知多少?人人都能看得懂的详解来了!第3张

 

示例1-2:指定’g‘选项,对所有匹配项进行替换

 

关于GaussDB(DWS)的正则表达式知多少?人人都能看得懂的详解来了!第4张

 

c 和 i 选项

示例2-1:默认情况下,进行大小写敏感匹配

示例2-2:显示指定进行大小写敏感匹配

 

关于GaussDB(DWS)的正则表达式知多少?人人都能看得懂的详解来了!第5张

 

示例2-3:显示指定进行大小写不敏感匹配

 

关于GaussDB(DWS)的正则表达式知多少?人人都能看得懂的详解来了!第6张

 

n[或m]、s、p、w选项对元字符点(.)的影响

示例3-1:指定选项n时,元字符点(.)不匹配换行符

 

关于GaussDB(DWS)的正则表达式知多少?人人都能看得懂的详解来了!第7张

 

示例3-2:指定选项s时,元字符点(.)匹配换行符

 

关于GaussDB(DWS)的正则表达式知多少?人人都能看得懂的详解来了!第8张

 

示例3-3:指定选项p时,元字符点(.)不匹配换行符

 

关于GaussDB(DWS)的正则表达式知多少?人人都能看得懂的详解来了!第9张

 

示例3-4:指定选项w时,元字符点(.)匹配换行符

n[或m]、s、p、w选项对元字符^、$的影响

示例5-1:指定选项n时,元字符点^、$匹配行首和行尾

 

关于GaussDB(DWS)的正则表达式知多少?人人都能看得懂的详解来了!第10张

 

示例5-2:指定选项s时,元字符点^、$不匹配行首和行尾

 

关于GaussDB(DWS)的正则表达式知多少?人人都能看得懂的详解来了!第11张

 

示例5-3:指定选项p时,元字符点^、$不匹配行首和行尾

 

关于GaussDB(DWS)的正则表达式知多少?人人都能看得懂的详解来了!第12张

 

示例5-4:指定选项w时,元字符点^、$匹配第一个行首匹配的行到最后一个行尾匹配的行

 

关于GaussDB(DWS)的正则表达式知多少?人人都能看得懂的详解来了!第13张

 

 

关于GaussDB(DWS)的正则表达式知多少?人人都能看得懂的详解来了!第14张

 

n[或m]、s、p、w选项对元字符 [^ 的影响

示例6-1:指定选项n时,换行符不匹配被[^排除的字符,所有行尾的换行符未被替换为M

 

关于GaussDB(DWS)的正则表达式知多少?人人都能看得懂的详解来了!第15张

 

示例6-2:指定选项s时,换行符匹配被[^排除的字符,所有行尾的换行符被替换为M

 

关于GaussDB(DWS)的正则表达式知多少?人人都能看得懂的详解来了!第16张

 

示例6-3:指定选项p时,换行符不匹配被[^排除的字符,所有行尾的换行符被替换为M

 

关于GaussDB(DWS)的正则表达式知多少?人人都能看得懂的详解来了!第17张

 

示例6-4:指定选项w时,换行符匹配被[^排除的字符,所有行尾的换行符被替换为M

 

关于GaussDB(DWS)的正则表达式知多少?人人都能看得懂的详解来了!第18张

 

t 和 x 选项

通常情况下,RE语法都是严格的,即RE中的所有字符都是重要的。严格语法是默认的,也可以通过指定选项t表示。

示例7-1:在严格语法中,空白字符也是重要的

 

关于GaussDB(DWS)的正则表达式知多少?人人都能看得懂的详解来了!第19张

 

GaussDB(DWS)还有一个扩展语法,通过指定x选项表示。在扩展语法中,RE中的空白字符(在这里,空白是空格、水平制表符、新行、和任何属于

space

字符类的字符。)将被忽略,以及#和换行符(或RE的结尾)之间的所有字符也将被忽略。这种语法允许对复杂的RE进行分段落和注释。

示例7-2:在扩展语法中,RE中的空格被忽略

 

关于GaussDB(DWS)的正则表达式知多少?人人都能看得懂的详解来了!第20张

 

该规则有三个例外:

· 转义字符后的空白或#被保留

示例7-3

 

关于GaussDB(DWS)的正则表达式知多少?人人都能看得懂的详解来了!第21张

 

 

关于GaussDB(DWS)的正则表达式知多少?人人都能看得懂的详解来了!第22张

 

· 括号表达式中的空白或#被保留

示例7-4

 

关于GaussDB(DWS)的正则表达式知多少?人人都能看得懂的详解来了!第23张

 

· 空白和注释不能出现多字符符号中。在 ARE 里,方括弧表达式外面,序列(?#ttt) (这里的ttt是任意不包含)的文本)是一个注释,完全被忽略。

示例7-5:空格出现在多字符符号中

 

关于GaussDB(DWS)的正则表达式知多少?人人都能看得懂的详解来了!第24张

 

示例7-6:注释出现在多字符符号中

 

关于GaussDB(DWS)的正则表达式知多少?人人都能看得懂的详解来了!第25张

 

当flags中指定了多个有相反含义的选项时,则后出现的选项覆盖前面出现的选项

示例8-1:后出现的s选项覆盖了n选项

 

关于GaussDB(DWS)的正则表达式知多少?人人都能看得懂的详解来了!第26张

 

示例8-2:后出现的n选项覆盖了s选项

 

关于GaussDB(DWS)的正则表达式知多少?人人都能看得懂的详解来了!第27张

 

GaussDB(DWS)正则表达式的特殊句法

两个特殊的前缀:: 和=

一个RE可以以两个特殊的前缀中的某一个开头。

RE以:开头*

RE以*:开头,则剩余的RE被当作一个ARE。(在GaussDB(DWS)中,这通常没有作用,因为RE被假定为ARE;但是,如果正则表达式函数的flags参数指定了ERE或BRE模式,那么它就会起作用。)

示例9-1:在BRE匹配模式中(regexp_replace函数的最后一个参数中指定的字母‘b’即表示使用BRE匹配模式),正则表达式中要表示圆括号表达式,需要将圆括号进行转义;同样,表示原子精确次数匹配序列的花括号,也需要进行转义

 

关于GaussDB(DWS)的正则表达式知多少?人人都能看得懂的详解来了!第28张

 

*示例9-2:增加: 前缀后,即使指定了使用BRE匹配模式,也是按照ARE的匹配模式的规则进行匹配

 

关于GaussDB(DWS)的正则表达式知多少?人人都能看得懂的详解来了!第29张

 

RE以=开头*

RE以*=开头,则RE的其余部分被认为是一个字面字符串,所有字符都被认为是普通字符。

示例10-1:‘|’在ARE匹配模式的正则表达式中是代表或含义的元字符

 

关于GaussDB(DWS)的正则表达式知多少?人人都能看得懂的详解来了!第30张

 

*示例10-2:代表或含义的元字符‘|’,在以=为前缀的正则表达式中,失去其元字符的特殊含义,被看作字符串中的普通字符

 

关于GaussDB(DWS)的正则表达式知多少?人人都能看得懂的详解来了!第31张

 

嵌套选项

ARE可以以嵌套选项开头:序列(?xyz) (其中xyz是一个或多个字母字符)指定影响RE其余部分的选项。这些选项覆盖任何先前确定的选项,特别是,它们可以覆盖由正则表达式运算符或正则表达式函数的flags参数隐含的大小写敏感行为。可选择的字母如表2所示中除’g’选项外的其他选项。

示例11-1:不含嵌套选项的大小写不敏感匹配

 

关于GaussDB(DWS)的正则表达式知多少?人人都能看得懂的详解来了!第32张

 

示例10-2:嵌套选项中的大小写敏感覆盖flags中的大小写不敏感匹配

 

关于GaussDB(DWS)的正则表达式知多少?人人都能看得懂的详解来了!第33张

 

结语

通过上面丰富的示例,深入了解了GaussDB(DWS)正则表达式的特殊句法和flags选项含义,在使用GaussDB(DWS)正则表达式函数时便可以得心应手。

本文分享自华为云社区《GaussDB(DWS)的正则表达式知多少 》,原文作者:wangxiaojuan8 。

点击关注,第一时间了解华为云新鲜技术~

免责声明:文章转载自《关于GaussDB(DWS)的正则表达式知多少?人人都能看得懂的详解来了!》仅用于学习参考。如对内容有疑问,请及时联系本站处理。

上篇SSE指令集系列之三Oracle中trace的几种(Z)下篇

宿迁高防,2C2G15M,22元/月;香港BGP,2C5G5M,25元/月 雨云优惠码:MjYwNzM=

相关文章

python-re正则、jsonpath返回值提取

re """ re.match 从头开始匹配 re.match(pattern, string, flags=0) 只匹配第一个,返回对象 先判断赋值的变量,加.group()返回值 re.search 匹配包含 re.search(pattern, string, flags=0) 只匹配一个,返回对象...

在lua的string库和正则表达式

一.前提要了解一下lua 的string几个方法 1. string库中所有的字符索引从前往后是1,2,...;从后往前是-1,-2,... 2. string库中所有的function都不会直接操作字符串,而是返回一个结果 string.len(s):返回字符串的长度. string.lower(s):变小写. string.upper(s):变大写....

微信默认表情符号的代码对照表

之前有不少朋友问我,微信公众平台如何发带有表情符号的图片,其实只需要在信息里面插入表情代码就可以使用的。 微信表情对照表如下: 表情图片 字符串代码 替换关键字 /::) 微笑 /::~ 伤心 /::B 美女 /::| 发呆 /:8-) 墨镜 /::< 哭 /::$ 羞 /::X 哑 /::...

七 、linux正则表达式

为处理大量的字符串而定义的一套规则和方法 1)linux正则表达式以行为单位处理 2)alians grep = “grep –color=auto”,让匹配的内容显示颜色 3)注意字符集,export LC_ALL=C [root@pyrene ~]# alias grep='grep --color=auto' [root@pyrene ~]# exp...

GitHub正则表达式学习笔记

1.元字符 正则表达式主要依赖于元字符。元字符并不代表他们本身的字面意思,他们都有特殊的含义。一些元字符写在方括号的时候有一些特殊的意思。以下是一些元字符的介绍: 1.1 点运算符 . 例如,表达式.ar匹配一个任意字符后面跟着是a和r的字符串。 ".ar"=>The carparked in the garage. 1.2 字符集 [ ] 在方括...

C#去掉json字符串中的换行符

【出错状况】 从数据库中返回json格式的数据,但由于数据库中的数据中有换行符,导致返回的json数据错误。 【原因分析】 用for循环语句来分析出错字段字符串中每个字符的ASCII码,可以看出存在值分别为13、10的两个字符,造成换行,导致json格式出错。            char tempstring = '\n';   (10)       ...