Notepad++正则表达式查找替换文本中文字符

摘要:
测试需求测试工具中xml配置文件中的注释字段包含中文字符。Win10系统中使用的工具中偶尔会出现中文乱码,导致配置文件无效。解决方案是将配置文件中的中文注释替换为英文注释,或者直接替换和删除。如何查找和删除配置文件中的汉字?“记事本”中使用正则表达式[^x00 xff]来匹配汉字。替换完成如下3。所有汉字已被替换。
测试需求

测试工具中xml配置文件中注释字段包含中文字符,在Win10系统下使用工具中偶尔会出现中文乱码导致配置文件失效。解决方法将配置文件中的中文注释换成英文注释或者直接替换删除。如何将配置文件中的中文字符查找删除?

操作步骤

在Notepad文本工具中使用正则表达式匹配中文字符并替换。当然你可以采用Python写个小工具也无不可。Notepad中使用正则表达式[^x00-xff]匹配中文字符。

1、构造包含中文文本用于测试,包含中文字符、普通字符和特殊字符。

Notepad++正则表达式查找替换文本中文字符第1张

2、中文字符正则表达式匹配:[^x00-xff]。其中x00-xff匹配ASCII代码中十六进制代码为00-ff的字符,加个取反^,则就表示表示匹配非单字节的字符,例如汉字,汉字符号等字符集。如下

Notepad++正则表达式查找替换文本中文字符第2张

3、完成替换,中文字符已全部替换。替换后文本如下:

Notepad++正则表达式查找替换文本中文字符第3张

附录

ASCII字符集:http://www.asciitable.com/

Notepad++正则表达式查找替换文本中文字符第4张

Notepad++正则表达式查找替换文本中文字符第5张

免责声明:文章转载自《Notepad++正则表达式查找替换文本中文字符》仅用于学习参考。如对内容有疑问,请及时联系本站处理。

上篇C#控件重绘学习(一)flutter Radio单选框下篇

宿迁高防,2C2G15M,22元/月;香港BGP,2C5G5M,25元/月 雨云优惠码:MjYwNzM=

相关文章

Linux 字符集的查看及修改

一·查看字符集 字符集在系统中体现形式是一个环境变量,以CentOS6.5为例,其查看当前终端使用字符集的方式可以有以下几种方式: 第一种: [root@Testa-www tmp]# echo $LANG zh_CN.UTF-8 第二种: [root@Testa-www ~]# env |grep LANG LANG=zh_CN.UTF-8 第三种: [...

Linux grep命令 -- 三剑客老三

常用选项   -E :开启扩展(Extend)的正则表达式。   -i :忽略大小写(ignore case)。   -v :反过来(invert),只打印没有匹配的,而匹配的反而不打印。   -n :显示行号   -w :被匹配的文本只能是单词,而不能是单词中的某一部分。   -c :显示总共有多少行被匹配到了,而不是显示被匹配到的内容,注意如果同时使用...

利用正则表达式,分割地址至省市县,更新MySQL数据库数据

一、部分主要源代码以及结果截图 import java.sql.Connection; import java.sql.ResultSet; import java.sql.Statement; import java.util.ArrayList; import java.util.List; import java.util.regex.Matche...

mysql 怎么通过sql语句批量去掉某一个表中某一个字段的多余字符

采用替换,把”<img src="http://t.zoukankan.com/“替换为空格," />也替换为空格,曾经在网上看到过这样的SQL,替换字段中字符串中的某些字符update 表名 set 要修改的字段名= replace(要修改的字段名,‘<img src="http://t.zoukankan.com/’,'')updat...

GB2312/GBK/GB18030/BIG5/UNICODE/UTF8编码

GB2312/GBK/GB18030/BIG5/UNICODE/UTF-8编码 - 3※5不甘平淡 - 51Testing软件测试网 51Testing软件测试网-中国软件测试人的精神家园 - Powered by X-SpaceGB2312/GBK/GB18030/BIG5/UNICODE/UTF-8编码经常会碰到一些关于编码的名词,特意收录了些资料以备...

Mysql字符集设置

最近,在项目组使用的mysql数据库中,插入数据出现乱码,关于这个问题做了下总结,我们从最基本的地方说起,到错误产生的深层次原因和解决办法。 基本概念 • 字符(Character)是指人类语言中最小的表义符号。例如’A'、’B'等;• 给定一系列字符,对每个字符赋予一个数值,用数值来代表对应的字符,这一数值就是字符的编码(Encoding)。例如,我们给...