批量去除Teleport Pro整站下载文件冗余代码

摘要:
teleportprotppabs标签批量删除teleportprotppabs标签批量删除使用TeleportPro下载的网页代码中包含了很多垃圾代码,比如下载的html网页代码中会出现tppabs标签,而且还会将所有的href标签中加入了很多垃圾代码,在css会加入了tpa标签,这些都是冗余代码,可以将其全部删除,但是由于代码太多,我们不可能一个个删除,因此可以使用Dreamweaver的查找/替换工具中的正则表达式来进行替换。----------------------------------------------------------------------------------------------------------------------------------------tppabs  html原文件中tppabs标记是TeleportPro软件留下的标记。

teleport pro tppabs标签批量删除

teleport pro tppabs标签批量删除

使 用Teleport Pro下载的网页代码中包含了很多垃圾代码,比如下载的html网页代码中会出现tppabs标签,而且还会将所有的href标签中加入了很多垃圾代码, 在css会加入了tpa标签,这些都是冗余代码,可以将其全部删除,但是由于代码太多,我们不可能一个个删除,因此可以使用Dreamweaver的查找 /替换工具中的正则表达式来进行替换。
1、替换tppabs标签,使用Dreamweaver查找tppabs="h[^"]*",将其替换为空即可。
2、替换href中的多余代码,使用Dreamweaver查找href="javascript:if(confirm('htt[^"]*"替换为href="https://tool.4xseo.com/article/45986.html"即可。
3、替换css文件中的tpa标签,使用Dreamweaver查找/*tpa=.**/替换为空即可。

----------------------------------------------------------------------------------------------------------------------------------------

tppabs  

html原文件中tppabs标记是Teleport Pro软件留下的标记。该软件是离线浏览器,下载完整个网页后,它会在图片或超级链接标签内插入tppabs标签,以记录该图片或超级链接指向的原始地址。因为这个标签不是合法标签,所以普通浏览器会忽略它。但可以通过element.getAttribute("tppabs")在JS中读取这个属性。

如我们手动清除的话,那将是一个无法估计的工作量,需要批量清除。利用DreamWeaver正则表达式批量清除tppabs标签更加容易、快捷。

方法如下:

使用DW替换功能:
查找范围:整个当前本地站点
搜索:源代码
查找:tppabs="h[^"]*"
替换:(为空)
勾选:使用正则表达式
点替换全部按钮即可

匹配javascript代码:
<a href="javascript: if(confirm('http://www.xxx.com 文件并未依 Teleport Pro 取回,因为服务器报告错误导致无法读取。 你要从服务器上打开它吗?'))window.location='http: //www.xxx.com'" >

方法如下:
查找范围:整个当前本地站点
搜索:源代码
查找:href="javascript:if(confirm('htt[^"]*"
替换:href="https://tool.4xseo.com/article/45986.html"
勾选:使用正则表达式
点替换全部按钮

注:如果该表达式中含有不同的网址,可使用if(confirm('htt[^"]*)(注意其他代码是否使用此类语法表达)匹配不带网址的部分,替换成空。

css文件有一些类似/*tpa=http://www.xxx.com/test.gif*/代码

方法如下:
查找范围:整个当前本地站点
搜索:源代码
查找:/*tpa=http://[^s]*/
替换:空
勾选:使用正则表达式
点替换全部按钮

字符匹配示例^输入或行的起始部分。^T匹配“Thisgoodearth”中的“T”,但不匹配“UncleTom'sCabin”中的“T”。$输入或行的结尾部分。h$匹配“teach”中的“h”,但是不匹配“teacher”中的“h”*0个或多个前置字符。um*匹配“rum”中的“um”、“yummy”中的“umm”以及“huge”中的“u”+1个或多个前置字符。um+匹配“rum”中的“um”和“yummy”中的“umm”,但在“huge”中没有任何匹配项?前置字符最多出现一次(即,指示前置字符是可选的)。st?on匹配“Johnson”中的“son”和“Johnston”中的“ston”,但在“Appleton”和“tension”中没有任何匹配项.除换行符外的任何单字符。.an匹配短语“branmuffinscanbetasty”中的“ran”和“can”x|yx或y。FF0000|0000FF匹配bgcolor=”#FF0000”中的“FF0000”和fontcolor=”#0000FF”中的“0000FF”{n}恰好n个前置字符。o{2}匹配“loom”中的“oo”和“mooooo”中的前两个“o”,但在“money”中没有任何匹配项{n,m}至少n个、至多m个前置字符。F{2,4}匹配“#FF0000”中的“FF”和“#FFFFFF”中的前四个“F”[abc]用括号括起来的字符中的任何一个字符。用连字符指定某一范围的字符(例如,[a-f]等效于[abcdef])。[e-g]匹配“bed”中的“e”、“folly”中的“f”和“guard”中的“g”[^abc]未在括号中括起来的任何字符。用连字符指定某一范围的字符(例如,[^a-f]等效于[^abcdef])。[^aeiou]最初匹配“orange”中“r”、“book”中的“b”和“eek!”中的“k”词边界(例如空格或回车符)。b匹配“book”中的“b”,但在“goober”和“snob”中没有任何匹配项B词边界之外的任何内容。Bb匹配“goober”中的“b”,但在“book”中没有任何匹配项d任何数字字符。等效于[0-9]。d匹配“C3PO”中的“3”和“apartment2G”中的“2”D任何非数字字符。等效于[^0-9]。D匹配“900S”中的“S”和“Q45”中的“Q”f换页符。  换行符。  回车符。 s任何单个空白字符,包括空格、制表符、换页符或换行符。sbook匹配“bluebook”中的“book”,但在“notebook”中没有任何匹配项S任何单个非空白字符。Sbook匹配“notebook”中的“book”,但在“bluebook”中没有任何匹配项 制表符。 w任何字母数字字符,包括下划线。等效于[A-Za-z0-9_]。bw*匹配“thebarkingdog”中的“barking”以及“thebigblackdog”中的“big”和“black”W任何非字母数字字符。等效于[^A-Za-z0-9_]。W匹配“Jake&Mattie”中的

关键词:取出tppabs标记,去除tppabs标记,批量去除tppabs标记www.oine.cn

notepadd正则

使用正则表达式的标记,通过()来包围想要用的字符,然后用1 来替换字符串,第一个匹配文本。

例如:

Text bodySearch stringReplace stringResult
Hi my name is Fredmy name is (.+)my name is not 1Hi my name is not Fred
The quick brown fox jumped over the fat lazy dogbrown (.+) jumped over the (.+)brown 2 jumped over the 1The quick brown fat jumped over the fox lazy dog

删除S 之后的所有字符

表达式:s.*$

删除S 之前的所有字符

表达式:^([^s]*)s

相关文档:

http://blog.csdn.net/wangkai_123456/article/details/55254598

免责声明:文章转载自《批量去除Teleport Pro整站下载文件冗余代码》仅用于学习参考。如对内容有疑问,请及时联系本站处理。

上篇龙芯CAN测试(sja1000)UML之一、为什么需要UML?下篇

宿迁高防,2C2G15M,22元/月;香港BGP,2C5G5M,25元/月 雨云优惠码:MjYwNzM=

相关文章

java字符编码和oracle乱码

编码问题我仍旧没搞懂,最根本的从哪里来就没搞懂。当页面发送请求,编码到后台是什么编码呢?好吧,我默认的都是utf-8.后台接收参数后,可以在控制台打印出来,我也不清楚是什么编码。然后,就是数据库问题。 在mysql数据库,首先会设置mysql安装的字符集为utf-8,然后在连接的jdbc上注明characterEncoding是utf-8.一直这样统一下去...

scanf正则表达式部分总结

正则表达式  scanf() 函数的正则用法:  scanf("%[^ ]",str) 其中的   表示保存的字符串以换行符为截止,并且不存储该换行符号,这句话的作用是允许该函数读入除换行符以外的空白符(空格,table),平时输入时,scanf()不能像gets()一样读入空格等空白符;  scanf("%*[^ ]");  其中  表示换行,其中*号表...

Maven学习总结(四):更改maven的编码格式方式

安装系统之后,一般中文系统默认字符集是GBK。我们安装的软件一般都继承使用操作系统的默认字符集。所以当在中文XP或者win7系统开发,在使用maven(mvn compile)编译项目的时候,就会出现“编码 gbk 的不可映射字符”: 这个是由于代码使用的UTF-8,而maven编译的时候使用的GBK的缘故。 可以通过修改项目的pom文件,可以告诉mave...

python学习--练习题111213--分阶段判断问题、输出指定日期格式问题、统计字符问题

练习11 #利用条件运算符的嵌套来完成此题:学习成绩>=90分的同学用A表示,60-89分之间的用B表示,60分以下的用C表示。 学习成绩=float(input("请输入你的学习成绩:")) def 分数判定(): if 学习成绩 <60: print("你的学习成绩在60以下,判定为C") elif 学习成绩...

linux ls命令按时间显示文件

  本文介绍下,使用ls命令显示文件,并按时间排序的方法,供大家学习参考。 在linux系统中,使用ls命令按时间排序文件,其实很简单,如下: #ls -tr 即可按时间排序当前目录下的文件。 附,ls命令的参数中文详解: -a 列出目录下的所有文件,包括以 . 开头的隐含文件。 -b 把文件名中不可输出的字符用反斜杠加字符编号(就象在C语言里一样)的形式...

简单验证码识别程序(源码)

摘自:http://www.lafdc.com/captcha/20080708.htm 简单验证码是指验证码图片里的字符,固定不变,或者变化很小的验证码,比如:字符上会有一些感扰点感扰线等情况,或者只有少数几种字体变化和字体大小变化。    这里给出源代码都是非常简单的源代码,学过《C程序设计》的都可以看懂,不会超出书本范围,而且不使用指针,这样VB,D...