关于php使用xpath解析html中文乱码问题

摘要:
1$str2='<divi=“content”>我很好<';2$dom=newDOMDocument();“UTF-8”);5$dom->加载HTML($str2);6$xpath=新DOMX路径($dom);7$元素=$xpath->查询(“//div[@id='content']”)->项目(0)->
1 $str2 = '<div id="content">我很好   </div>';     
2  $dom = new DOMDocument();
3  //load之前强转字符编码
4 $str2 = mb_convert_encoding($str2 ,'HTML-ENTITIES',"UTF-8");
5 $dom->loadHTML($str2);
6 $xpath = new DOMXPath($dom);
7 $element = $xpath->query("//div[@id='content']")->item(0)->nodeValue;
8  var_dump($element);

在处理html时,除了可以用正则外,可以考虑使用dom来解析。解决中文乱码就是在load文件之前,转换编码。

免责声明:文章转载自《关于php使用xpath解析html中文乱码问题》仅用于学习参考。如对内容有疑问,请及时联系本站处理。

上篇eclipse打断点的调试再论 Java 应用中的“领域建模”下篇

宿迁高防,2C2G15M,22元/月;香港BGP,2C5G5M,25元/月 雨云优惠码:MjYwNzM=

相关文章

redis 安装配置(开机启动)

1、安装wget     yum -y install wget 2、下载redis安装包(版本3.0以上) wget http://download.redis.io/releases/redis-3.0.4.tar.gz 3、安装redis    1)解压:tar -zxvf redis-3.0.4.tar.gz    2)进入src目录    3)m...

安装完SAP后BASIS的配置流程

安装完SAP后BASIS配置流程 安装完SAP后,配置流程. 1.升级kernel。 2.TCD SLICENSE: License Administration install > System Num. & license key 3.TCD STMS: Transport Management System 4.DDIC登录,密码为:1...

Oracle学习笔记:使用replace、regexp_replace实现字符替换、姓名脱敏

  在数据库中难免会遇到需要对数据进行脱敏的操作,无论是姓名,还是身份证号。   最近遇到一个需求,需要对姓名进行脱敏: 姓名长度为2,替换为姓+*; 姓名长度为3,替换中间字符为*; 姓名长度为4,替换第3个字符为*;   经过一番搜索之后,最终找到了3种方式的实现,具体如下。 一、先查找,再替换 select replace('陈宏宏',subst...

高通开发笔记

1.CIT暗码:*#*#00#*#*,*#*#564548#*#*  *#889#2.修改TP方向:echo 1 > sys/class/input/input0/device/flipx3.修改手机方向分辨率:    编译:device/qcom/d801/system.prop(ro.sf.lcd_density = 120  (没有就自己添加,...

[转帖]制作数据字典

  这部分内容和VB6的关系不大,但是确是困扰我的一个问题。 这几天在整理数据字典,以前的办法是用Excel来制作,一个一个的填写特别麻烦,制作到好说,关键就是一旦结果变更了,改来改去的麻烦死了。 后来改用数据库关系图来制作打印出来,看着还是那么回事情,但是表格的排序和查找太麻烦了,到底有没有好的办法呢? 当然有了,实际上在SqlServer中利用Sql语...

highcharts图表

<!--图表例子--> <!DOCTYPE HTML> <html> <head> <meta http-equiv="Content-Type" content="text/html; charset=utf-8"> <title>Highcharts Example...