去除 UTF-8 文件 BOM 头,带有BOM的UTF-8

去除 UTF-8 文件 BOM 头

摘要：

出现在文本文件的标题中。它在Unicode编码标准中用于标识文件的格式。例如，当UTF-8编码的文件保存在记事本中时，三个不可见的字符“0xEF0xBB0xBF”将自动插入文件开头。但是，通常不需要此标头来标识文件的代码。PHP代码中BOM的存在将导致页面第一行出现意外的空白。要删除BOM，请打开vim并键入：setbomb，按Enter键显示bomb以指示文件有BOM，按nobom以指示文件没有BOM；键入：setnobomb并按Enter键。打开记事本++，单击菜单栏-，然后保存。

什么是 BOM？

BOM 全称是 Byte Order Mark（字节顺序标记）。出现在文本文件头部，Unicode 编码标准中用于标识文件是采用哪种格式的编码。比如：当用记事本保存一个以 UTF-8 编码的文件时，会自动在文件开始自动插入三个不可见字符“0xEF 0xBB 0xBF”，但是通常情况下不需要这个头部来识别文件的编码，在PHP代码中存在BOM，会导致网页的首行存在预料外的间隙。

去除 BOM 方法

【方法一】打开 vim

键入 :set bomb，回车，显示 bomb 表示文件有 BOM，nobom 表示文件无 BOM；

键入 :set nobomb，并回车。

【方法二】打开 notepad++

依次点击菜单栏【格式】-【以 UTF-8 无 BOM 格式编码】，并保存。

【方法三】sed 命令

utf-8 编码文件的 BOM 是 “0xEF 0xBB 0xBF”（更多 BOM 请点击），针对 utf-8 编码文件去掉 BOM：

// 生成新文件
sed '1s/^xEFxBBxBF//' < orig.txt > new.txt

或

// 直接覆盖老文件
sed -i '1s/^xEFxBBxBF//' orig.txt

参考链接：

How can I remove the BOM from a UTF-8 file?（https://unix.stackexchange.com/questions/381230/how-can-i-remove-the-bom-from-a-utf-8-file）

免责声明：文章转载自《去除 UTF-8 文件 BOM 头》仅用于学习参考。如对内容有疑问，请及时联系本站处理。

去除 UTF-8 文件 BOM 头

什么是 BOM？

去除 BOM 方法

【方法一】打开 vim

【方法二】打开 notepad++

【方法三】sed 命令

相关文章

maven之BOM及BOM和provided的一个小坑

如何判断数据库中存储的是不是乱码

MAC安装MySQL踩过坑

3、Python字符编码区分utf-8和utf-8-sig

Ansi,UTF8,Unicode编码（续）

MYSQL8.0+ 使用JDBC查询中文乱码的问题

最新文章

随机推荐

思享工具箱导航

JSON工具

格式化转换

加解密编码

文本数字

网络

站长

计算

其他

对照列表