python字符编码

摘要:
python有两种字符串类型,str、unicode,这两者都是basestring的子类str是字节串,而unicode则是真正意义上的字符串str可以通过decode()函数转换成unicode;unicode可以通过encode()函数转换成str。#假如我知道一串编码是用utf-8编写的,怎么转成gbk呢u=s.decode#将utf-8的str转换为unicodeg=u.encode#将unicode转换为str,编码为GBK#或s.decode.encode根据图形进行转换即可如何查看字符的编码格式?

字符编码的转换

编码问题一直是个难以理解的问题,莫名其妙转换来转换去的,程序的结果就能正确输出,最后还是留出一点时间开始理解这个棘手的问题。

python有两种字符串类型,str、unicode,这两者都是basestring的子类

python字符编码第1张

str是字节串,而unicode则是真正意义上的字符串

str可以通过decode()函数转换成unicode;

unicode可以通过encode()函数转换成str。

unicode是支持所有文字的统一编码,但一般只用作文字的内部表示,文件、网页(也是文件)、屏幕输入输出等处均需使用具体的外在编码,如GBK、UTF-8

unicode是一种二进制编码,所有的utf-8和gbk编码都得通过unicode编码进行转译,utf-8和gbk编码之间不能直接转换,要在unicode之间过个场才能转换。

python字符编码第2张

#假如我知道一串编码是用utf-8编写的,怎么转成gbk呢
u = s.decode("utf-8") # 将utf-8的str转换为unicode
g = u.encode('GBK') # 将unicode转换为str,编码为GBK
#或
s.decode('utf-8').encode('gbk')

根据图形进行转换即可

如何查看字符的编码格式?

下载第三方模块chardet

import chardet  
s = '汉字'  
print chardet.detect(s) 
>>> {'confidence': 0.99, 'encoding': 'utf-8'} #chardet.detect()返回字典,其中confidence是检测精确度,encoding是编码形式

免责声明:文章转载自《python字符编码》仅用于学习参考。如对内容有疑问,请及时联系本站处理。

上篇合并本地Maven仓库WPF设置dataGrid checkBox列的样式下篇

宿迁高防,2C2G15M,22元/月;香港BGP,2C5G5M,25元/月 雨云优惠码:MjYwNzM=

相关文章

python中json.loads 返回类型是str 而不是 dict

   解析本地文件中的Json文件时,json.loads 之后的返回类型是str ,直接上代码 import json with open ("urlJson.txt",'r',encoding='utf-8') as f: data = f.read() json_str = json.dumps(data) print (t...

基于python的种子搜索网站-开发过程

本讲会对种子搜索网站的开发过程进行详细的讲解。 源码地址:https://github.com/geeeeeeeek/bt 项目开发过程 项目简介 该项目是基于python的web类库django开发的一套web网站,做为本人的毕业设计。本人的研究方向是一项关于搜索的研究项目。在该项目中,笔者开发了一个简单版的搜索网站,实现了对数据库数据的检索和更新。 网...

【python】Threadpool线程池任务终止简单示例

需求 加入我们需要处理一串个位数(0~9),奇数时需要循环打印它;偶数则等待对应时长并完成所有任务;0则是错误,但不需要终止任务,可以自定义一些处理。 关键点 定义func函数处理需求 callback处理返回结果,只有偶数和0返回;奇数会一直执行;要控制线程池状态,则需要针对偶数和0时抛出异常,并捕获异常处理。 threadpool定义线程池并发 实现...

git_stats安装及使用

 git_stats是仓库代码统计工具,今天我们要求用git_stats工具做项目的代码统计,也是一步一坑的找到了一些方法,在这里记录一下 Window环境安装与使用 git_stats可以在windows和linux使用,但是集成方式有点不太一样,我目前尝试的是win版本的,在这里就先记录win版本的安装及使用,Linux环境的后期需要可以再补充 git...

实战|手把手教你如何使用抓包神器MitmProxy

大家好,我是阿辰,今天教大家如何使用MitmProxy抓包工具。 玩爬虫的小伙伴都知道,抓包工具除了MitmProxy外,还有Fiddler、Charles以及浏览器netwrok等 既然都有这么多抓包工具了,为什么还要会用MitmProxy呢??今天教大家使用MitmProxy抓包工具的原因,主要有以下几点: 不需要安装软件,直接在线(浏览器)进行抓...

python下编译py成pyc和pyo

其实很简单,用python -m py_compile file.py python -m py_compile /root/src/{file1,file2}.py编译成pyc文件。也可以写份脚本来做这事:Code: import py_compile py_compile.compile('path') //path是包括.py文件名的路径 用py...