字节

摘要:
字节是计算机信息技术用于计量存储容量和传输容量的一种计量单位,1个字节等于8位二进制。举例:英文句号“.”占1个字节的大小,中文句号“。”同样的字节序列,在不同的字符集下表示的字符不一样。UNICODE字符串在内存中,如果“字符”是以在Unicode中的序号存在的,那么我们称这种字符串为Unicode字符串或者宽字节字符串。在Unicode中,每个字符都占两个字节。
字节(Byte):字节是通过网络传输信息(或在硬盘或内存中存储信息)的单位。
字节是计算机信息技术用于计量存储容量和传输容量的一种计量单位,1个字节等于8位二进制。
在ASCII码中,一个英文字母(不分大小写)占一个字节的空间,一个中文汉字占两个字节的空间。
符号:英文标点占一个字节,中文标点占两个字节。举例:英文句号“.”占1个字节的大小,中文句号“。”占2个字节的大小
一个二进制数字序列,在计算机中作为一个数字单元,一般为8位二进制数,如一个ASCII码就是一个字节,此类单位的换算为:
1千吉字节(TB,Terabyte)=1024吉字节(2的40次方字节)
(1TB=1024GB)
1吉字节(GB,Gigabyte)=1024兆字节(2的30次方字节)
(1GB=1024MB)
1兆字节(MB,Megabyte)=1024千字节(2的20次方字节)
(1MB=1024KB)
1千字节(KB,Kilobyte)=1024字节(2的10次方字节)(1KB=1024B)
1字节(Byte)= 8位(bit)
注:TB是现在电脑硬盘最大的存储量单位。10TB大约等于一个人脑的存储量。
更大的单位,还有 PB(Petabyte,1PB=1024TB)、EB(Exabyte,1EB=1024PB)、ZB(Zettabyte,1ZB=1024EB)、YB(Yottabyte,1YB=1024ZB)……
1.2 字符,字节,字符串
理解编码的关键,是要把字符的概念和字节的概念理解准确。这两个概念容易混淆,我们在此做一下区分:
概念描述 举例
字符 人们使用的记号,抽象意义上的一个符号。 '1', '中', 'a', '$', '¥', ……
字节 计算机中存储数据的单元,一个8位的二进制数,是一个很具体的存储空间。0x01, 0x45, 0xFA, ……
ANSI 字符串
在内存中,如果“字符”是以ANSI编码形式存在的,一个字符可能使用一个字节或多个字节来表示,那么我们称这种字符串为 ANSI 字符串或者多字节字符串。如,"中文123" (占7字节)。
字符集和代码页
对于ANSI编码方式,存在不同的字符集(Charset)。同样的字节序列,在不同的字符集下表示的字符不一样。要正确解析一个ANSI字符串,还要选择正确的字符集,否则就可能导致所谓的乱码现象。不同语言版本的操作系统,都有一个默认的字符集。在不指定字符集的情况下,系统会使用此字符集来解析 ANSI 字符串。也就是说,如果我们在简体中文版的Windows下打开了一个由日文操作系统保存的 ANSI 文本文件(仅包含 ANSI 字符串的文本文件),我们看到的将是乱码。但是,如果我们使用Visual Studio之类的带编码选择的文本编辑器打开此文件,并且选择正确的字符集,我们将可以看到它的原貌。注意:简体中文字符集中的繁体字和繁体中文字符集中的繁体字,编码不一定相同(事实证明,似乎是完全不同)。
每个字符集都有一个唯一的编号,称为代码页(Code Page)。简体中文(GB2312)的代码页为936,而系统默认字符集的代码页为0,它表示根据系统的语言设置来选择一个合适的字符集。
UNICODE
字符串 在内存中,如果“字符”是以在Unicode中的序号存在的,那么我们称这种字符串为Unicode字符串或者宽字节字符串。在Unicode中,每个字符都占两个字节。如,"中文123"(占10字节)。
Unicode和ANSI的区别就相当于输入法内的“全角”和“半角”的区别。
由于不同 ANSI 编码所规定的标准是不相同的(字符集不同),因此,对于一个给定的多字节字符串,我们必须知道它采用的是哪一种字符集则,才能够知道它包含了哪些“字符”。而对于 UNICODE 字符串来说,不管在什么环境下,它所代表的“字符”内容总是不变的。Unicode 有着统一的标准,它定义了世界上绝大多数的字符的编码,使得拉丁文、数字、简体中文、繁体中文、日文都能一同一种编码方式保存。
华丽的分隔线
*****************************************************************************************************************************************

免责声明:文章转载自《字节》仅用于学习参考。如对内容有疑问,请及时联系本站处理。

上篇RabbitMQ内存爆出问题解决思路windows下mysql数据库表名大小写不敏感下篇

宿迁高防,2C2G15M,22元/月;香港BGP,2C5G5M,25元/月 雨云优惠码:MjYwNzM=

相关文章

虚拟内存页面文件pagefile.sys(棉文件)改变存放位置

“pagefile.sys”是页面交换文件,切记,这个文件不能删除,但是可以改变其大小和存放位置:右击“我的电脑/属性”,然后在对话框的“高级”标签下单击“性能”下的“设置”按钮,在”性能选项”对话框中切换到“高级”标签下,再单击“虚拟内存”下的“更改”按钮,即可根据需要更改页面文件的大小——先选中c盘,然后选“无分页文件”,再点“设置”按钮;之后选中要生...

mac 添加安卓设备的支持

1. 把android设备插到mac电脑上 2. 首先可以看一下之前在该mac电脑上有没有添加过这个 , 命令 : adb devices 如果显示出,下面字样,说明之前添加过了,下面就可以不用再看了。 List of devices attached 42f6940daa32bf91device 3. 添加android设备第一步:打开终端,输...

python--“re”详解

一、什么是正则表达式? 正则表达式(regular expression)描述了一种字符串匹配的模式,可以用来检查一个串是否含有某种子串、将匹配的子串做替换或者从某个串中取出符合某个条件的子串等。 正则表达式的组件可以是单个的字符、字符集合、字符范围、字符间的选择或者所有这些组件的任意组合。  二、正则表达式的基本语法。 1.备选字符集  语法:[可选字符...

凤凰系统(Phoenix OS)PC版安装,电脑上体验功能丰富的安卓系统

PC版(X86版)ISO镜像下载地址:http://www.phoenixos.com/download_x86 下载完成后,可按照官方给出的安装教程进行安装。 凤凰系统帮助中心:http://www.phoenixos.com/help 如果是想通过虚拟机的方式安装体验,推荐使用VirtualBox,按照Legacy的引导方式进行安装;在本人的电脑上使用...

手机数据抓包以及wireshark技巧

阅读目录 抓包工具介绍 Wireshark手机抓包 Wireshark常用技巧 本文主要讨论一种非常方便的抓取Android和iphone手机网络数据包的办法,以及介绍wireshark最常用的技巧 回到顶部 抓包工具介绍 (1).网页抓包工具    Chrome浏览器插件    FireBug 插件      HttpWatch    Fid...

Office办公软件操作技巧 office快捷键大全

››››F键 F1:显示「帮助」任务窗格。 F2+shift:添加或编辑单元格批注 F3+shift:显示「插入函数」对话框 F4:重复上一个命令或操作 F5+G:显示「定位」对话框 F9+ctrl:最小化窗口 F10:打开或关闭窗口 ››››ctrl键 ctrl+1:显示「设置单元格格式」 ctrl+2:应用或取消加粗格式 ctrl+3:应用或取消倾斜格...