字符集与乱码

嚯霍嚯

关注

阅读 48

2022-02-14

了解:ASCII码

数量:128个字符
编码规则:只占用了一个字节的后面7位,最前面的1位统一规定为0
常用:A(65)、a(97)

了解:Unicode编码

内容:包含世界上所有的符号
规则:

  • 只规定了每个符号的二进制代码
  • 每个符号用3 or 4个字节表示

了解:UTF-8

和Unicode的关系:是Unicode的一种实现方式
编码规则:

常见场景

保存(.Java)文件

中文操作系统下,保存文件默认编码ANSI,相当于GBK,能识别中文字符。
解析时,命令行默认使用GBK的方式进行解析

精彩评论(0)

0 0 举报