关于python中的字符串编码理解

python2.x 中 中间编码为unicode,一个字符串需要 decode为unicode,再encode为其它编码格式(gbk、utf8等)

以gbk转utf8为例:

具体过程为:

s | gbk — decode(‘gbk’) —> s | unicode — encode(‘utf8’) —> s | utf8

代码中的 显式字符串默认编码为代码文件的编码格式,如果开头没有#coding=[]声明,则默认编码为ascii型(所以存储中文会有问题)

如果是在开头声明的,例如:

[En]

If it is declared at the beginning, for example:

coding=gbk

代码中有一个显式字符串,例如:

[En]

There is an explicit string in the code, for example:

s = ‘我是字符串’

字符串s会被编码成 gbk 格式存储

Original: https://www.cnblogs.com/yym2013/p/5924507.html
Author: Freecode
Title: 关于python中的字符串编码理解

原创文章受到原创版权保护。转载请注明出处:https://www.johngo689.com/7901/

转载文章受原作者版权保护。转载请注明原作者出处!

(0)

大家都在看

免费咨询
免费咨询
扫码关注
扫码关注
联系站长

站长Johngo!

大数据和算法重度研究者!

持续产出大数据、算法、LeetCode干货,以及业界好资源!

2022012703491714

微信来撩,免费咨询:xiaozhu_tec

分享本页
返回顶部
最近整理资源【免费获取】:   👉 程序员最新必读书单  | 👏 互联网各方向面试题下载 | ✌️计算机核心资源汇总