在python2.x版本中,python默认的编码方式是ASCII编码,当程序中出现非ASCII编码时,程序会报错:
UnicodeDecodeError: 'ascii' codec can't decode byte 0x?? in position 1: ordinal not in range(128)
因为,此时python无法处理非ASCII编码的程序。
解决这个问题的方法是修改python的默认编码方式,具体方式是,在脚本头部中添加以下代码:
- import sys
- reload(sys) # 加载python编译系统
- sys.setdefaultencoding(‘utf8’) # 把python的默认编码方式修改为“utf-8”方式
以上是python2的写法,在python3中这个需要已经不存在了,因为python3已经不存在这个问题了:在Python2.x中由于str和byte之间没有明显区别,经常要依赖于defaultencoding来做转换;而在python3中有了明确的str和byte类型区别,从一种类型转换成另一种类型要显式指定encoding。换句话说,python2.x默认使用的是ASCII编码,而python3.X已经默认使用“utf-8”编码了。
但是,即便如此,为了保险起见,或者习惯的原因,很多程序员在python3.x编程中,仍旧保留了 reload(sys)的习惯,不过命令的使用方式发生了变化,变成了以下模式:
- import importlib,sys
- importlib.reload(sys)
方法:
- import sys
- sys.getdefaultencoding()
在我的python3.8中的结果:
- (base_env) PS D:\code\project> python
- Python 3.8.15 (default, Nov 24 2022, 14:38:14) [MSC v.1916 64 bit (AMD64)] :: Anaconda, Inc. on win32
- Type "help", "copyright", "credits" or "license" for more information.
- >>> import sys
- >>> sys.getdefaultencoding()
- 'utf-8'
- >>>
由上可见,python3.8的默认编码方式已经是“utf-8”了。
参考: