python 文本文件的编码格式：ASCII编码和UNICODE编码

python 文本文件的编码格式：ASCII编码和UNICODE编码
欢迎关注博主 python老鸟或前往『Python自学网』，从基础入门免费课程开始，逐步深入学习python全栈体系课程，适合新手入门到精通全栈开发。

免费专栏传送门：《Python基础教程》

文本文件存储的内容是基于字符编码的文件，常见的编码有ASCII、UNICODE等
1. Python2.x默认使用ASCII编码
2. Python3.x默认使用UTF-8编码
一、ASCII编码和UNICODE编码

1.1》ASCII编码

ASCII编码可以说是最古老的编码了，是因为计算机最早是美国人发明的，美国人为了在计算机中使用自己的英语就制定了ASCII编码。
1. 计算机中只有256个ASCII字符
2. 一个ASCII在内存中占用一个字节的空间
3. 8个0/1的排列组合方式一共有256种，也就是2**8
ASCCI编码只有256个字符，虽然可以涵盖26个英文，但是汉子有数以万计的字符，ASCII编码并不能满足我们，因此UNICODE编码诞生。

1.2》UNICODE编码

UTF-8编码格式：
1. UTF-8是UNICODE编码的一种编码格式
2. 计算机中使用1~6个字节表示一个UTF-8字符，涵盖了地球上几乎所有地区的文字
3. 大多数汉子会使用3个字节表示
二、在Python2.x中如何使用中文

1、在python2.x文件的第一行增加以下代码，解释器会以UTF-8编码来处理Python文件
```
# *-* coding:utf8 *-*
'运行
```
提示：这种方式是官方推荐使用过的。

2、也可这样，=号两边不要空格
```
# coding=utf8
'运行
```
问题：

在python2.x中，即使指定了文件使用UTF-8的编码格式，但是在遍历字符串时，仍然会以字节为单位遍历字符串

答：

要能够正确的遍历字符串，在定义字符串时，需要在字符串的引导前增加一个小写字母u，告诉解释器这事一个unicode字符串（是使用UTF-8编码更是的字符串）

代码：这段代码在python2.x中汉子会出现很多符号
```
str = u"Python自学网"
 
for a in str:
    print(a)
'运行
```
代码优化：加u
```
# 引号前面的u告诉解释器这事一个utf-8编码格式的字符串
str = u"Python自学网"
 
for a in str:
    print(a)
'运行
```
三、万一Python3.x中不能读取文件里面的中文怎么办？

Python3.X 源码文件默认使用utf-8编码，所以可以正常解析中文，无需指定 UTF-8 编码。

python3查看默认编码：

模块：python3 sys.getdefaultencoding().py

作用：获取系统默认编码方式

代码：
```
import sys
print(sys.getdefaultencoding())
'运行
```
结果：utf-8

万一Python3.x中不能读取文件里面的中文怎么办？

解决：编写encoding=”UTF-8”

例如：
```
file = open("HELLO", encoding="UTF-8")
```
相关阅读:
transforms数据预处理【图像增强】 -＞（个人学习记录笔记）
`Algorithm-Solution` `LeetCode` 6256. 将节点分成尽可能多的组
 互联网医院系统：数字化时代中医疗服务的未来
 【前端工程化】经验总结
 【Maven学习】3.6 实验六：测试依赖的范围
 【AIGC核心技术剖析】扩大富有表现力的人体姿势和形状估计SMPLer-X模型
 「南凌科技SASE DAY」助力企业数字化转型的挑战和应对实践
 文件（图片，视频）技术
 Android Studio Bumblebee | 2021.1.1 发布，快来看看更新了什么
 B端系统从0到1：有几步，其中需求分析要做啥？
原文地址：https://blog.csdn.net/weixin_48728769/article/details/126957569

一、ASCII编码和UNICODE编码

1.1》ASCII编码

1.2》UNICODE编码

二、在Python2.x中如何使用中文

三、万一Python3.x中不能读取文件里面的中文怎么办？