码农知识堂 - 1000bd
  •   Python
  •   PHP
  •   JS/TS
  •   JAVA
  •   C/C++
  •   C#
  •   GO
  •   Kotlin
  •   Swift
  • python文本编码格式问题【合集】


    目录

    一.读取文件编码错误

    二.json文件读取出现乱码

    三.命令行输出信息读取错误


    文本编码格式问题是文件操作中很常见中的问题,常与中文编码有关,以下将列出几种编码格式出问题的情况和解决办法。

    一.读取文件编码错误

    情境:运行linestr = file.readline()代码出现

    UnicodeDecodeError: 'utf-8' codec can't decode byte 0xb0 in position 84: invalid start byte

    的报错。

    原因:Unicode解码错误,无法解码位置为84的oxbo,无效启动方式

    解决办法:

    1.读取文件时将编码方式由‘utf-8’改为‘gb18030’    (一般不建议这么做)

    2.将文件编码格式修改为‘utf-8‘ 格式,如果该文件是你自己写入的,在写入时就应以

    encoding='utf-8'方式进行文件写入

    二.json文件读取出现乱码

    情景:对Json进行读取后进行一些修改,然后重新写入原文件中,结果编码错误中文显示异常

    1. import json
    2. if path and os.path.exists(path):
    3. resCheckDict = json.load(open(path, "r", encoding='utf-8'))
    4. resCheckDictContents = resCheckDict["Contents"]
    5. for i in range(0, len(resCheckDictContents)):
    6. resCheckDictContents["index"] = "次序:"+i
    7. json_str = json.dumps(resCheckDict, indent=4)
    8. with open(path, 'w', encoding='utf-8') as json_file:
    9. json_file.write(json_str)

    解决办法:ensure_ascii默认是True,将ensure_ascii设置为False即可

    ensure_ascii=False

    三.命令行输出信息读取错误

    情景:执行命令行

    po = os.popen(filelogcCmd).read()
    • UnicodeDecodeError: 'gbk' codec can't decode byte 0x88 in position 241: illegal multibyte sequence

     解决办法;修改读取方式为

    1. po = os.popen(filelogcCmd)
    2. filelogOutPut = po.buffer.read().decode('utf-8')

    四.中文输出乱码

    情景:python3输出中文乱码,默认输出文本非utf8格式

    1. import os
    2. import codecs
    3. sys.stdout = codecs.getwriter("utf-8")(sys.stdout.detach())

    未完待续

  • 相关阅读:
    网站首页颜色变灰色
    小 A 的卡牌游戏(Gym - 103186B)
    新增TOP!10月SCI/SSCI/EI刊源表已更新!
    JavaWeb-CSS
    标点恢复--Incorporating External POS Tagger for Punctuation Restoration
    C++_模板函数重载
    软件测试中的测试左移与测试右移
    js里的async/await
    基于matlab的排队系统仿真
    直流有刷电机驱动基于STM32F302R8+X-NUCLEO-IHM07M1(二)
  • 原文地址:https://blog.csdn.net/qq_38704727/article/details/126480074
  • 最新文章
  • 攻防演习之三天拿下官网站群
    数据安全治理学习——前期安全规划和安全管理体系建设
    企业安全 | 企业内一次钓鱼演练准备过程
    内网渗透测试 | Kerberos协议及其部分攻击手法
    0day的产生 | 不懂代码的"代码审计"
    安装scrcpy-client模块av模块异常,环境问题解决方案
    leetcode hot100【LeetCode 279. 完全平方数】java实现
    OpenWrt下安装Mosquitto
    AnatoMask论文汇总
    【AI日记】24.11.01 LangChain、openai api和github copilot
  • 热门文章
  • 十款代码表白小特效 一个比一个浪漫 赶紧收藏起来吧!!!
    奉劝各位学弟学妹们,该打造你的技术影响力了!
    五年了,我在 CSDN 的两个一百万。
    Java俄罗斯方块,老程序员花了一个周末,连接中学年代!
    面试官都震惊,你这网络基础可以啊!
    你真的会用百度吗?我不信 — 那些不为人知的搜索引擎语法
    心情不好的时候,用 Python 画棵樱花树送给自己吧
    通宵一晚做出来的一款类似CS的第一人称射击游戏Demo!原来做游戏也不是很难,连憨憨学妹都学会了!
    13 万字 C 语言从入门到精通保姆级教程2021 年版
    10行代码集2000张美女图,Python爬虫120例,再上征途
Copyright © 2022 侵权请联系2656653265@qq.com    京ICP备2022015340号-1
正则表达式工具 cron表达式工具 密码生成工具

京公网安备 11010502049817号