平常在编辑文本的时候,特别是中英文混合的情况下格式不能规范。标点符号使用不正确,一会在中文状态下,一下英文状态下真的是很难把控。
有一个很棒的python模块,叫做 pangu , 它可以在中文、日文、韩文和半角字符(字母,数字和符号)之间自动插入空格。
1、准备
使用pip的安装方式安装pangu,或者使用其他方式也可以,这里采用pip的方式。安装可以选择清华大学的镜像站速度杠杠的。
pip install -i https://pypi.tuna.tsinghua.edu.cn/simple pangu
安装完成之后,将pangu模块直接导入到代码块中。
import pangu as gu
2、美化字符串
pangu 模块提供了spacing_text函数,直接传递文本字符串可以直接完成对文本的美化效果,规范好格式。
# 规范文本输出
text = gu.spacing_text('你好Siri,欢迎来到Python集中营!')
# 打印结果
print(text)
# 你好 Siri,欢迎来到 Python 集中营!
结果直接将输入的字符串文本进行规范化了,看起来顺眼多了。
也可以不使用python代码直接在命令行执行需要格式美化的字符串即可,前提是你已经安装了pangu模块。
python -m pangu "你好Siri,欢迎来到Python集中营!"
执行后的美化效果和在代码块中一样的,更加方便。
3、美化文件
pangu模块除了能完成对字符串的规范美化,对于文本文件也是支持的,而且也是直接通过命令行执行,不需要写单独的代码块。
接下来演示一下效果,创建一个file.txt文本文件,将需要美化的文本放到里面。
在命令行直接执行看一下效果有没有达到理想的要求,下面是命令行美化文件的命令。
python -m pangu --file C:/file.txt
之后,美化后文件中的内容可以打印到命令行中,直接看到效果。
当然,也可以将规范美化后的文件直接输出保存另外一个新的文本文件中。
通过在命令行执行命令时,将规范美化的文本内容追加写入到新的文本文件pangu_file.txt中即可。
python -m pangu --file C:/file.txt >> C:/pangu_file.txt