• python 实现两个文本文件内容去重


    嗨喽,大家好呀~这里是爱看美女的茜茜呐


    👇 👇 👇 更多精彩机密、教程,尽在下方,赶紧点击了解吧~

    python源码、视频教程、插件安装教程、资料我都准备好了,直接在文末名片自取就可


    实现两个文本内容去重,输出两个文本不重复的结果

    两个测试文本内容如下

    1.txt中内容为 1 2 3 4 5 6 7 8
    2.txt中内容为 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 
    
    • 1
    • 2

    分别读取两个文本的内容

    读取1.txt的内容,具体实现如下:

    str1 = []
    file_1 = open("1.txt","r",encoding="utf-8")
    for line in file_1.readlines():
        str1.append(line.replace("\n",""))
    
    • 1
    • 2
    • 3
    • 4

    读取2.txt的内容,具体实现如下:

    '''
    遇到问题没人解答?小编创建了一个Python学习交流QQ群:261823976
    寻找有志同道合的小伙伴,互帮互助,群里还有不错的视频学习教程和PDF电子书!
    '''
    str2 = []
    file_2 = open("2.txt", "r", encoding="utf-8")
    for line in file_2.readlines():
        str2.append(line.replace("\n", ""))   
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8

    取出重复的内容

    创建一个空列表,将两个文件中重复的内容取出来,具体实现如下:

    str_dump = []
    for line in str1:
        if line in str2:
            str_dump.append(line)    #将两个文件重复的内容取出来
    
    • 1
    • 2
    • 3
    • 4

    去掉重复内容

    将两个文本的内容合并,去除重复的内容

    '''
    遇到问题没人解答?小编创建了一个Python学习交流QQ群:261823976
    寻找有志同道合的小伙伴,互帮互助,群里还有不错的视频学习教程和PDF电子书!
    '''
    str_all = set(str1 + str2)      #将两个文件放到集合里,过滤掉重复内容
    for i in str_dump:              
        if i in str_all:
            str_all.remove(i)       #去掉重复的文件
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8

    完整代码如下

    def file_qc():
        str1 = []
        file_1 = open("1.txt","r",encoding="utf-8")
        for line in file_1.readlines():
            str1.append(line.replace("\n",""))
    
        str2 = []
        file_2 = open("2.txt", "r", encoding="utf-8")
        for line in file_2.readlines():
            str2.append(line.replace("\n", ""))
    
        str_dump = []
        for line in str1:
            if line in str2:
                str_dump.append(line)    #将两个文件重复的内容取出来
    
        str_all = set(str1 + str2)      #将两个文件放到集合里,过滤掉重复内容
    
        for i in str_dump:              
            if i in str_all:
                str_all.remove(i)		#去掉重复的文件
    
        for str in str_all:             #去重后的结果写入文件
            print(str)
            with open("qc_V.txt","a+",encoding="utf-8") as f:
                f.write(str + "\n")
    
    if __name__=="__main__":
        file_qc()
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14
    • 15
    • 16
    • 17
    • 18
    • 19
    • 20
    • 21
    • 22
    • 23
    • 24
    • 25
    • 26
    • 27
    • 28
    • 29

    输出结果为

    尾语

    感谢你观看我的文章呐~本次航班到这里就结束啦 🛬

    希望本篇文章有对你带来帮助 🎉,有学习到一点知识~

    躲起来的星星🍥也在努力发光,你也要努力加油(让我们一起努力叭)。

    最后,宣传一下呀~👇👇👇更多源码、资料、素材、解答、交流皆点击下方名片获取呀👇👇

  • 相关阅读:
    String的trim()和substring()详解
    使用idea搭建SpringCloud项目(及所遇到的坑)
    探索跨境电商产品开发流程的最佳工具
    C#练习题-构造函数
    【案例】3D地球(vue+three.js)
    Django中的事务
    【25】c++设计模式——>责任链模式
    第十九章绘图
    csdn涨薪技术之UI⾃动化⼯具: UiAutomator2
    Python对文件的创建和读写操作
  • 原文地址:https://blog.csdn.net/m0_72282564/article/details/133207062