• python去除列表中重复元素的方法


    列表中元素位置的索引用的是L.index

    本文实例讲述了Python去除列表中重复元素的方法。分享给大家供大家参考。具体如下:

    比较容易记忆的是用内置的set

    l1 = ['b','c','d','b','c','a','a'] 
    l2 = list(set(l1)) 
    print (l2)
    
    • 1
    • 2
    • 3

    还有一种据说速度更快的,没测试过两者的速度差别

    l1 = ['b','c','d','b','c','a','a'] 
    l2 = {}.fromkeys(l1).keys() 
    print (l2)
    
    • 1
    • 2
    • 3

    这两种都有个缺点,祛除重复元素后排序变了:

    ['a', 'c', 'b', 'd']
    
    • 1

    如果想要保持他们原来的排序:

    用list类的sort方法

    l1 = ['b','c','d','b','c','a','a'] 
    l2 = list(set(l1)) 
    l2.sort(key=l1.index) 
    print (l2)
    
    • 1
    • 2
    • 3
    • 4

    也可以这样写

    #Python学习交流群:711312441
    l1 = ['b','c','d','b','c','a','a'] 
    l2 = sorted(set(l1),key=l1.index) 
    print (l2)
    
    • 1
    • 2
    • 3
    • 4

    也可以用遍历

    l1 = ['b','c','d','b','c','a','a'] 
    l2 = [] 
    for i in l1: 
      if not i in l2: 
        l2.append(i) 
    print (l2)
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6

    上面的代码也可以这样写

    l1 = ['b','c','d','b','c','a','a'] 
    l2 = [] 
    [l2.append(i) for i in l1 if not i in l2] 
    print (l2)
    
    • 1
    • 2
    • 3
    • 4

    这样就可以保证排序不变了

    在pythoncook里边提到的一种面向可哈希数据的取出相同元素的方法是:利用到了集合与生成器set、yield

    def dedupe(items):
    seen = set()
    for item in items:
    if item not in seen:
    yield item
    seen.add(item) 
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6

    不可变类型可哈希,可变类型不可哈希,对于不可哈希的数据
    上述代码改成:

    def dedupe(items, key=None):
    seen = set()
    for item in items:
    val = item if key is None else key(item)
    if val not in seen:
    yield item
    seen.add(val)
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
  • 相关阅读:
    基于Web的图书管理系统运行教程
    Android 10.0 11.0 12.0 启动模拟器教程
    一文读懂 BizDevOps:数字化转型下的技术破局
    SQL Server数据库查询优化
    JS element从数组中取出两个字段组成新的数组
    (二十七)admin-boot项目之集成websocket实时推送消息
    5W2H模拟
    [NOI2007] 调兵遣将
    Shellshock
    python基于百度sdk语音转文字
  • 原文地址:https://blog.csdn.net/qdPython/article/details/127791219