• 【Python】容器数据类型案例和技巧


    Python容器数据类型使用小技巧

    Python中提供了非常丰富的容器型数据类型,大家最为熟悉的有listtuplesetdict等。下面为大家分享一些使用这些类型的小技巧,希望帮助大家写出更加Pythonic的代码。

    从字典中取最大

    假设字典对象对应的变量名为my_dict

    • 取出最大值

      max(my_dict.values())
      
      • 1
    • 取值最大值的键

      max(my_dict, key=my_dict.get)
      
      • 1
    • 取出最大值的键和值

       max(my_dict.items(), key=lambda x: x[1])
      
      • 1

      import operator
      
      max(my_dict.items(), key=operator.itemgetter(1))
      
      • 1
      • 2
      • 3

      说明:上面用到了operator模块的itemgetter函数,这个函数的的作用如下所示。在上面的代码中,itemgetter帮我们获取到了二元组中的第2个元素。

      def itemgetter(*items):
       if len(items) == 1:
           item = items[0]
           def g(obj):
               return obj[item]
       else:
           def g(obj):
               return tuple(obj[item] for item in items)
       return g
      
      • 1
      • 2
      • 3
      • 4
      • 5
      • 6
      • 7
      • 8
      • 9

    统计列表元素出现次数

    假设列表对象对应的变量名为my_list

    {x: my_list.count(x) for x in set(my_list)}
    
    • 1

    from itertools import groupby
    
    {key: len(list(group)) for key, group in groupby(sorted(my_list))}
    
    • 1
    • 2
    • 3

    说明groupby函数会将相邻相同元素分到一个组中,所以先用sorted函数排序就是为了将相同的元素放到一起。

    from collections import Counter
    
    dict(Counter(my_list))
    
    • 1
    • 2
    • 3

    截断列表元素

    假设列表对象对应的变量名为my_list,通常大家会想到用下面的方式来截断列表。

    my_list = my_list[:i]
    my_list = my_list[j:]
    
    • 1
    • 2

    然而,更好的方式使用下面的操作,大家可以认真想想为什么。

    del my_list[i:]
    del my_list[:j]
    
    • 1
    • 2

    按最长列表实现zip操作

    Python的内置函数zip可以产生一个生成器对象,该生成器对象将两个或多个可迭代对象的元素组装到一起,如下所示。

    list(zip('abc', [1, 2, 3, 4]))
    
    • 1

    执行上面的代码会得到一个如下所示的列表,相信大家也注意到了,列表中元素的个数是由zip函数中长度最小的可迭代对象决定的,所以下面的列表中只有3个元素。

    [('a', 1), ('b', 2), ('c', 3)]
    
    • 1

    如果希望由zip函数中长度最大的可迭代对象来决定最终迭代出的元素个数,可以试一试itertools模块的zip_longest函数,其用法如下所示。

    from itertools import zip_longest
    
    list(zip_longest('abc', [1, 2, 3, 4]))
    
    • 1
    • 2
    • 3

    上面的代码创建出的列表对象如下所示。

    [('a', 1), ('b', 2), ('c', 3), (None, 4)]
    
    • 1

    快速拷贝一个列表

    如果希望快速拷贝一个列表对象,可以通过切片操作来实现,但是切片操作仅实现了浅拷贝,简单的说就是切片创建了新的列表对象,但是新列表中的元素是和之前的列表共享的。如果希望实现深拷贝,可以使用copy模块的deepcopy函数。

    • 浅拷贝

      thy_list = my_list[:]
      
      • 1

      import copy
      
      thy_list = copy.copy(my_list)
      
      • 1
      • 2
      • 3
    • 深拷贝

      import copy
      
      thy_list = copy.deepcopy(my_list)
      
      • 1
      • 2
      • 3

    对两个或多个列表对应元素进行操作

    Python内置函数中的map函数可以对一个可迭代对象中的元素进行“映射”操作,这个函数在批量处理数据时非常有用。但是很多人都不知道,这个函数还可以作用于多个可迭代对象,通过传入的函数对多个可迭代对象中的对应元素进行处理,如下所示。

    my_list = [11, 13, 15, 17]
    thy_list = [2, 4, 6, 8, 10]
    list(map(lambda x, y: x + y, my_list, thy_list))
    
    • 1
    • 2
    • 3

    上面的操作会得到如下所示的列表。

    [13, 17, 21, 25]
    
    • 1

    当然,同样的操作也可以用zip函数配合列表生成式来完成。

    my_list = [11, 13, 15, 17]
    thy_list = [2, 4, 6, 8, 10]
    [x + y for x, y in zip(my_list, thy_list)]
    
    • 1
    • 2
    • 3

    处理列表中的空值和零值

    假设列表对象对应的变量名为my_list,如果列表中有空值(None)和零值,我们可以用下面的方式去掉空值和零值。

    list(filter(bool, my_list))
    
    • 1

    对应的列表生成式语法如下所示。

    [x for x in my_list if x]
    
    • 1

    从嵌套列表中抽取指定列

    假设my_list是一个如下所示的嵌套列表,该嵌套列表可以用来表示数学上的矩阵,如果要取出矩阵第一列的元素构成一个列表,我们可以这样写。

    my_list = [
        [1, 1, 2, 2],
        [5, 6, 7, 8],
        [3, 3, 4, 4],
    ]
    col1, *_ = zip(*my_list)
    list(col1)
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7

    这里我们会得到一个如下所示的列表,刚好是矩阵的第一列。

    [1, 5, 3]
    
    • 1

    以此类推,如果想取出矩阵第二列的元素构成一个列表,可以用如下所示的方法。

    _, col2, *_ = zip(*my_list)
    list(col2)
    
    • 1
    • 2

    至此,如果要实现矩阵的转置操作,我们也可以按照上面的思路写出下面的代码。

    [list(x) for x in zip(*my_list)]
    
    • 1

    经过上面的操作,我们会得到如下所示的列表。

    [[1, 5, 3], 
     [1, 6, 3], 
     [2, 7, 4], 
     [2, 8, 4]]
    
    • 1
    • 2
    • 3
    • 4

    小结

    不知道上面的内容有没有触及到大家的知识盲区,如果有的话欢迎在评论区留言讨论。

  • 相关阅读:
    网络开发套接字以及UDP、TCP协议
    【Linux】tmux文章索引
    JS图片放大镜功能实现
    产业安全专家谈|金融行业如何践行《反电信网络诈骗法》?
    Disruptor本地线程队列_使用transProcessor处理器和WorkPool两种方式进行消费对比---线程间通信工作笔记005
    【零基础学Python】Day12 Python循环语句
    关于Linux中如何使用 systemd-run创建临时Cgroup来限制ad-hoc的资源消耗
    SVN下载上传文件
    SMK电路板USBType-C插座CSS5324-3M01F CSS5324-0M02F连接器以及过压保护
    Kotlin 变量详解:声明、赋值与最佳实践指南
  • 原文地址:https://blog.csdn.net/No_Name_Cao_Ni_Mei/article/details/134038894