码农知识堂 - 1000bd
  •   Python
  •   PHP
  •   JS/TS
  •   JAVA
  •   C/C++
  •   C#
  •   GO
  •   Kotlin
  •   Swift
  • 分组后取最大值对应记录


    【问题】

    I have an input file,

    1A	Traes_1AS_6052071D9.1	99.01	101	99.0 
    1A	Traes_1DS_6BA87D1DA.1	96.04	101	99.0 
    1A	Traes_1BS_480915AD0.1	94.06	101	99.0 
    1B	Traes_1AS_49D585BA6.2	99.01	101	72.0 
    1B	Traes_1BS_47F027BBE.2	98.02	101	89.0 
    1B	Traes_1DS_3F816B920.1	97.03	101	92.0 
    1C	Traes_1AS_3451447E0.1	99.01	101	97.0
    1C	Traes_1BS_9F243CEA6.2	92.93	99	97.0 
    1C	Traes_1DS_2A6443F45.1	89.90	99	97.0 
    

    I need to

    1.     group and iterate inside each line[0],

    2.     sort line[4] from lowest to highest value and take the highest value

    3.     if they are similar, print the results choosing the one that has highest value in line[2], so that my output file looks like this:

    Required output:

    1A  Traes_1AS_6052071D9.1   99.01   101 99.0    
    1B  Traes_1DS_3F816B920.1   97.03   101 92.0    
    1C  Traes_1AS_3451447E0.1   99.01   101 97.0    
    
    

    This is my try, but it only takes according to the highest line[4]:

    import csv
    from itertools import groupby
    from operator import itemgetter
    with open('my_file','rb') as f1:
    with open('out_file', 'wb') as f2:
        reader = csv.reader(f1, delimiter='\t')
        writer1 = csv.writer(f2, delimiter='\t')
        for group, rows in groupby(reader, itemgetter(0)):
            seen = set()
            rows = sorted(rows, key=lambda r: float(r[4]))
            for row in rows:
                max(rows, key=lambda r: float(r[4]))
                writer1.writerow(row)
    

    别人的回答:

    Just have the key function for max return a tuple of (r[4], r[2])

    Slightly simplified example (without output file)

    with open('data.txt','rb') as f1:
        reader = csv.reader(f1, delimiter='\t')
        for group, rows in groupby(reader, itemgetter(0)):
            best = max(rows, key=lambda r: (float(r[4]), float(r[2])))
            print best
    

    【回答】

    建议用SPL来做,只要一句:

    A
    1=file("e:\\data.txt").import().group(#1).(~.maxp([#5,#3]))

    A1:#1表示第1列,~表示按#1分组后的每组数据,maxp返回字段求最大值对应的记录。

     

  • 相关阅读:
    209.Flink(四):状态,按键分区,算子状态,状态后端。容错机制,检查点,保存点。状态一致性。flink与kafka整合
    艾美捷FcyRl (CD64),FCGR1A,生物活性方案
    Python之OS模块
    哈希表 | 三数之和、四数之和 | 用`双指针法`最合适 | leecode刷题笔记
    后端服务架构的不同与区别
    vs2019快捷键注释不起作用
    国标视频平台EasyGBS调用快照接口,未能正常返回快照图片该如何解决?
    小程序--分包加载
    20.Redis系列之高可用集群模式
    SpringBoot SpringBoot 基础篇 1 快速上手SpringBoot 1.7 入门案例解析【starter】
  • 原文地址:https://blog.csdn.net/raqsoft/article/details/128033288
  • 最新文章
  • 攻防演习之三天拿下官网站群
    数据安全治理学习——前期安全规划和安全管理体系建设
    企业安全 | 企业内一次钓鱼演练准备过程
    内网渗透测试 | Kerberos协议及其部分攻击手法
    0day的产生 | 不懂代码的"代码审计"
    安装scrcpy-client模块av模块异常,环境问题解决方案
    leetcode hot100【LeetCode 279. 完全平方数】java实现
    OpenWrt下安装Mosquitto
    AnatoMask论文汇总
    【AI日记】24.11.01 LangChain、openai api和github copilot
  • 热门文章
  • 十款代码表白小特效 一个比一个浪漫 赶紧收藏起来吧!!!
    奉劝各位学弟学妹们,该打造你的技术影响力了!
    五年了,我在 CSDN 的两个一百万。
    Java俄罗斯方块,老程序员花了一个周末,连接中学年代!
    面试官都震惊,你这网络基础可以啊!
    你真的会用百度吗?我不信 — 那些不为人知的搜索引擎语法
    心情不好的时候,用 Python 画棵樱花树送给自己吧
    通宵一晚做出来的一款类似CS的第一人称射击游戏Demo!原来做游戏也不是很难,连憨憨学妹都学会了!
    13 万字 C 语言从入门到精通保姆级教程2021 年版
    10行代码集2000张美女图,Python爬虫120例,再上征途
Copyright © 2022 侵权请联系2656653265@qq.com    京ICP备2022015340号-1
正则表达式工具 cron表达式工具 密码生成工具

京公网安备 11010502049817号