码农知识堂 - 1000bd
  •   Python
  •   PHP
  •   JS/TS
  •   JAVA
  •   C/C++
  •   C#
  •   GO
  •   Kotlin
  •   Swift
  • 提取字符串单引号内的字符——Python for循环代码“异想天开”


    字符串处理,不用re模块,直接用for“手撕”字符串,提取单引号内字符串。


    (本文获得CSDN质量评分【89】)

    【学习的细节是欢悦的历程】

    • Python 官网:https://www.python.org/

    • Free:大咖免费“圣经”教程《 python 完全自学教程》,不仅仅是基础那么简单……


      自学并不是什么神秘的东西,一个人一辈子自学的时间总是比在学校学习的时间长,没有老师的时候总是比有老师的时候多。
                —— 华罗庚


    • My CSDN主页、My HOT博、My Python 学习个人备忘录
    • 好文力荐、 老齐教室
    等风来,不如追风去……


    Python for循环
    提取字符串单引号内字符
    (让代码“异想天开”)


    本文质量分:

    【 89 】
    本文地址: https://blog.csdn.net/m0_57158496/article/details/127989232

    CSDN质量分查询入口:http://www.csdn.net/qc


    目 录

      • 1、字符串
      • 2、 轮询字符串
      • 3、 算法优化
        • 3.1 果断写下“起跳”开关
        • 3.2 优化后代码
      • 4、完整源码


    1、字符串

    [array([‘暨大!!!!!!’],dtype=object),array([‘我觉得小姐姐人很好哎’],dtype=object), array([‘工科走了’], dtype=object),array([‘点错了’],dtype=object),array([‘机械计制造及其自动化’], dtype=object), array([‘你已经很棒了呀’], dtype=object),array([‘二本想考研985的瑟瑟发抖’], dtype=object), array([‘我导师就这样,我都气死了’], dtype=object), array([‘在读大三的一名博士研究生 关系复杂’], dtype=object), array([‘音乐生在这!’], dtype=object), array([‘哈哈哈’], dtype=object), array([‘广美硕士路过’],dtype=object),array([‘内心热爱,就坚持。不热爱,完全没必要。’],dtype=object),array([’【过期的麦片】’],dtype=object), array([‘一猜就是,哈哈哈’],dtype=object),array([‘好的,医学生现在退出直播间’], dtype=object),array([‘重新定义《普通》’], dtype=object),array([‘感觉up主不太会问问题’],dtype=object), array(['顶部红字你有意思吗? '], dtype=object), array([‘重点是能毕业’],dtype=object),array([‘如果这样的话那我真心建议你退学’], dtype=object), array([‘社会是很险恶的’],dtype=object),array([‘期待第二期!’], dtype=object), array([‘加油,曾经都努力了为什么要放弃呢’],dtype=object),array([‘摆就完了’], dtype=object), array([‘哈哈哈哈’], dtype=object),array([‘说的就是我’], dtype=object), array

      用re.findall方法一条语句搞定的事儿,

    print('\n'.join(re.findall(r"'(.+?)'",example))) 
    
    • 1

    今天突发奇想,“非”要用循环轮询来实现。
      轮询字符串,第一次见到单引号,设置记录开关flag为True,收集字符串开关k为1;再次遇到单引号,flag = False,k=0,拼接记录的字符,追加到收集列表。我收集到的字符包含了先见到的单引号,收集时用了切片[1:]舍去首字符,实现了re.findall一样的效果。


    回页目录

    2、 轮询字符串

    # 不用re
    out, k = [], ''
    
    tem, flag = [], False
    n = 0
    
    for i in example:
    
        if i == "\'" and flag is False:
            flag, k = True, 1 
        elif i == "\'" and flag is True:
            flag, k = False, 0
    
        if flag is True and k:
            tem.append(i)
        elif k == 0:
            out.append(''.join(tem[1:]))
            tem, k = [], 1
    
        n += 1
    
    out = '\n'.join(out)
    print(f"\n\nfor循环提取单引号内字符:\n\n{out}\n")
    
    print('循环执行', n, '次。')
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14
    • 15
    • 16
    • 17
    • 18
    • 19
    • 20
    • 21
    • 22
    • 23
    • 24
    • 25

    代码运行效果截屏图片
    在这里插入图片描述


    回页目录

    3、 算法优化

      经过思考,感觉我的代码“算法”还可优化。在记录收集开关状态变化后,可以用continue关键字进入下一次轮询,豆不会收集先见到的单引号,拼接收集字符串时豆不用切片了。跳过了几十次轮询。

      感觉还可以跳过没有开始收集字符(第二次遇到成对单引号前的轮询)前,可以不执行收集字符代码。但我怎么设置“开关”组合,都达不成“效果”。无法可想,用print()、input()在准备“跳过”优化的代码块前后打印我的“开关”,让她们的状态呈现出来。

    在这里插入图片描述
    在这里插入图片描述

    3.1 果断写下“起跳”开关

      从“开关”状态轻易发现,当字符收录开关flag关闭&字符串收集开关k打开时,是可以不用执行“收录收集”代码块的。

        if k == 1 and flag == False:
            continue # 当不用收录字符时,不执行收录收集代码块。
    
    • 1
    • 2

    优化代码运行效果截图
    在这里插入图片描述
      从950次全程循环,降到了274次!优化效果还是比较明显的。🤗不用后半段代码的时候,直接用continue“跳过”。

    3.2 优化后代码

    # 不用re
    out, k = [], ''
    
    tem, flag = [], False
    n = 0
    
    for i in example:
    
        if i == "\'" and flag is False:
            flag, k = True, 1
            continue 
        elif i == "\'" and flag is True:
            flag, k = False, 0
            continue
    
        if k == 1 and flag == False:
            continue # 当不用收录字符时,不执行收录收集代码块。
    
        #print(flag, k) # 断点开关显形语句。
    
        if flag is True and k:
            tem.append(i)
        elif k == 0:
            out.append(''.join(tem))
            tem, k = [], 1
    
        #input(f"flag = {flag},k = {k}") # 断点开关显形语句。
    
        n += 1
    
    out = '\n'.join(out)
    print(f"\n\nfor循环提取单引号内字符:\n\n{out}\n")
    
    print('循环执行', n, '次。')
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14
    • 15
    • 16
    • 17
    • 18
    • 19
    • 20
    • 21
    • 22
    • 23
    • 24
    • 25
    • 26
    • 27
    • 28
    • 29
    • 30
    • 31
    • 32
    • 33
    • 34

    回页目录

    4、完整源码

    (源码较长,点此跳过源码)

    #!/usr/bin/nve python
    # coding: utf-8
    import re
    
    
    example = "[array(['暨大!!!!!!'],dtype=object),array(['我觉得小姐姐人很好哎'],dtype=object), array(['工科走了'], dtype=object),array(['点错了'],dtype=object),array(['机械计制造及其自动化'], dtype=object), array(['你已经很棒了呀'], dtype=object),array(['二本想考研985的瑟瑟发抖'], dtype=object), array(['我导师就这样,我都气死了'], dtype=object), array(['在读大三的一名博士研究生 关系复杂'], dtype=object), array(['音乐生在这!'], dtype=object), array(['哈哈哈'], dtype=object), array(['广美硕士路过'],dtype=object),array(['内心热爱,就坚持。不热爱,完全没必要。'],dtype=object),array(['【过期的麦片】'],dtype=object), array(['一猜就是,哈哈哈'],dtype=object),array(['好的,医学生现在退出直播间'], dtype=object),array(['重新定义《普通》'], dtype=object),array(['感觉up主不太会问问题'],dtype=object), array(['顶部红字你有意思吗? '], dtype=object), array(['重点是能毕业'],dtype=object),array(['如果这样的话那我真心建议你退学'], dtype=object), array(['社会是很险恶的'],dtype=object),array(['期待第二期!'], dtype=object), array(['加油,曾经都努力了为什么要放弃呢'],dtype=object),array(['摆就完了'], dtype=object), array(['哈哈哈哈'], dtype=object),array(['说的就是我'], dtype=object), array"
    
    # re.findall
    print('\n'.join(re.findall(r"'(.+?)'",example))) 
    
    
    # 不用re
    out, k = [], ''
    
    tem, flag = [], False
    n = 0
    
    for i in example:
    
        if i == "\'" and flag is False:
            flag, k = True, 1
            continue 
        elif i == "\'" and flag is True:
            flag, k = False, 0
            continue
    
        if k == 1 and flag == False:
            continue # 当不用收录字符时,不执行收录收集代码块。
    
        #print(flag, k) # 断点开关显形语句。
    
        if flag is True and k:
            tem.append(i)
        elif k == 0:
            out.append(''.join(tem))
            tem, k = [], 1
    
        #input(f"flag = {flag},k = {k}") # 断点开关显形语句。
    
        n += 1
    
    out = '\n'.join(out)
    print(f"\n\nfor循环提取单引号内字符:\n\n{out}\n")
    
    print('循环执行', n, '次。')
    
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14
    • 15
    • 16
    • 17
    • 18
    • 19
    • 20
    • 21
    • 22
    • 23
    • 24
    • 25
    • 26
    • 27
    • 28
    • 29
    • 30
    • 31
    • 32
    • 33
    • 34
    • 35
    • 36
    • 37
    • 38
    • 39
    • 40
    • 41
    • 42
    • 43
    • 44
    • 45
    • 46

    回页首

    __上一篇:__ Python字典制作“密码本”,试炼加、解密文本

    __下一篇:__ 

    我的HOT博:

      • Hot:个人信息提取(1402阅读)
      • Hot:生成100个随机正整数(1453阅读)
      • 给定字符串提取姓名(字符串、list、re“零宽断言”)(1051阅读)
      • 我的 Python.color() (Python 色彩打印控制)(1463阅读)
      • python清屏(2206阅读)
      • 回车符、换行符和回车换行符(2165阅读)
      • Linux 脚本文件第一行的特殊注释符(井号和感叹号组合)的含义(1379阅读)
      • pandas 数据类型之 Series(1403阅读)
      • 聊天消息敏感词屏蔽系统(字符串替换 str.replace(str1, *) )(1500阅读)
      • 练习:银行复利计算(用 for 循环解一道初中小题)(1408阅读)
      • pandas 数据类型之 DataFrame(3007阅读)
      • :班里有人和我同生日难吗?(蒙特卡洛随机模拟法)(2254阅读)
      • Python字符串居中显示(3407阅读)
      • 练习:求偶数和、阈值分割和求差( list 对象的两个基础小题)(1701阅读)
      • 用 pandas 解一道小题(2056阅读)
      • 可迭代对象和四个函数(1083阅读)
      • “快乐数”判断(1286阅读)
      • 罗马数字转换器(构造元素取模)(2324阅读)
      • Hot:罗马数字(转换器|罗生成器)(5140阅读)
      • Hot:让QQ群昵称色变的代码(42882阅读)
      • Hot:斐波那契数列(递归| for )(4100阅读)
      • 柱状图中最大矩形(1688阅读)
      • 排序数组元素的重复起止(1286阅读)
      • 电话拨号键盘字母组合(1460阅读)
      • 密码强度检测器(2175阅读)
      • 求列表平衡点(1875阅读)
      • Hot: 字符串统计(4347阅读)
      • Hot:尼姆游戏(聪明版首发)(3532阅读)尼姆游戏(优化版)(1242阅读)

      • 推荐条件 点阅破千


        回页首


        老齐漫画头像

        精品文章:

        • 好文力荐:齐伟书稿 《python 完全自学教程》 Free连载(已完稿并集结成书,还有PDF版本百度网盘永久分享,点击跳转免费🆓下载。)
        • OPP三大特性:封装中的property
        • 通过内置对象理解python'
        • 正则表达式
        • python中“*”的作用
        • Python 完全自学手册
        • 海象运算符
        • Python中的 `!=`与`is not`不同
        • 学习编程的正确方法

        来源:老齐教室


        回页首

        ◆ Python 入门指南【Python 3.6.3】


        好文力荐:

        • 全栈领域优质创作者——寒佬(还是国内某高校学生)博文“非技术文—关于英语和如何正确的提问”,“英语”和“会提问”是学习的两大利器。

        • 【8大编程语言的适用领域】先别着急选语言学编程,先看它们能干嘛

        • 靠谱程序员的好习惯


        CSDN实用技巧博文:

        • 8个好用到爆的Python实用技巧
        • python忽略警告
        • Python代码编写规范
        • Python的docstring规范(说明文档的规范写法)

    • 相关阅读:
      有关HashMap的介绍
      Shaderlab的组成部分SubShader
      shell脚本将执行结果重定向到指定路径指定文件对应的变量
      JUC中的AQS底层详细超详解
      VMware Workstation Player虚拟机Ubuntu启用Windows共享目录
      如何选择适合广西地区气候条件的建筑模板?
      【Qt】Qt获取标准系统路径
      替代try catch处理异常的优雅方式
      在浏览器地址栏键入URL按下回车之后会经历什么?
      长文 or 短文?
    • 原文地址:https://blog.csdn.net/m0_57158496/article/details/127989232
    • 最新文章
    • 攻防演习之三天拿下官网站群
      数据安全治理学习——前期安全规划和安全管理体系建设
      企业安全 | 企业内一次钓鱼演练准备过程
      内网渗透测试 | Kerberos协议及其部分攻击手法
      0day的产生 | 不懂代码的"代码审计"
      安装scrcpy-client模块av模块异常,环境问题解决方案
      leetcode hot100【LeetCode 279. 完全平方数】java实现
      OpenWrt下安装Mosquitto
      AnatoMask论文汇总
      【AI日记】24.11.01 LangChain、openai api和github copilot
    • 热门文章
    • 十款代码表白小特效 一个比一个浪漫 赶紧收藏起来吧!!!
      奉劝各位学弟学妹们,该打造你的技术影响力了!
      五年了,我在 CSDN 的两个一百万。
      Java俄罗斯方块,老程序员花了一个周末,连接中学年代!
      面试官都震惊,你这网络基础可以啊!
      你真的会用百度吗?我不信 — 那些不为人知的搜索引擎语法
      心情不好的时候,用 Python 画棵樱花树送给自己吧
      通宵一晚做出来的一款类似CS的第一人称射击游戏Demo!原来做游戏也不是很难,连憨憨学妹都学会了!
      13 万字 C 语言从入门到精通保姆级教程2021 年版
      10行代码集2000张美女图,Python爬虫120例,再上征途
    Copyright © 2022 侵权请联系2656653265@qq.com    京ICP备2022015340号-1
    正则表达式工具 cron表达式工具 密码生成工具

    京公网安备 11010502049817号