码农知识堂 - 1000bd
  •   Python
  •   PHP
  •   JS/TS
  •   JAVA
  •   C/C++
  •   C#
  •   GO
  •   Kotlin
  •   Swift
  • 【数据处理】用python将西班牙语的特殊符号替换成相应的英文字符


    目的

    我想将西班牙语中的áéíóúÁÉÍÓÚñÑüÜ替换成相应的英文字母,并把¡¿删除,以便后续其他数据处理操作,所以我写了个小程序替换这些特殊字符。

    思路

    简单粗暴地遍历句子中所有字符,若有上述特殊字符,就替换成相应的字母。

    代码

    注意,要在文件最上方加上# -*- coding: ISO8859-1 -*-,否则会报错,且下一次打开这个文件时特殊符号会乱码。

    # -*- coding: ISO8859-1 -*-
    sentence = "Juchitán de Za¿ragozaá"
    
    # 替换特殊字符
    def replace_char(original_column, pos, point_char):
        replaced_column = original_column[:pos] + point_char + original_column[pos+1:]
        return replaced_column
    
    # 删除特殊字符
    def delete_char(origianal_column, pos):
        deleted_column = origianal_column[:pos] + origianal_column[pos+1:]
        return deleted_column
    
    # 构建西班牙语特殊字符的字典
    special_Spanish_chars_dict = {}
    special_Spanish_chars_list = ['á', 'é', 'í', 'ó', 'ú', 'Á', 'É', 'Í', 'Ó', 'Ú', 'ñ', 'Ñ', '¡', '¿', 'ü', 'Ü']
    English_chars_list = ['a', 'e', 'i', 'o', 'u', 'A', 'E', 'I', 'O', 'U', 'n', 'N', 0, 0, 'u', 'U']
    cnt = 0
    for special_char in special_Spanish_chars_list:
            special_Spanish_chars_dict[special_char] = English_chars_list[cnt]
            cnt += 1
    
    cleaned_sentence = sentence
    sentence_length = len(sentence)
    delete_num = 0
    
    # 遍历句子中的每一个字符
    for j in range(sentence_length):
        try:
            character = sentence[j]
            point_char = special_Spanish_chars_dict[character]
            if point_char != 0:  # replace
                cleaned_sentence = replace_char(cleaned_sentence, j - delete_num, point_char)
            else:  # delete
                cleaned_sentence = delete_char(cleaned_sentence, j - delete_num)
                delete_num += 1
        except:
                continue
    
    print("Original sentence: {}".format(sentence))
    print("Cleaned sentence:  {}".format(cleaned_sentence))
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14
    • 15
    • 16
    • 17
    • 18
    • 19
    • 20
    • 21
    • 22
    • 23
    • 24
    • 25
    • 26
    • 27
    • 28
    • 29
    • 30
    • 31
    • 32
    • 33
    • 34
    • 35
    • 36
    • 37
    • 38
    • 39
    • 40
    • 41

    结果:
    在这里插入图片描述

  • 相关阅读:
    【2023研电赛】华东赛区一等奖:电动叉车永磁同步电机MTPA及弱磁控制研究
    如何管理销售团队?
    某平台简单尝试一次密码逆向
    pulsar简介
    代码随想录第44天 | ● 1143.最长公共子序列 ● 1035.不相交的线 ● 53. 最大子序和 动态规划
    FastBert学习笔记
    深入理解 Python 虚拟机:列表(list)的实现原理及源码剖析
    【精彩回顾】 用sCrypt在Bitcoin上构建智能合约
    【正点原子Linux连载】第二十六章 APP主界面开发项目 摘自【正点原子】I.MX6U嵌入式Qt开发指南V1.0.2
    C嘎嘎~~[类 中篇]
  • 原文地址:https://blog.csdn.net/SSibyl/article/details/126510564
  • 最新文章
  • 攻防演习之三天拿下官网站群
    数据安全治理学习——前期安全规划和安全管理体系建设
    企业安全 | 企业内一次钓鱼演练准备过程
    内网渗透测试 | Kerberos协议及其部分攻击手法
    0day的产生 | 不懂代码的"代码审计"
    安装scrcpy-client模块av模块异常,环境问题解决方案
    leetcode hot100【LeetCode 279. 完全平方数】java实现
    OpenWrt下安装Mosquitto
    AnatoMask论文汇总
    【AI日记】24.11.01 LangChain、openai api和github copilot
  • 热门文章
  • 十款代码表白小特效 一个比一个浪漫 赶紧收藏起来吧!!!
    奉劝各位学弟学妹们,该打造你的技术影响力了!
    五年了,我在 CSDN 的两个一百万。
    Java俄罗斯方块,老程序员花了一个周末,连接中学年代!
    面试官都震惊,你这网络基础可以啊!
    你真的会用百度吗?我不信 — 那些不为人知的搜索引擎语法
    心情不好的时候,用 Python 画棵樱花树送给自己吧
    通宵一晚做出来的一款类似CS的第一人称射击游戏Demo!原来做游戏也不是很难,连憨憨学妹都学会了!
    13 万字 C 语言从入门到精通保姆级教程2021 年版
    10行代码集2000张美女图,Python爬虫120例,再上征途
Copyright © 2022 侵权请联系2656653265@qq.com    京ICP备2022015340号-1
正则表达式工具 cron表达式工具 密码生成工具

京公网安备 11010502049817号