请问,我有一段文字包含拼音和汉字,希望将拼音与汉字分开
数据情况
dé德jiàn建míng名lì⽴xíng形duān端"
希望分解成
import re
regex = re.compile(r'\b[a-z]*[āáǎàōóǒòêēéěèīíǐìūúǔùǖǘǚǜüńňǹɑɡ]+[a-z]*\b')
text = "dé德jiàn建míng名lì⽴xíng形duān端"
import re
pinre = re.compile(r'[a-z]*[āáǎàōóǒòêēéěèīíǐìūúǔùǖǘǚǜüńňǹɑɡ]+[a-z]*')
pinyin = pinre.findall(text)
jfre = re.compile(r'[\u2E80-\u9FFF]')
jf = jfre.findall(text)
import pandas as pd
from pandas import DataFrame
data = {
'pin': pinyin,
'ft': jf,
}
df = DataFrame(data)
df.to_excel('pandas_write_excel.xlsx')