国产av日韩一区二区三区精品,成人性爱视频在线观看,国产,欧美,日韩,一区,www.成色av久久成人,2222eeee成人天堂

正規(guī)表示式 - 請(qǐng)問用 Python 如何匹配漢語拼音?
ringa_lee
ringa_lee 2017-05-27 17:39:30
0
3
1994

例如用正規(guī)表示式配對(duì)出 shá 這個(gè)拼音。
ps:之前說的可能不明確,我用了「 例如」 兩字哈,就是待處理文本裡有拼音,但是不知道具體拼音是什麼,需要找出這些拼音,待處理文本會(huì)有中文、拼音、符號(hào)(,。:之類的),所以請(qǐng)不要回答諸如re.search(u'shá',text) 要正則哈,不是簡(jiǎn)單固定的字串。 。 。

ringa_lee
ringa_lee

ringa_lee

全部回覆(3)
巴扎黑
import re
regex = re.compile(r'\b[a-z]*[āáǎàōóǒòêēéěèīíǐìūúǔùǖǘǚǜüńň?ɑɡ]+[a-z]*\b')
text = "Thǐs ís à pìnyin abóut shá"
m = regex.findall(text)
print(m)

配對(duì)結(jié)果:
['ís', 'à', 'pìnyin', 'abóut', 'shá']
沒有符合第一個(gè)Thǐs,因?yàn)轭A(yù)設(shè)拼音都是小寫,排除了大寫。

PHPzhong

你是要搭配所有合法的拼音嗎?

如果是,你去找字典的拼音索引,把裡邊的所有拼音全部 | 到一起就可以了。也只能這樣,因?yàn)槠匆舨皇歉鶕?jù)正則,或者其它某種機(jī)械的規(guī)則定義出來的。你想不漏又不多就只能這樣了,反正也沒多少個(gè)。

伊謝爾倫

雷雷

最新下載
更多>
網(wǎng)站特效
網(wǎng)站源碼
網(wǎng)站素材
前端模板