国产av日韩一区二区三区精品,成人性爱视频在线观看,国产,欧美,日韩,一区,www.成色av久久成人,2222eeee成人天堂

python中涉及AND的正規(guī)表示式
P粉988025835
P粉988025835 2023-09-14 16:30:41
0
1
794

我已經(jīng)努力了一段時(shí)間,試圖為以下任務(wù)取得正確的正規(guī)表示式:

我想使用 python 從 html 檔案中的表格標(biāo)籤中刪除資料。為此,我的方法是遞歸執(zhí)行以下操作(將標(biāo)籤之間的 HTML 行儲(chǔ)存為字串):

s = "所需內(nèi)容"

  1. 將字串 s 重新指派給刪除「<...>」之間所有內(nèi)容的字串。

s = re.sub('<{1}(不是 '<' 也不是 '>').*>{1}', '', s)

  1. 重複此動(dòng)作,直到留下 s =「所需內(nèi)容」。

我的問(wèn)題是如何實(shí)現(xiàn)括號(hào)中粗體部分。謝謝。 您的文字

我試過(guò)了

import re

test_str = '<td style="color:blue">Hello</td>'
test_str = re.sub('<{1}^[<>].*>{1}','',test_str)
print(test_str)

你可以看到我的測(cè)試字串保持不變。我做錯(cuò)了什麼?

上面的程式碼我期望給我 test_str =“Hello”,我會(huì)將其回饋給此方法,然後提取“”,給我“Hello”。

P粉988025835
P粉988025835

全部回覆(1)
P粉348088995

要否定字元類,應(yīng)將 ^ 放在 [ 之後。此外,您不需要為出現(xiàn)一次的字元指定 {1}。

test_str = re.sub('<[^<>]*>', '', test_str)

但是,請(qǐng)注意,使用像 BeautifulSoup 這樣的專用 HTML 解析器而不是正規(guī)表示式來(lái)從 HTML 取得資料更為合適。

最新下載
更多>
網(wǎng)站特效
網(wǎng)站源碼
網(wǎng)站素材
前端模板