高分回報請問正規表示式如何匹配包含任意的字元漢字標點符號組合的一段文字

時間 2021-08-30 09:32:05

1樓:匿名使用者

都任意字元了那還匹配什麼啊,沒有匹配的依據了麼。要就是 .* ,所有字元均匹配,不如直接引用原字串。

或者是以換行為依據?那隻要順序讀每個字元看看是不是\r或\n的回車換行符就可以了。

2樓:

你的意思應該是提取 每樓帖子的內容吧。

下面的正則你試下

.*.*

我測試是可以提取出來的

oracle正規表示式如何查詢一個字串裡面包含了任意標點符號的所有記錄。

3樓:匿名使用者

用 regexp_like這個函式來解決,正規表示式為:[[:punct:]]+這個正則可以找出任何標點符號。

查詢value中包含任何標點符號的記錄如下:

select * from *** where regexp_like(value,'[[:punct:]]+');

posix 正規表示式由標準的元字元(metacharacters)所構成: '$' 匹配輸入字串的結尾位置。如果設定了 regexp 物件的 multiline 屬性,則 $ 也匹配 '\n' 或 '\r'。

'?' 匹配前面的子表示式零次或一次。 '*' 匹配前面的子表示式零次或多次。

'|' 指明兩項之間的一個選擇。例子'^([a-z]+|[0-9]+)$'表示所有小寫字母或數字組合成的 '( )' 標記一個子表示式的開始和結束位置。 '' 一個精確地出現次數範圍,m=《出現次數<=n,''表示出現m次,''表示至少出現m次。

\num 匹配 num,其中 num 是一個正整數。對所獲取的匹配的引用。 [[:alpha:]] 任何字母。

[[:digit:]] 任何數字。

[[:alnum:]] 任何字母和數字。

[[:space:]] 任何白字元。

[[:upper:]] 任何大寫字母。

[[:lower:]] 任何小寫字母。

[[:punct:]] 任何標點符號。

[[:xdigit:]] 任何16進位制的數字,相當於[0-9a-fa-f]。

\轉義符 *, +, ?, , , 限定符^, $, anymetacharacter 位置和順序。

4樓:匿名使用者

[[:punct:]]

匹配標點

再全表minus一次regexp_like出來的結果

5樓:匿名使用者

select * from recommendation where regexp_like(recocontent, '/\w[a-za-z0-9]*/');

求一個正規表示式6-16位字元(英文/數字/符號)至少兩種組合的正規表示式啊高分回報!

正規表示式如何匹配漢字?

6樓:匿名使用者

去掉 ^ 和 $ 試試 [\u4e00-\u9fa5]

\u數字,在perl、pcre中要改為:

[\x-\x]

7樓:匿名使用者

按.net的標準,\w本來就是可以匹配:漢字,字母,數字,下劃線。的所以一般\w可以滿足需求了。

如果需要排除字母數字的話,可以這樣:

(?![a-za-z0-9_])\w

>_>這樣寫估計效率不高

所以一般來說還是直接匹配指定的unicode碼\unnnn unicode**中十六進位制**為nnnn的字元漢字(字元) [\u4e00-\u9fa5]中文及全形標點符號(字元) [\u3000-\u301e\ufe10-\ufe19\ufe30-\ufe44\ufe50-\ufe6b\uff01-\uffee]

怎樣獲取正規表示式匹配字串的一部分

8樓:匿名使用者

使用正規表示式獲取匹配字串時

pattern mpattern = pattern.compile("(.*?)");

matcher mmatcher = mpattern.matcher(xml);

arraylistarraylist_title = new arraylist();

while(mmatcher.find())

arraylist_title.add(mmatcher.group());

2.1 元字元

在正規表示式中,元字元(metacharacter)是一類非常特殊的字元,它能夠匹配一個位置或字符集合中的一個字元,如:、 \w等。根據功能,元字元可以分為兩種型別:

匹配位置的元字元和匹配字元的元字元。

2.1.1 匹配位置的元字元

包括:^、$、和\b。其中^(脫字元號)和$(美元符號)都匹配一個位置,分別匹配行的開始和結尾。

比如,^string匹配以string開頭的行,string$匹配以string結尾的行。^string$匹配以string開始和結尾的行。單個$匹配一個空行。

單個^匹配任意行。\b匹配單詞的開始和結尾,如:\bstr匹配以str開始的單詞,但\b不匹配空格、標點符號或換行符號,所以,\bstr可以匹配string、string fomat等單詞。

\bstr正規表示式匹配的字串必須以str開頭,並且str以前是單詞的分界處,但此正規表示式不能限定str之後的字串形式。以下正規表示式匹配以ing結尾的字串,如string、this is a string等

ing\b

正規表示式ing\b匹配的字串必須以ing結尾,並且ing後是分界符,以下正規表示式匹配一個完整的單詞:\bstring\b。

2.1.2 匹配字元的元字元

匹配字元的元字元有7個:.(點號)、\w、\w、、s\、\s、\d和\d。其中點號匹配除換行之外的任意字元;\w匹配單詞字元(包括字母、漢字、下劃線和數字);\w匹配任意非單詞字元、\s匹配任意的空白字元,如空格、製表符、換行等;\s匹配任意的非空白字元;\d匹配任意數字字元;\d匹配任意的非數字字元。

如:^.$匹配一個非空行,在該行中可以包含除了換行符以外的任意字元。

^\w$匹配一個非空行,並且該行中只能包含字母、數字、下劃線和漢字中的任意字元。

\ba\w\w\w\w\w\w\\b匹配以字母a開頭長度等於7的任意單詞

2.2 字元類

字元類是一個字符集合,如果該字符集合中的任何一個字元被匹配,則它會找到該匹配項。字元類可以在(方括號)中定義。如:

[012345]可以匹配數字0到5中的任意一個。

可以匹配html標籤中的h1到h6。

[jj]ack可以匹配字串jack或jack。

求一個正規表示式可以匹配:中文字元,中文標點符號,英文,數字,下劃線。但不能輸入@、# 等特殊字元.

9樓:

\w+|[,。《》()、—]+

\w匹配:中文字元,英文,數字,下劃線

至於中文標點符號,看你需要了,如果有另外的就新增在中括號裡面。

10樓:匿名使用者

\w不匹配中文字元的

11樓:

[^%&',;=?$\x22]+

12樓:匿名使用者

/^(?: [^[:punct:]] | \_ )+$/x

13樓:匿名使用者

^[^!@#$%^&*()-=+]+$

正規表示式如何匹配除某些字串以外的所有字元

14樓:

你對正規表示式的理解可能存在誤區,用[ ]括起來的是匹配任意字元,根據你的要求,應該是想要匹配所有以abc開始,以.zip結束的字元,寫法應該是這樣(abc).+(\.

zip)。

在方括號[ ]中,除了^,-,一切特殊符號全部失效,你的[^abc.*?.zip]這個正規表示式,實際意思是,匹配除了a,b,c,.,*,?,z,i,p之外的一切字元

c++正規表示式如何匹配漢字

15樓:緋彈亞絲娜

按.net的標準,\w本來就是可以匹配:漢字,字母,數字,下劃線。的所以一般\w可以滿足需求了。

如果需要排除字母數字的話,可以這樣:

(?![a-za-z0-9_])\w

>_>這樣寫估計效率不高

所以一般來說還是直接匹配指定的unicode碼\unnnn unicode**中十六進位制**為nnnn的字元漢字(字元) [\u4e00-\u9fa5]中文及全形標點符號(字元) [\u3000-\u301e\ufe10-\ufe19\ufe30-\ufe44\ufe50-\ufe6b\uff01-\uffee]

正規表示式如何匹配出最短字串,正規表示式如何匹配除某些字串以外的所有字元

當正規表示式中包含能接受重複的限定符時,通常的行為是 在使整個表示式能得到匹配的前提下 匹配儘可能多的字元。考慮這個表示式 a.b,它將會匹配最長的以a開始,以b結束的字串。如果用它來搜尋aabab的話,它會匹配整個字串aabab。這被稱為貪婪匹配。有時,我們更需要懶惰匹配,也就是匹配儘可能少的字元...

正規表示式中如何替換自身,正規表示式如何替換並修改自身的部分內容?

正則式 d 加圓括號表示分組並作為 反向索引 d表示一位數字 替換為 1a 1表示引用第1個組,對每個數字,替換為它本身跟上字母a 我用的emeditor,不同環境正則式語法也有差別。d可用 0 9 替代 1在有些環境中是 1 計名 其實,1 和 2 之間有 b 2 和 3 之間 b 123 s b...

正規表示式中,點號(英文句號)如何匹配

你直接用 即可。比如 string s 192.167.8.6 string ss s.split for string x ss 你應該知道會列印出什麼。 無情的香菜 號轉義 正規表示式如何匹配中文的 點號 葉吻邢萸 你好 bs4的語法你應該知道吧 python正規表示式 總結 匹配字串的開始。匹...