導航:首頁 > 編程語言 > java正則表達式api

java正則表達式api

發布時間:2024-08-18 22:47:30

㈠ 高級java開發中什麼是正則表達式

Java 正則表達式
正則表達式定義了字元串的模式。
正則表達式可以用來搜索、編輯或處理文本。
正則表達式並不僅限於某一種語言,但是在每種語言中有細微的差別。
Java正則表達式和Perl的是最為相似的。
java.util.regex包主要包括以下三個類:
Pattern類:
pattern對象是一個正則表達式的編譯表示。Pattern類沒有公共構造方法。要創建一個Pattern對象,你必須首先調用其公共靜態編譯方法,它返回一個Pattern對象。該方法接受一個正則表達式作為它的第一個參數。
Matcher類:
Matcher對象是對輸入字元串進行解釋和匹配操作的引擎。與Pattern類一樣,Matcher也沒有公共構造方法。你需要調用Pattern對象的matcher方法來獲得一個Matcher對象。
PatternSyntaxException:
PatternSyntaxException是一個非強制異常類,它表示一個正則表達式模式中的語法錯誤。
舉例:

import java.util.regex.Matcher;
import java.util.regex.Pattern;

public class RegexMatches
{
public static void main( String args[] ){

// 按指定模式在字元串查找
String line = "This order was placed for QT3000! OK?";
String pattern = "(.*)(\\d+)(.*)";

// 創建 Pattern 對象
Pattern r = Pattern.compile(pattern);

// 現在創建 matcher 對象
Matcher m = r.matcher(line);
if (m.find( )) {
System.out.println("Found value: " + m.group(0) );
System.out.println("Found value: " + m.group(1) );
System.out.println("Found value: " + m.group(2) );
} else {
System.out.println("NO MATCH");
}
}
}

㈡ java中怎麼替換string中的某個字元

/¥392931String這個對於程序原來說一定是最熟悉不過的,很多時候我們都習慣去使用String的原生方法去完成查找字元串、替換、刪除,而正則表達式由於略顯苦澀的語法常常被人忽略,其實很多時候使用正則表達式可以提高不少性能和節省資源。

一、正則表達式簡述

正則表達式正則表達是Java中比較矛盾的知識點,因為使用起來可以很簡單也可以相當地有難度,但是對於字元串操作來說應用得當則事半功倍,字元串查找,搜索,匹配,替換等等,正則表達式無所不能。而所謂正則表達式本質就是一個字元串(這個字元串按照一定的語法和規范被構造出來作為限定條件),其主要參與者——Pattern和Matcher:Pattern是Java正則表達式API中的主要入口,是程序語言中對這個特殊正則字元串的編譯表示,需要使用正則表達式,第一步都是從構造Pattern 類開始,而Matcher是輸入字元串進行解釋和匹配操作的引擎,通過解釋 Pattern 對 Character sequence 執行匹配操作(即Matcher負責完成字元串的查找、匹配、替換等操作。)

二、正則表達式基本語法

1、預留字元

限定符

說明

. 任意英文字母

反斜杠, 單獨的反斜杠做為轉義字元,與其他特殊字元一起使用。如果想匹配反斜杠本身,需要轉義。兩個反斜杠實際匹配一個反斜杠n字元的8進製表示.n 在0至7之間取值

nn 字元的8進製表示.n 在0至7之間取值

mnn 字元的8進製表示. m 在0至3之間取值, n 在0至7之間取值

xhh 字元的16進製表示.

uhhhh 字元的16進製表示 0xhhhh. 對應unicode 編碼字元

縮進符.

換行符 (unicode: 『u000A』)

回車符 (unicode: 『u000D』)

f 製表符 (unicode: 『u000C』)

a 警報(鈴聲)字元 (unicode: 『u0007′)

e 轉義符 (unicode: 『u001B』)

cx 控制符 x

d 匹配任意數字 [0-9]

D 匹配任意非數字 [^0-9]

s 匹配任意空白符 (空格, 縮進, 換行,回車)

S 匹配任意非空白符

w 匹配任意單詞

W 匹配任意非單詞

2、設置指定限定條件[](即「[]」表示的是中括符里的內容是條件)

限定符

說明

[a-z] 匹配小寫a to z范圍中任一個字元,又如[abc] 匹配 a, 或 b 或 c

[A-Z] 匹配大寫A to Z范圍中任一個字元

[a-zA-Z] 匹配小寫a to z或大寫A to Z范圍中一個字元

[0-9] 匹配小寫0 to 9范圍中一個字元

[0-9a-z] 匹配小寫0 to 9或a to z范圍中一個字元

[0-9[a-z]] 匹配小寫0 to 9或a to z范圍中一個字元(交集)

[^abc] 匹配不是a,b,c 的字元,是否定匹配

[a-zA-Z] 匹配a 到 z ,A到Z 直接的字元,是范圍匹配

[a-d[m-p]] 匹配a到d之間字元或 m到p之間字元,是並集匹配

[a-z&&[def]] 匹配 d, e, 或 f. 是交集匹配 (這里是在范圍 a-z和字元def之間取交集).

[a-z&&[^bc]] 匹配a-z 之間所有字元,排除bc的字元。是減法匹配

[a-z&&[^m-p]] 匹配a-z 之間所有字元,排除m-p之間的字元是減法匹配

3、邊界匹配

邊界符

說明

^ 匹配行首

$ 匹配行尾

 匹配單詞邊界

B 匹配非單詞邊界

A 匹配文本開頭

G 匹配前一匹配項結尾

 輸入的結尾,僅用於最後的結束符(如果有的話)

z 匹配文本結尾

4、邏輯操作符和量詞表示

正則表達式支持少量的邏輯運算(與,或)。與操作是默認的,表達式 cmo,意味著c 與 m與o。
或操作需要顯示指定,用 | 表示。例如表達式 crazy|mo意味著crazy或 mo。

貪婪模式

飢餓模式

獨占模式

說明

X? X?? X?+ 匹配0或1次,即出現X 0或者1次

X* X**? X*+ 匹配0或多次

X+ X+? X++ 匹配1或多次

X{n} X{n}? X{n}+ 匹配n次

X{n,} X{n,}? X{n,}+ 匹配最少n次

X{n, m} X{n, m}? X{n, m}+ 匹配最少n次,最多m次

三、正則表達式的應用

㈢ JAVA正則表達式判斷 只能包含漢字、英文、「_」和數字 ,正則該怎麼寫呢

|

正則表達式:[\u4e00-\u9fa5]*|\w*|\d*|_*

代碼如下:

@Test
public void test1(){
//匹配正則表達式表達式
String str = "[\u4e00-\u9fa5]*|\w*|\d*|_*";
Pattern pattern = Pattern.compile(str);
//要匹配的字版符串
String mStr = "還有多權遠_344fjdk";
System.out.println("測試的字元串:"+mStr);
Matcher m = pattern.matcher(mStr);
//如果匹配到了
if(m.find()){
System.out.println("匹配內容:"+m.group());
}
}

程序運行結果:

(3)java正則表達式api擴展閱讀

匹配包括下劃線的任何單詞字元。類似但不等價於「[A-Za-z0-9_]」,"單詞"字元使用Unicode字元集,中文的為:[\u4e00-\u9fa5],表示英文字母的為w,表示數字的為d,表示_的為_,而*號表示的則是0個或多個,|表示的則是或,所以把每個要匹配的用|拼接可以表示要匹配的正則表達式。

㈣ java正則表達式是什麼

java正則表達式是計算機科學的一個概念。正則表達式使用單個字元串來描述、匹配一系列符合某個句法規則的字元串。

在編寫處理字元串的程序或網頁時,經常會有查找符合某些復雜規則的字元串的需要。正則表達式就是用於描述這些規則的工具。換句話說,正則表達式就是記錄文本規則的代碼。

很可能你使用過Windows/Dos下用於文件查找的通配符(wildcard),也就是*和?。如果你想查找某個目錄下的所有的Word文檔的話,你會搜索*.doc。在這里,*會被解釋成任意的字元串。

和通配符類似,正則表達式也是用來進行文本匹配的工具,只不過比起通配符,它能更精確地描述你的需求——當然,代價就是更復雜——比如你可以編寫一個正則表達式,用來查找所有以0開頭,後面跟著2-3個數字,然後是一個連字型大小「-」,最後是7或8位數字的字元串(像010-12345678或0376-7654321)。

正則表達式的基本操作:

正則表達式定義:符合一定規則的表達式。

作用:用於專門操作字元串。

特點:用於一些特定的符號來表示一些代碼操作。這樣就簡化書寫。所以學習正則表達式,就是在學習一些特殊符號的使用。

好處:可以簡化對字元串的復雜操作。

弊端:符號定義越多,正則越長,閱讀性越差。

㈤ java中檢查姓名的正則表達式

以襪畢下是一個Java中用於檢查姓名的正則表達式,它能夠匹配2到8個漢字或者2到16個英文字母。

code
String regex = "^([\\u4E00-\\u9FA5]{2,8}|[a-zA-Z]{2,16})$";
具體解釋如下:

^ 表示匹配字告和芹符串的開頭
() 表示一個捕獲組,其中包含了兩個子模式
[\u4E00-\u9FA5] 表示一個漢字字元,范圍為Unicode編碼的中文范圍
{2,8} 表示該字元可以出現2到8次
| 表棚派示邏輯或,表示兩個子模式中的任意一個都可以匹配成功
[a-zA-Z] 表示一個英文字母,不區分大小寫
{2,16} 表示該字元可以出現2到16次
$ 表示匹配字元串的結尾
因此,上面的正則表達式可以匹配長度為2到8個漢字或長度為2到16個英文字母的字元串,可以用於檢查姓名是否符合要求。

㈥ java求一個簡單的正則表達式:以@開頭,中間可以是任意字元除了『\』,重復1到20遍,以空格或者@結束

//已修改!
//匹配@xxx,長度為1-20。

import java.util.ArrayList;
import java.util.List;
import java.util.regex.Matcher;
import java.util.regex.Pattern;

public class MatcherDemo {

private static String regex = "@[^\\\\@ ]{1,20}";
private static Pattern pattern = Pattern.compile(regex);

public static void main(String[] args) throws Exception {
printNames(matcherNames("@aaaaa@cccccc"));;
printNames(matcherNames("@bbbb @dddddd"));
}

private static String[] matcherNames(String input) {
List<String> list = new ArrayList();
Matcher matcher = pattern.matcher(input);
while (matcher.find()) {
list.add(matcher.group());
}
return list.toArray(new String[0]);
}

private static void printNames(String[] names) {
System.out.printf("共匹配到%s個用戶:\n", names.length);
for (int i = 0; i < names.length; i++) {
System.out.printf("用戶%s是:%s\n", i + 1, names[i]);
}
}
}

閱讀全文

與java正則表達式api相關的資料

熱點內容
u盤內存還占著文件沒有了 瀏覽:551
python123在線編程手機怎麼用 瀏覽:511
保存配置文件的方法有哪些 瀏覽:827
php實時定位代碼 瀏覽:204
辦身份證需要攜帶哪些文件 瀏覽:249
品勝標准數據線多少A 瀏覽:689
生成手機版pdf文件 瀏覽:447
軟體是所有程序 瀏覽:183
飛貓網盤下載工具 瀏覽:749
鄭州長得聯利蘋果 瀏覽:643
esxi虛擬機版本 瀏覽:82
微信電腦版文件怎麼弄出來的 瀏覽:891
js日歷插件視頻 瀏覽:493
win10creators易升 瀏覽:324
淘寶橫向分類導航代碼 瀏覽:1
如何看自己視頻後台數據 瀏覽:65
ppt配色工具 瀏覽:883
微信pro病毒 瀏覽:16
如何查看網站結構層數 瀏覽:335
文件上傳時查找不到桌面圖片 瀏覽:686

友情鏈接