㈠ 高級java開發中什麼是正則表達式
Java 正則表達式
正則表達式定義了字元串的模式。
正則表達式可以用來搜索、編輯或處理文本。
正則表達式並不僅限於某一種語言,但是在每種語言中有細微的差別。
Java正則表達式和Perl的是最為相似的。
java.util.regex包主要包括以下三個類:
Pattern類:
pattern對象是一個正則表達式的編譯表示。Pattern類沒有公共構造方法。要創建一個Pattern對象,你必須首先調用其公共靜態編譯方法,它返回一個Pattern對象。該方法接受一個正則表達式作為它的第一個參數。
Matcher類:
Matcher對象是對輸入字元串進行解釋和匹配操作的引擎。與Pattern類一樣,Matcher也沒有公共構造方法。你需要調用Pattern對象的matcher方法來獲得一個Matcher對象。
PatternSyntaxException:
PatternSyntaxException是一個非強制異常類,它表示一個正則表達式模式中的語法錯誤。
舉例:
import java.util.regex.Matcher;
import java.util.regex.Pattern;
public class RegexMatches
{
public static void main( String args[] ){
// 按指定模式在字元串查找
String line = "This order was placed for QT3000! OK?";
String pattern = "(.*)(\\d+)(.*)";
// 創建 Pattern 對象
Pattern r = Pattern.compile(pattern);
// 現在創建 matcher 對象
Matcher m = r.matcher(line);
if (m.find( )) {
System.out.println("Found value: " + m.group(0) );
System.out.println("Found value: " + m.group(1) );
System.out.println("Found value: " + m.group(2) );
} else {
System.out.println("NO MATCH");
}
}
}
㈡ java中怎麼替換string中的某個字元
/¥392931String這個對於程序原來說一定是最熟悉不過的,很多時候我們都習慣去使用String的原生方法去完成查找字元串、替換、刪除,而正則表達式由於略顯苦澀的語法常常被人忽略,其實很多時候使用正則表達式可以提高不少性能和節省資源。
一、正則表達式簡述
正則表達式正則表達是Java中比較矛盾的知識點,因為使用起來可以很簡單也可以相當地有難度,但是對於字元串操作來說應用得當則事半功倍,字元串查找,搜索,匹配,替換等等,正則表達式無所不能。而所謂正則表達式本質就是一個字元串(這個字元串按照一定的語法和規范被構造出來作為限定條件),其主要參與者——Pattern和Matcher:Pattern是Java正則表達式API中的主要入口,是程序語言中對這個特殊正則字元串的編譯表示,需要使用正則表達式,第一步都是從構造Pattern 類開始,而Matcher是輸入字元串進行解釋和匹配操作的引擎,通過解釋 Pattern 對 Character sequence 執行匹配操作(即Matcher負責完成字元串的查找、匹配、替換等操作。)
二、正則表達式基本語法
1、預留字元
限定符
說明
. 任意英文字母
反斜杠, 單獨的反斜杠做為轉義字元,與其他特殊字元一起使用。如果想匹配反斜杠本身,需要轉義。兩個反斜杠實際匹配一個反斜杠n字元的8進製表示.n 在0至7之間取值
nn 字元的8進製表示.n 在0至7之間取值
mnn 字元的8進製表示. m 在0至3之間取值, n 在0至7之間取值
xhh 字元的16進製表示.
uhhhh 字元的16進製表示 0xhhhh. 對應unicode 編碼字元
縮進符.
換行符 (unicode: 『u000A』)
回車符 (unicode: 『u000D』)
f 製表符 (unicode: 『u000C』)
a 警報(鈴聲)字元 (unicode: 『u0007′)
e 轉義符 (unicode: 『u001B』)
cx 控制符 x
d 匹配任意數字 [0-9]
D 匹配任意非數字 [^0-9]
s 匹配任意空白符 (空格, 縮進, 換行,回車)
S 匹配任意非空白符
w 匹配任意單詞
W 匹配任意非單詞
2、設置指定限定條件[](即「[]」表示的是中括符里的內容是條件)
限定符
說明
[a-z] 匹配小寫a to z范圍中任一個字元,又如[abc] 匹配 a, 或 b 或 c
[A-Z] 匹配大寫A to Z范圍中任一個字元
[a-zA-Z] 匹配小寫a to z或大寫A to Z范圍中一個字元
[0-9] 匹配小寫0 to 9范圍中一個字元
[0-9a-z] 匹配小寫0 to 9或a to z范圍中一個字元
[0-9[a-z]] 匹配小寫0 to 9或a to z范圍中一個字元(交集)
[^abc] 匹配不是a,b,c 的字元,是否定匹配
[a-zA-Z] 匹配a 到 z ,A到Z 直接的字元,是范圍匹配
[a-d[m-p]] 匹配a到d之間字元或 m到p之間字元,是並集匹配
[a-z&&[def]] 匹配 d, e, 或 f. 是交集匹配 (這里是在范圍 a-z和字元def之間取交集).
[a-z&&[^bc]] 匹配a-z 之間所有字元,排除bc的字元。是減法匹配
[a-z&&[^m-p]] 匹配a-z 之間所有字元,排除m-p之間的字元是減法匹配
3、邊界匹配
邊界符
說明
^ 匹配行首
$ 匹配行尾
匹配單詞邊界
B 匹配非單詞邊界
A 匹配文本開頭
G 匹配前一匹配項結尾
輸入的結尾,僅用於最後的結束符(如果有的話)
z 匹配文本結尾
4、邏輯操作符和量詞表示
正則表達式支持少量的邏輯運算(與,或)。與操作是默認的,表達式 cmo,意味著c 與 m與o。
或操作需要顯示指定,用 | 表示。例如表達式 crazy|mo意味著crazy或 mo。
貪婪模式
飢餓模式
獨占模式
說明
X? X?? X?+ 匹配0或1次,即出現X 0或者1次
X* X**? X*+ 匹配0或多次
X+ X+? X++ 匹配1或多次
X{n} X{n}? X{n}+ 匹配n次
X{n,} X{n,}? X{n,}+ 匹配最少n次
X{n, m} X{n, m}? X{n, m}+ 匹配最少n次,最多m次
三、正則表達式的應用
編譯正則表達式的字元串值構造對應的模式Pattern對象
創建匹配給定輸入與此模式的匹配器Matcher
通過匹配器對象執行操作,匹配器對象的方法很豐富,互相組合使用更加強大(JDK在線API)
1、去掉字元串中的空格和換行符
public static String getNonBlankStr(String str) {
if(str!=null && !"".equals(str)) {
Pattern pattern = Pattern.compile("\s*| | | "); //去掉空格符合換行符
Matcher matcher = pattern.matcher(str);
String result = matcher.replaceAll("");
return result;
}else {
return str;
}
} 12345678910
2、去掉指定特殊字元
public static String StringFilter(String str) throws PatternSyntaxException { // String regEx = "[^a-zA-Z0-9]"; // 只允許字母和數字
// 清除掉所有特殊字元(除了~之外)
String regEx="[`!@#$%^&*()+=|{}':;',//[//].<>/?!@#¥%……&*()——+|{}【】『;:」「』。,、?]";
Pattern pattern = Pattern.compile(regEx);
Matcher matcher = pattern.matcher(str); return matcher.replaceAll("").trim();
}123456789
3、Pattern.matches()檢查字元串中是否存在指定字元
String text = "there are many hotels " +"by amap.the adrr: http://xxxx pattern.";String pattern = ".*http://.*";
boolean matches = Pattern.matches(pattern, text);//true則存在123
4、Pattern.split()用正則表達式作為分隔符,把文本分割為String類型的數組
/**
* 結果:element = grjk Text
element = wwwdsf
element = Many
element = egsdg r geg
*/String text = "A reg grjk Text reg wwwdsf reg Many reg egsdg r geg";
String patternString = "reg";
Pattern pattern = Pattern.compile(patternString);
String[] split = pattern.split(text);for(String element : split){
System.out.println("element = " + element);
}1234567891011121314
5、Matcher 實例的find() + start() + end()尋找字元串中指定字元串出現的次數和起始和結束的索引位置
/**
*結果:found: 1 : 2 - 4
found: 2 : 5 - 7
found: 3 : 23 - 25
found: 4 : 70 - 72
*/String text ="This is the text which is to be searched " +"for occurrences of the word 'is'.";
String patternString = "is";
Pattern pattern = Pattern.compile(patternString);
Matcher matcher = pattern.matcher(text);int count = 0;while(matcher.find()) {
count++;
System.out.println("found: " + count + " : " + matcher.start() + " - " + matcher.end());
}12345678910111213141516
6、Matcher 匹配指定格式的特殊字元串
Pattern pattern = Pattern.compile("[0-9]*");//判斷是否都是數字
Matcher isNum = pattern.matcher("1123是數字");
if(isNum.matches()) {
System.out.println("全部是數字");
} else {
System.out.println("有漢字");
}
㈢ JAVA正則表達式判斷 只能包含漢字、英文、「_」和數字 ,正則該怎麼寫呢
|正則表達式:[\u4e00-\u9fa5]*|\w*|\d*|_*
代碼如下:
@Test
public void test1(){
//匹配正則表達式表達式
String str = "[\u4e00-\u9fa5]*|\w*|\d*|_*";
Pattern pattern = Pattern.compile(str);
//要匹配的字版符串
String mStr = "還有多權遠_344fjdk";
System.out.println("測試的字元串:"+mStr);
Matcher m = pattern.matcher(mStr);
//如果匹配到了
if(m.find()){
System.out.println("匹配內容:"+m.group());
}
}
程序運行結果:
(3)java正則表達式api擴展閱讀
匹配包括下劃線的任何單詞字元。類似但不等價於「[A-Za-z0-9_]」,"單詞"字元使用Unicode字元集,中文的為:[\u4e00-\u9fa5],表示英文字母的為w,表示數字的為d,表示_的為_,而*號表示的則是0個或多個,|表示的則是或,所以把每個要匹配的用|拼接可以表示要匹配的正則表達式。
㈣ java正則表達式是什麼
java正則表達式是計算機科學的一個概念。正則表達式使用單個字元串來描述、匹配一系列符合某個句法規則的字元串。
在編寫處理字元串的程序或網頁時,經常會有查找符合某些復雜規則的字元串的需要。正則表達式就是用於描述這些規則的工具。換句話說,正則表達式就是記錄文本規則的代碼。
很可能你使用過Windows/Dos下用於文件查找的通配符(wildcard),也就是*和?。如果你想查找某個目錄下的所有的Word文檔的話,你會搜索*.doc。在這里,*會被解釋成任意的字元串。
和通配符類似,正則表達式也是用來進行文本匹配的工具,只不過比起通配符,它能更精確地描述你的需求——當然,代價就是更復雜——比如你可以編寫一個正則表達式,用來查找所有以0開頭,後面跟著2-3個數字,然後是一個連字型大小「-」,最後是7或8位數字的字元串(像010-12345678或0376-7654321)。
正則表達式的基本操作:
正則表達式定義:符合一定規則的表達式。
作用:用於專門操作字元串。
特點:用於一些特定的符號來表示一些代碼操作。這樣就簡化書寫。所以學習正則表達式,就是在學習一些特殊符號的使用。
好處:可以簡化對字元串的復雜操作。
弊端:符號定義越多,正則越長,閱讀性越差。
㈤ java中檢查姓名的正則表達式
以襪畢下是一個Java中用於檢查姓名的正則表達式,它能夠匹配2到8個漢字或者2到16個英文字母。
code
String regex = "^([\\u4E00-\\u9FA5]{2,8}|[a-zA-Z]{2,16})$";
具體解釋如下:
^ 表示匹配字告和芹符串的開頭
() 表示一個捕獲組,其中包含了兩個子模式
[\u4E00-\u9FA5] 表示一個漢字字元,范圍為Unicode編碼的中文范圍
{2,8} 表示該字元可以出現2到8次
| 表棚派示邏輯或,表示兩個子模式中的任意一個都可以匹配成功
[a-zA-Z] 表示一個英文字母,不區分大小寫
{2,16} 表示該字元可以出現2到16次
$ 表示匹配字元串的結尾
因此,上面的正則表達式可以匹配長度為2到8個漢字或長度為2到16個英文字母的字元串,可以用於檢查姓名是否符合要求。
㈥ java求一個簡單的正則表達式:以@開頭,中間可以是任意字元除了『\』,重復1到20遍,以空格或者@結束
//已修改!
//匹配@xxx,長度為1-20。
import java.util.ArrayList;
import java.util.List;
import java.util.regex.Matcher;
import java.util.regex.Pattern;
public class MatcherDemo {
private static String regex = "@[^\\\\@ ]{1,20}";
private static Pattern pattern = Pattern.compile(regex);
public static void main(String[] args) throws Exception {
printNames(matcherNames("@aaaaa@cccccc"));;
printNames(matcherNames("@bbbb @dddddd"));
}
private static String[] matcherNames(String input) {
List<String> list = new ArrayList();
Matcher matcher = pattern.matcher(input);
while (matcher.find()) {
list.add(matcher.group());
}
return list.toArray(new String[0]);
}
private static void printNames(String[] names) {
System.out.printf("共匹配到%s個用戶:\n", names.length);
for (int i = 0; i < names.length; i++) {
System.out.printf("用戶%s是:%s\n", i + 1, names[i]);
}
}
}