㈠ 如何使用java的正则表达式提取html标签
你的意思是不是用Java访问一个链接,在返回的数据中提取出放在标签中的数据,例如取出<img src=""/>这些标签中的数据
㈡ 求一个用正则表达式获取到src以.js结尾的内容 顺便来个详细正则表达式教程
src\s*=\s*([^\,]+)\.js 如果是在java中需要加转义字符:src\\s*=\\s*([^\\,]+)\\.js
㈢ java正则表达式匹配img路径
package table;
public class FileTester
{
public static void main ( String[] args )
{
String reg = "(src[\\=\\s\'\"]+)http\\:\\/\\/img\\.\\.com\\/hi\\/[^\'\"]+([\'\"])";
String url = "sdfsdf<img src='https://gss0.bdstatic.com/70cFsjip0QIZ8tyhnq/hi/we.com' />sdf<img src='https://gss0.bdstatic.com/70cFsjip0QIZ8tyhnq/hi/we.com' />sf'";
url = url.replaceAll (reg, "$1$2");
System.out.println (url);
}
}
㈣ java 正则表达式, 将img 标签 过滤后只剩下 src属性,
这其实用不到正则表达式,用了弄不好还出错,直接用字符串判断吧,找到src那一长串,然后取出来。
String html="<img alt=\"cv发布会结束后,铁道部新闻发言人被记者包围\" src=\"http://img1.cache.netease.com/catchpic/B/B4/.jpg\"/><br/>";
String[] splittedStr = html.split(" ");
String srcStr = null;
for(String str:splittedStr){
if(str.trim().startsWith("src")){
srcStr = str;
}
}
srcStr = srcStr.substring(srcStr.indexOf("\"")+1,srcStr.lastIndexOf("\""));
System.out.println(srcStr);
看了你的补充要求,其实你改一下上面的程序,就很好实现了。
String html="<img alt=\"cv发布会结束后,铁道部新闻发言人被记者包围\" src=\"http://img1.cache.netease.com/catchpic/B/B4/.jpg\"/><br/>";
String[] splittedStr = html.split(" ");
String srcStr = null;
for(String str:splittedStr){
if(str.trim().startsWith("src")){
srcStr += str;
}
}
srcStr = "<img " + srcStr + "/>";
System.out.println(srcStr);
㈤ JAVA 正则表达式获取字符串中的URL和标题
String s = "<movie title=\"电影\" src=\"https://www.qq.com:808/asdsadsd+_#$\"/> <movie title=\"电影2\" src=\"http://www.qq.com:808/asdsadsd+_#$\"/>";
String mode = "<movie\\s*title=([^>]*)src=(?=\"?http|https)([^>]*)/>";
Pattern p = Pattern.compile(mode);
Matcher m = p.matcher(s);
HashMap<String, String> map = new HashMap<String, String>();
while (m.find()) {
System.out.println("find...");
String title = m.group(1);
String url = m.group(2);
System.out.println("title:" + title + ",src:" + url);
map.put(title, url);
}
㈥ 急 java里用正则替换掉img标签的src里的内容
我觉得可以先用正则把先匹配出imgName = “图片名.gif”,回然后再替答换:
content = content.replaceAll("(.*?)src=\"(.*?)","$1src=\"../image/" + imgName);
㈦ java正则匹配字符串,下面给出的这段字符串,我想取出里面的img 里面的src路径的内容,保存在一个数组里面.
String bireinfo = "<IMG border=0 align=center src=/epbwebeditor/uploadfile/20140509103010830.jpg 300px; HEIGHT: 201px></SPAN></FONT><SPAN style=FONT-FAMILY: New FONT-SIZE: 10.5pt Roman?,?serif?; ?Times><IMG border=0 align=center src=/epbwebeditor/uploadfile/20140509103058264.jpg 300px; HEIGHT: 201px></SPAN><SPAN style=FONT-FAMILY: New FONT-SIZE: 10.5pt Roman?,?serif?; ?Times><IMG border=0 align=center src=/epbwebeditor/uploadfile/20140509103323797.jpg 300px; HEIGHT: 201px></SPAN></P>";
Pattern p = Pattern.compile("(?:src=\"?)(.*?)\"?\\s");
Matcher m = p.matcher(bireinfo);
String[] arr = new String[10];
int i = 0;
while(m.find()) {
arr[i] = m.group(1);
i++;
}
㈧ java中截取下面字符串中所有的src的内容,求大神帮忙如何截取!
您好:
根据数据的格式,因内容不定长,可采用拆分函数做处理,即split方法,先用 src=" 做拆分标识,再对数组中的内容以 " 号做拆分,第0个就是src中的内容了,具体代码及运行结果如下:
代码中 """ 是转义字符,否则会报错。
供参考,希望对你有帮助!