1. 用jsOUP解析HTML,怎样删除掉其中的一段DIV标签及内容
用JSOUP解析HTML删除掉其中的一段DIV标签及内容的方法:
1、解析并提取 HTML 元素
如下:
File input = new File("D:/test.html");
Document doc = Jsoup.parse(input, "UTF-8", "url");
Element content = doc.getElementById("content");
Elements divs= content.getElementsByTag("div");
for (Element div: divs) {
String linkHref = link.attr("id");
String linkText = link.text();
}
2、用remove方法删除div
div.remove();
2. jsoup 能否加载异步的数据 加载的url 中含有异步的 展现的数据,怎么用jsoup 获得
其实jsoup用来解析比较好,获取html内容,还是用httpclient好一些
3. jsoup解析td标签值
1.你现在的代复码定位的是所有包含制"class=nlctd1"的语句。用同样的方法可以定位class="nlctd2",然后用getElementsByTag("a")加.html()或字符串截取的方法可以提取出你要的内容。
2.有没有方法可以根据现在的位置截取下一个td标签值呢?这个问题用你的例子不好说,比如在你的class=nlctd1里包含多个元素,例如<div>题名与责任</div> <div>111</div> <div>22</div> ,这种情况你通过定位 class=nlctd1后,在for (Element element : td) 循环里就可以依次截取下一个标签里的内容了!
4. Jsoup选择器选择的class有多个属性的写法
Documentdoc=Jsoup.connect("your_url").get();//通过url获取html页面ElementsListClass=doc.getElementsByAttributeValue("class","your_class_name");//通过class属性获取元素集合for(Elementelement:ListClass){Elementsdivs=element.getElementsByTag("div");//获取divfor(Elementdiv:divs){StringdivText=div.text().trim();System.out.println(divText);}}
5. java 的jsoup怎么获取两个标签相同 类名相同的 标签里面的内容
Document doc= Jsoup.connect("your_url").get(); //通过url获取html页面
Elements ListClass = doc.getElementsByAttributeValue("class","your_class_name"); //通过class属性获取元内素容集合
for (Element element :ListClass) {
Elements divs = element.getElementsByTag("div"); //获取div
for (Element div: divs) {
String divText = div.text().trim();
System.out.println(divText);
}
}
6. jsoup 怎么拿某个div下的的内容
Document doc = Jsoup.parse(html),html就是指包含你需要的div的那段html代码,然后再Elements el = doc.select("div"),如果这个div有class=abc,或者id=abc,或者其它的属性attr=abc,那么你就这么选,doc.select("div[AttrName=abc]"),AttrName就是指class,id或者其它的属性名称,网络回答不允许直接贴链接,所以你最好再搜索下Jsoup的API,读一读,Selector类的文档有实例.