1. 用jsOUP解析HTML,怎樣刪除掉其中的一段DIV標簽及內容
用JSOUP解析HTML刪除掉其中的一段DIV標簽及內容的方法:
1、解析並提取 HTML 元素
如下:
File input = new File("D:/test.html");
Document doc = Jsoup.parse(input, "UTF-8", "url");
Element content = doc.getElementById("content");
Elements divs= content.getElementsByTag("div");
for (Element div: divs) {
String linkHref = link.attr("id");
String linkText = link.text();
}
2、用remove方法刪除div
div.remove();
2. jsoup 能否載入非同步的數據 載入的url 中含有非同步的 展現的數據,怎麼用jsoup 獲得
其實jsoup用來解析比較好,獲取html內容,還是用httpclient好一些
3. jsoup解析td標簽值
1.你現在的代復碼定位的是所有包含制"class=nlctd1"的語句。用同樣的方法可以定位class="nlctd2",然後用getElementsByTag("a")加.html()或字元串截取的方法可以提取出你要的內容。
2.有沒有方法可以根據現在的位置截取下一個td標簽值呢?這個問題用你的例子不好說,比如在你的class=nlctd1里包含多個元素,例如<div>題名與責任</div> <div>111</div> <div>22</div> ,這種情況你通過定位 class=nlctd1後,在for (Element element : td) 循環里就可以依次截取下一個標簽里的內容了!
4. Jsoup選擇器選擇的class有多個屬性的寫法
Documentdoc=Jsoup.connect("your_url").get();//通過url獲取html頁面ElementsListClass=doc.getElementsByAttributeValue("class","your_class_name");//通過class屬性獲取元素集合for(Elementelement:ListClass){Elementsdivs=element.getElementsByTag("div");//獲取divfor(Elementdiv:divs){StringdivText=div.text().trim();System.out.println(divText);}}
5. java 的jsoup怎麼獲取兩個標簽相同 類名相同的 標簽裡面的內容
Document doc= Jsoup.connect("your_url").get(); //通過url獲取html頁面
Elements ListClass = doc.getElementsByAttributeValue("class","your_class_name"); //通過class屬性獲取元內素容集合
for (Element element :ListClass) {
Elements divs = element.getElementsByTag("div"); //獲取div
for (Element div: divs) {
String divText = div.text().trim();
System.out.println(divText);
}
}
6. jsoup 怎麼拿某個div下的的內容
Document doc = Jsoup.parse(html),html就是指包含你需要的div的那段html代碼,然後再Elements el = doc.select("div"),如果這個div有class=abc,或者id=abc,或者其它的屬性attr=abc,那麼你就這么選,doc.select("div[AttrName=abc]"),AttrName就是指class,id或者其它的屬性名稱,網路回答不允許直接貼鏈接,所以你最好再搜索下Jsoup的API,讀一讀,Selector類的文檔有實例.