① 關於jsoup的Connection問題求助
However, to be a model student is by no means an easy thing. First, he must do his best to obtain knowledge. A man without sufficient knowledge will not succeed. Secondly,
② jsoup的使用求解:
http://download.csdn.net/detail/idoldog/2829541
http://www.oschina.net/p/jsoup/
請採納。
③ 請問java爬蟲里WebMagic和Jsoup的關系是什麼
爬蟲基本流程是 請求,解析,存儲。
WebMagic主要用來請求網路並且提取相應的地址,而Jsoup用來解析html,他們是相輔相成的關系。
④ 不用jsoup之類的工具包可以寫java爬蟲么,如果只想要java里的類
簡單的頁面?
使用 java.net.HttpURLConnection獲得內容,再自己解析想要的片段
~
~
~
⑤ linux下使用maven-assembly打一個可運行的jar包
用Java寫了一個小工具,使用maven java 工程。寫完後,想打包成一個可執行的jar包。
使用maven的插件maven-assembly-plugin
pom.xml里添加
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
<build>
<plugins>
<plugin>
<groupId>org.apache.maven.plugins</groupId>
<artifactId>maven-assembly-plugin</artifactId>
<version>3.0.0</version>
<configuration>
<archive>
<manifest>
<mainClass>com.geostack.JsoupTest</mainClass>
</manifest>
</archive>
<descriptorRefs>
<descriptorRef>jar-with-dependencies</descriptorRef>
</descriptorRefs>
</configuration>
</plugin>
</plugins>
</build>
在工程根目錄執行 mvn clean compile assembly:single
在target文件夾里生成 jsoup-jar-with-dependencies.jar
這個jar包便是可執行的jar了,用命令java -jar path\jarfile便可以執行。
注意:compile必須再assembly:single之前,要不然你工程的代碼(class文件)就不會被打包進去
⑥ jsoup.jar在哪裡下載啊
最新的1.8.1
官網版
http://jsoup.org/packages/jsoup-1.8.1.jar
或者權Maven Central
http://central.maven.org/maven2/org/jsoup/jsoup/1.8.1/jsoup-1.8.1.jar
⑦ 用JSOUP解析HTML,怎樣刪除掉其中的一段DIV標簽及內容
用JSOUP解析HTML刪除掉其中的一段DIV標簽及內容的方法是根據id刪除。
使用核心方法如下:
doc.getElementById("detail_question").remove()
舉例如下:
從baseHtml這斷代碼中刪除指定id的標簽:
String baseHtml = "<div id='stylized' class='myform'>"
+ "<input id='txt_question' name='preg' type='text' disabled='disabled' style='width:150px;'>"
+ "<div id='detail_question'>Rock</div></div>";
Document doc = Jsoup.parse(baseHtml);
doc.getElementById("detail_question").remove();
Elements elements = doc.select("div");
System.out.println(elements);
輸出的結果中沒有detail_question這個div節點了:
<div id='stylized' class='myform'>
+ "<input id='txt_question' name='preg' type='text' disabled='disabled' style='width:150px;'>
⑧ jsoup 安裝到哪 下載下來之後是不是要放到哪裡
不知道樓主用的是什麼軟體管理jar包。
如果你用的是maven,那麼你只需要在pom文件裡面寫入,在本地的package倉庫放入這個jar包
如果你用的是eclipse,方法如下
右擊你的java project項目名--選擇Build Path(中譯:設置路徑)--Configure Build Path(中譯:配置路徑)--libraries(中譯:庫)--Add External Jars(添加外部庫)
選擇指定的文件,到此,你的項目就可以調用jsoup.jar包裡面的類了
⑨ Jsoup選擇器選擇的class有多個屬性的寫法
Documentdoc=Jsoup.connect("your_url").get();//通過url獲取html頁面ElementsListClass=doc.getElementsByAttributeValue("class","your_class_name");//通過class屬性獲取元素集合for(Elementelement:ListClass){Elementsdivs=element.getElementsByTag("div");//獲取divfor(Elementdiv:divs){StringdivText=div.text().trim();System.out.println(divText);}}
⑩ 利用Jsoup獲取具體標簽屬性值
doc.select("meta[name=description]"),來get(0).attr("content")
大致是這么自寫的,你可以研究一下JSOUP的選擇器,
chenying99/archive/2013/01/04/2844615,html" target="_blank">http://www.cnblogs.com/chenying99/archive/2013/01/04/2844615.html