導航:首頁 > 編程語言 > java抓取商品信息

java抓取商品信息

發布時間:2023-02-02 23:16:14

⑴ 關於java中arraylist的使用問題——數據覆蓋

GoodsBean gBean;這句改為GoodsBean gBean=new GoodBean(); 因為你沒有為這個對象開辟一個新的內存空間,所以每次循環的時候都是把之前的那個對象引用重新指向到當前對象。到最後所有的對象都引用最後一次循環中對象的地址,所以list裡面的對象都是最後一次循環的內容。希望對你有所幫助

⑵ 如何用java實現抓取商城商品信息到自己的頁面上來!!! 求解啊,大神們!!

對於加密的網站還沒去研究,不知道能不能抓取,現在只是對一些沒有加密的網站進行網頁數據抓取。剛剛開始寫的時候以為很多網站都能抓取,但是發現很多都加密了,本來以為一些地址可以通過網頁數據檢測工具測出他的數據變化,但是只能監測到一些通過js顯示的數據,依然不能抓取到加密的網站。嗨,這個問題以後再說吧。
[java]
import java.net.* ;
import java.io.* ;
import java.util.regex.* ;
public class Capture{
public static void main(String args[])throws Exception{
System.out.println("*************************手機號查詢************************") ;
System.out.println("我的位置是:" + new GrabMobile().grabMobileLocation("15023141745")) ;
System.out.println("手機卡類型是:" + new GrabMobile().grabMobileType("15023141745")) ;
System.out.println("我的郵編是:" + new GrabMobile().grabMobilePost("15023141745")) ;
System.out.println("*************************身份證查詢************************") ;
System.out.println("我的性別是:" + new GrabIdentity().grabIdentitySex("362203199208243575")) ;
System.out.println("我的生日是:" + new GrabIdentity().grabIdentityBirth("362203199208243575")) ;
System.out.println("我的家鄉是:" + new GrabIdentity().grabIdentityHome("362203199208243575")) ;
}
}
class GrabMobile{
public String grabMobileLocation(String m)throws Exception{
String strUrl = "http://www.ip138.com:8080/search.asp?action=mobile&mobile=" + m;
URL url = new URL(strUrl) ;
HttpURLConnection httpUrlCon = (HttpURLConnection)url.openConnection() ;
InputStreamReader inRead = new InputStreamReader(httpUrlCon.getInputStream(),"GBK") ;
BufferedReader bufRead = new BufferedReader(inRead) ;
StringBuffer strBuf = new StringBuffer() ;
String line = "" ;
while ((line = bufRead.readLine()) != null) {
strBuf.append(line);
}
String strStart = "卡號歸屬地" ;
String strEnd = "卡 類 型";
String strAll = strBuf.toString() ;

int start = strAll.indexOf(strStart) ;

int end = strAll.indexOf(strEnd) ;

String result = strAll.substring(start+42,end-33) ;
result = drawChMob(result) ;
return result ;
}
public String grabMobileType(String m)throws Exception{
String strUrl = "http://www.ip138.com:8080/search.asp?action=mobile&mobile=" + m;
URL url = new URL(strUrl) ;
HttpURLConnection httpUrlCon = (HttpURLConnection)url.openConnection() ;
InputStreamReader inRead = new InputStreamReader(httpUrlCon.getInputStream(),"GBK") ;
BufferedReader bufRead = new BufferedReader(inRead) ;
StringBuffer strBuf = new StringBuffer() ;
String line = "" ;
while ((line = bufRead.readLine()) != null) {
strBuf.append(line);
}
String strStart = "卡 類 型" ;
String strEnd = "<TD align=\"center\">區 號</TD>";
String strAll = strBuf.toString() ;

int start = strAll.indexOf(strStart) ;

int end = strAll.indexOf(strEnd) ;

String result = strAll.substring(start+12,end) ;
result = drawChMob(result) ;
result = result.substring(1) ;
return result ;
}
public String grabMobilePost(String m)throws Exception{
String strUrl = "http://www.ip138.com:8080/search.asp?action=mobile&mobile=" + m;
URL url = new URL(strUrl) ;
HttpURLConnection httpUrlCon = (HttpURLConnection)url.openConnection() ;
InputStreamReader inRead = new InputStreamReader(httpUrlCon.getInputStream(),"GBK") ;
BufferedReader bufRead = new BufferedReader(inRead) ;
StringBuffer strBuf = new StringBuffer() ;
String line = "" ;
while ((line = bufRead.readLine()) != null) {
strBuf.append(line);
}
String strStart = "郵 編" ;
String strEnd = "更詳細的..";
String strAll = strBuf.toString() ;

int start = strAll.indexOf(strStart) ;

int end = strAll.indexOf(strEnd) ;

String result = strAll.substring(start+40,end-55) ;
return result ;
}
public String drawChMob(String str){
StringBuffer strBuf = new StringBuffer() ;
String regex="([\u4e00-\u9fa5]+)";
Matcher matcher = Pattern.compile(regex).matcher(str);
while(matcher.find()){
strBuf.append(matcher.group(0)).toString() ;
}
return strBuf.toString() ;
}
}
class GrabIdentity{
public String grabIdentitySex(String userid)throws Exception{
String strUrl = "http://qq.ip138.com/idsearch/index.asp?action=idcard&userid=" + userid + "&B1=%B2%E9+%D1%AF";
URL url = new URL(strUrl) ;
HttpURLConnection httpUrlCon = (HttpURLConnection)url.openConnection() ;
InputStreamReader inRead = new InputStreamReader(httpUrlCon.getInputStream(),"GBK") ;
BufferedReader bufRead = new BufferedReader(inRead) ;
StringBuffer strBuf = new StringBuffer() ;
String line = "" ;
while ((line = bufRead.readLine()) != null) {
strBuf.append(line);
}
String strStart = " 別" ;
String strEnd = "出生日期";
String strAll = strBuf.toString() ;

int start = strAll.indexOf(strStart) ;

int end = strAll.indexOf(strEnd) ;

String result = strAll.substring(start+7,end) ;
result = drawCh(result) ;
return result ;
}
public String grabIdentityBirth(String userid)throws Exception{
String strUrl = "http://qq.ip138.com/idsearch/index.asp?action=idcard&userid=" + userid + "&B1=%B2%E9+%D1%AF";
URL url = new URL(strUrl) ;
HttpURLConnection httpUrlCon = (HttpURLConnection)url.openConnection() ;
InputStreamReader inRead = new InputStreamReader(httpUrlCon.getInputStream(),"GBK") ;
BufferedReader bufRead = new BufferedReader(inRead) ;
StringBuffer strBuf = new StringBuffer() ;
String line = "" ;
while ((line = bufRead.readLine()) != null) {
strBuf.append(line);
}
String strStart = "出生日期:</td><td class=\"tdc2\">" ;
String strEnd = "</td><tr><tr><td class=";
String strAll = strBuf.toString() ;

int start = strAll.indexOf(strStart) ;
int end = strAll.indexOf(strEnd) ;

String result = strAll.substring(start+27,end) ;
return result ;
}
public String grabIdentityHome(String userid)throws Exception{
String strUrl = "http://qq.ip138.com/idsearch/index.asp?action=idcard&userid=" + userid + "&B1=%B2%E9+%D1%AF";
URL url = new URL(strUrl) ;
HttpURLConnection httpUrlCon = (HttpURLConnection)url.openConnection() ;
InputStreamReader inRead = new InputStreamReader(httpUrlCon.getInputStream(),"GBK") ;
BufferedReader bufRead = new BufferedReader(inRead) ;
StringBuffer strBuf = new StringBuffer() ;
String line = "" ;
while ((line = bufRead.readLine()) != null) {
strBuf.append(line);
}
String strStart = "證 地:</td><td class=\"tdc2\">" ;
String strEnd = "<br/></td></tr><tr><td class=\"tdc3\" valign=\"top\" align=\"right\">部分或" ;
String strAll = strBuf.toString() ;

int start = strAll.indexOf(strStart) ;
int end = strAll.indexOf(strEnd) ;

String result = strAll.substring(start+31,end) ;
return result ;
}
public String drawCh(String str){
StringBuffer strBuf = new StringBuffer() ;
String regex="([\u4e00-\u9fa5]+)";
Matcher matcher = Pattern.compile(regex).matcher(str);
if(matcher.find()){
str = strBuf.append(matcher.group(0)).toString() ;
}
return str ;
}
}

待會傳上改裝成的android小程序,可以手機號查詢和身份證查詢。

⑶ 怎麼用java調用淘寶開發平台獲得淘寶的所有的類目,要詳細的介面

淘寶的API有些是開放的,我查了一下所有類目的API是收費的,需要申請APIKey,然後調用對應查詢介面,就能返回XML或JSON數據進行自己的處理了。

如果真是開發需要,就可以買淘寶的服務啊。

調用很簡單,比如taobao.itemcats.get 介面(獲取後台供賣家發布商品的標准商品類目),如下Java代碼就返回結果了(前提是提供APIKey,需要申請審核)

TaobaoClientclient=newDefaultTaobaoClient(url,appkey,secret);
ItemcatsGetRequestreq=newItemcatsGetRequest();
req.setFields("cid,parent_cid,name,is_parent");
req.setParentCid(50011999L);
req.setCids("18957,19562,");
ItemcatsGetResponseresponse=client.execute(req);



另外,變通的方法是自己開發爬蟲,在淘寶頁面上抓取,但問題是得不到淘寶技術支持,比如淘寶改版後也得跟著改動爬蟲代碼。

⑷ JAVA中,定義了一個物品集合,如何通過一個商品的編號得到該商品的所有信息。

首先你自己創建一個商品類,比如 class Goods{},然後在這個類里邊定義這些屬性,比如你的name,price等,然後分別實現他們的get、set方法,完了之後定義一個list。
比如:list<Goods> glist = new ArrayList<Goods>();
現在你可以創建商品並將其放入這個list集合中了。
比如:Goods good = new Goods();
good.setGoodsId("goodsId"); good.setName("goodsName"); ...
然後將good存入list中,glist.add(good);
然後我們再定義第二件商品,比如是一個鍵盤
good = new Goods(); good.setName("鍵盤");.....
同樣我們再將其放入list中,glist.add(good);
此時glist中有兩件商品,假設我們現在輸出第二件商品的所有信息
System.out.println(glist.get(1).getGoodsId());
System.out.println(glist.get(1).getName);
.......
注意,第一件商品為get(0),下標和數組類似

⑸ 使用java語言爬取自己的淘寶訂單看看買了哪些東西

Java爬蟲框架WebMagic簡介及使用

一、介紹

webmagic的是一個無須配置、便於二次開發的爬蟲框架,它提供簡單靈活的API,只需少量代碼即可實現一個爬蟲。webmagic採用完全模塊化的設計,功能覆蓋整個爬蟲的生命周期(鏈接提取、頁面下載、內容抽取、持久化),支持多線程抓取,分布式抓取,並支持自動重試、自定義UA/cookie等功能。




二、概覽

WebMagic項目代碼分為核心和擴展兩部分。核心部分(webmagic-core)是一個精簡的、模塊化的爬蟲實現,而擴展部分則包括一些便利的、實用性的功能(例如註解模式編寫爬蟲等)。
WebMagic的結構分為Downloader、PageProcessor、Scheler、Pipeline四大組件,並由Spider將它們彼此組織起來。這四大組件對應爬蟲生命周期中的下載、處理、管理和持久化等功能。而Spider則將這幾個組件組織起來,讓它們可以互相交互,流程化的執行,可以認為Spider是一個大的容器,它也是WebMagic邏輯的核心。

2.1 WebMagic的四個組件

⑹ java查詢商品信息

是很抽象

首先連庫(資料庫)

執行查詢語句

數值返回java界面(或jsp調用界面)

⑺ java抓取京東商城商品信息,根據網頁源文件如何寫抓取如下信息:

聽說過jsoup嗎。很簡單,抄兩句話搞定。

Document document = Jsoup
.connect("這個頁面的url例如:http://www..com")
.method(Connection.Method.GET)
.followRedirects(false)
.timeout(100000)
.get();
Element el=document.getElementById("zzh_jd")//div 開始的id 。
//然後這個element你想怎麼用就怎麼用了。
//jsoup的使用類似於javascript很方便。

⑻ 用java怎麼獲取淘寶商品鏈接中的商品id。。。你去淘寶隨便搜索一個商品

這個只能復制截取
有時候鏈接長的也很麻煩
如果自己在開店在電腦上操作會方便很多

閱讀全文

與java抓取商品信息相關的資料

熱點內容
福昕閱讀器合並照片pdf文件 瀏覽:591
vhd文件有什麼用 瀏覽:482
編程小朋友看什麼書 瀏覽:623
經營如何讓數據說話 瀏覽:258
如何在手機上升級opop 瀏覽:614
coreldrawx5免費視頻教程 瀏覽:725
網站引導頁面源碼 瀏覽:234
個人簡歷範文word 瀏覽:220
uc下載的視頻怎樣提取到文件 瀏覽:499
英雄下載下載最新版本2015下載安裝 瀏覽:433
NX深孔鑽編程替換面如何操作 瀏覽:725
手機怎麼刪除pdf文件 瀏覽:256
蘋果手機沒有efs文件夾怎麼辦 瀏覽:723
metro軟體在哪個文件夾 瀏覽:69
怎麼用手機登錄編程貓 瀏覽:400
文本md204顯示器如何編程 瀏覽:705
如何將表中重復數據標記 瀏覽:859
中級資料庫系統工程師應用技術考什麼 瀏覽:404
博途編程如何設置停止鍵 瀏覽:409
python3刪除文件內容 瀏覽:754

友情鏈接