1. 如何通過java,javascript獲得某一指定URL的網頁源碼
import java.io.BufferedReader;
import java.io.IOException;
import java.io.InputStream;
import java.io.InputStreamReader;
import java.net.MalformedURLException;
import java.net.URL;
public class Test {
public static void main(String[] args) {
byte[] buf = new byte[100];
URL url;
try {
System.out.println("請輸入一段完整的:");
int count = System.in.read(buf);
String addr = new String(buf, 0, count);
url = new URL(addr);
InputStream ins = url.openStream();
BufferedReader bReader = new BufferedReader(new InputStreamReader(
ins));
String info = bReader.readLine();
while (info != null) {
System.out.println(info);
info = bReader.readLine();
}
} catch (MalformedURLException e) {
System.out.println(e);
} catch (IOException e) {
System.out.println(e);
}
}
}
需要獲取網頁抄中的javascript執行後生成的完整的網頁源碼(通常使用的右鍵-查看源代碼是看不到js執行後的內容的,用firefox的firebug看到的代碼就是js執行後的代碼),從中提取一些有用的數據。
3. JS如何查找源代碼
<html>
<head>
<meta http-equiv="Content-type" content="text/html; charset=utf-8">
<title>遠程網頁源代碼讀取</title>
<style type="text/css">
/* 頁面字體樣式 */
body, td, input, textarea {
font-family:Arial;
font-size:12px;
}
</style>
<script type="text/javascript">
//用於創建XMLHttpRequest對象
function createXmlHttp() {
//根據window.XMLHttpRequest對象是否存在使用不同的創建方式
if (window.XMLHttpRequest) {
xmlHttp = new XMLHttpRequest(); //FireFox、Opera等瀏覽器支持的創建方式
} else {
xmlHttp = new ActiveXObject("Microsoft.XMLHTTP");//IE瀏覽器支持的創建方式
}
}
//直接通過XMLHttpRequest對象獲取遠程網頁源代碼
function getSource() {
var url = document.getElementById("url").value; //獲取目標地址信息
//地址為空時提示用戶輸入
if (url == "") {
alert("請輸入網頁地址。");
return;
}
document.getElementById("source").value = "正在載入……"; //提示正在載入
createXmlHttp(); //創建XMLHttpRequest對象
xmlHttp.onreadystatechange = writeSource; //設置回調函數
xmlHttp.open("GET", url, true);
xmlHttp.send(null);
}
//將遠程網頁源代碼寫入頁面文字區域
function writeSource() {
if (xmlHttp.readyState == 4) {
document.getElementById("source").value = xmlHttp.responseText;
}
}
</script>
</head>
<body>
<h1>遠程網頁源代碼讀取</h1>
<div>
地址:<input type="text" id="url">
<input type="button" onclick="getSource()" value="獲取源碼">
</div>
<textarea rows="10" cols="80" id="source"></textarea>
</body>
</html>
我也是別人那抄的 你試試吧 好的話給我個最佳
4. js獲取網頁源代碼
let sourceCodeTxt = '';
var xhr = new XMLHttpRequest();
xhr.open('GET', window.location.href, false);
xhr.send();
sourceCodeTxt= xhr.responseText;
5. 如何用javascript 讀取另一個頁面中內容
我沒看1樓的程序好用不好用,不過lz的問題就是java網頁數據抓取問題,其實不難的,如果 java網頁數據抓取會有好多,如果樓上代碼不好用,就按我說的辦吧。
原理就是連接url,獲取一個字元串就是你看到的源文件,然後再去解析而已,lz要對自己有信心哦。考得代碼你就懶得去學了,只有通過自己的努力才能成長。
6. httpClient怎麼獲取網頁中js執行完後的網頁源碼
我做過爬蟲,對這個比較了解,如果網頁源碼中有些內容是js渲染過來的,那專你通過HttpClient直接取肯定取不到,但是屬這些數據一般都是通過非同步請求傳過來的(一般都是通過ajax的get或者post方式)。那麼你可以通過火狐瀏覽器的firebug或者chrome的審查元素,在網路選項中找到這個請求地址,再用HttpClient請求一次就可以拿到你想要的數據,但這些數據可能不是網頁源碼,一般都是json字元串。