1. 如何通过java,javascript获得某一指定URL的网页源码
import java.io.BufferedReader;
import java.io.IOException;
import java.io.InputStream;
import java.io.InputStreamReader;
import java.net.MalformedURLException;
import java.net.URL;
public class Test {
public static void main(String[] args) {
byte[] buf = new byte[100];
URL url;
try {
System.out.println("请输入一段完整的:");
int count = System.in.read(buf);
String addr = new String(buf, 0, count);
url = new URL(addr);
InputStream ins = url.openStream();
BufferedReader bReader = new BufferedReader(new InputStreamReader(
ins));
String info = bReader.readLine();
while (info != null) {
System.out.println(info);
info = bReader.readLine();
}
} catch (MalformedURLException e) {
System.out.println(e);
} catch (IOException e) {
System.out.println(e);
}
}
}
需要获取网页抄中的javascript执行后生成的完整的网页源码(通常使用的右键-查看源代码是看不到js执行后的内容的,用firefox的firebug看到的代码就是js执行后的代码),从中提取一些有用的数据。
3. JS如何查找源代码
<html>
<head>
<meta http-equiv="Content-type" content="text/html; charset=utf-8">
<title>远程网页源代码读取</title>
<style type="text/css">
/* 页面字体样式 */
body, td, input, textarea {
font-family:Arial;
font-size:12px;
}
</style>
<script type="text/javascript">
//用于创建XMLHttpRequest对象
function createXmlHttp() {
//根据window.XMLHttpRequest对象是否存在使用不同的创建方式
if (window.XMLHttpRequest) {
xmlHttp = new XMLHttpRequest(); //FireFox、Opera等浏览器支持的创建方式
} else {
xmlHttp = new ActiveXObject("Microsoft.XMLHTTP");//IE浏览器支持的创建方式
}
}
//直接通过XMLHttpRequest对象获取远程网页源代码
function getSource() {
var url = document.getElementById("url").value; //获取目标地址信息
//地址为空时提示用户输入
if (url == "") {
alert("请输入网页地址。");
return;
}
document.getElementById("source").value = "正在加载……"; //提示正在加载
createXmlHttp(); //创建XMLHttpRequest对象
xmlHttp.onreadystatechange = writeSource; //设置回调函数
xmlHttp.open("GET", url, true);
xmlHttp.send(null);
}
//将远程网页源代码写入页面文字区域
function writeSource() {
if (xmlHttp.readyState == 4) {
document.getElementById("source").value = xmlHttp.responseText;
}
}
</script>
</head>
<body>
<h1>远程网页源代码读取</h1>
<div>
地址:<input type="text" id="url">
<input type="button" onclick="getSource()" value="获取源码">
</div>
<textarea rows="10" cols="80" id="source"></textarea>
</body>
</html>
我也是别人那抄的 你试试吧 好的话给我个最佳
4. js获取网页源代码
let sourceCodeTxt = '';
var xhr = new XMLHttpRequest();
xhr.open('GET', window.location.href, false);
xhr.send();
sourceCodeTxt= xhr.responseText;
5. 如何用javascript 读取另一个页面中内容
我没看1楼的程序好用不好用,不过lz的问题就是java网页数据抓取问题,其实不难的,如果 java网页数据抓取会有好多,如果楼上代码不好用,就按我说的办吧。
原理就是连接url,获取一个字符串就是你看到的源文件,然后再去解析而已,lz要对自己有信心哦。考得代码你就懒得去学了,只有通过自己的努力才能成长。
6. httpClient怎么获取网页中js执行完后的网页源码
我做过爬虫,对这个比较了解,如果网页源码中有些内容是js渲染过来的,那专你通过HttpClient直接取肯定取不到,但是属这些数据一般都是通过异步请求传过来的(一般都是通过ajax的get或者post方式)。那么你可以通过火狐浏览器的firebug或者chrome的审查元素,在网络选项中找到这个请求地址,再用HttpClient请求一次就可以拿到你想要的数据,但这些数据可能不是网页源码,一般都是json字符串。