python怎麼爬js網站_如何用Python爬蟲抓取JS動態篩選內容

『壹』如何用python爬取網站數據

這里簡單介紹一下吧，以抓取網站靜態、動態2種數據為慧返拍例，實驗環境win10+python3.6+pycharm5.0，主要內容如下：

抓取網站靜態數據（數據在網頁源碼中）：以糗事網路網站數據為例

1.這里假設我們抓取的數據如下，主要包括用戶昵稱、內容、好笑數和評論數這4個欄位，如下：

對應的網頁源碼如下，包含我們所需要的數據：

2.對應網頁結構，主要代碼如下，很簡單，主要用到requests+BeautifulSoup，其中requests用於請求頁面，BeautifulSoup用於解析頁面：

程序運行截圖如下，已經成功爬取到數據：

抓取網站動態數據（數據不在網頁源碼中，json等文件中）：以人人貸網站數據為例

1.這里假設我們爬取的是債券數據，主要包括年利率世型、借款標題、期限、金額和進度這5個欄位信息，截圖如下：

打開網頁源碼中，可以發現數據不在網頁源碼中，按F12抓包分析時，才發現在一個json文件中，如下：

2.獲取到json文件的url後，我們就可以爬取對應數據了，這里使用的包與上面類似，因為是json文件，所以還用了json這個包（解析json），主要內容如下：

程序運行截圖如下，前羨已經成功抓取到數據：

至此，這里就介紹完了這2種數據的抓取，包括靜態數據和動態數據。總的來說，這2個示例不難，都是入門級別的爬蟲，網頁結構也比較簡單，最重要的還是要會進行抓包分析，對頁面進行分析提取，後期熟悉後，可以藉助scrapy這個框架進行數據的爬取，可以更方便一些，效率更高，當然，如果爬取的頁面比較復雜，像驗證碼、加密等，這時候就需要認真分析了，網上也有一些教程可供參考，感興趣的可以搜一下，希望以上分享的內容能對你有所幫助吧。

『貳』如何用Python爬蟲抓取JS動態篩選內容

打開瀏覽器，以google chrome為例，輸入你上面的網址。
然後按F12打開調試窗版口，然後嘗試勾選左邊某一個權選項，馬上可以看到右邊的調試窗口有東西輸出。
找到第一個輸出的行，點擊header，可以看到每一個都是用的post方法。
所以只需要構造相應的header並post上去，就可以得到你想要的數據了。

而這個發放返回的是json數據，然後編碼成dict格式提取出數據就可以了。

『叄』如何用python爬蟲直接獲取被js修飾過的網頁Elements

對於這種動態載入的網站，建議使用第三方庫selenium爬取。

它可以完全模擬瀏覽器，等待網站全部載入完成後再進行數據的自動獲取。

對於主流的ChromeDriver、InternetExplorerDriver、FirefoxDriver、OperaDriver都支持，網站上的元素也支持多種選擇器，如class、id、xpath等。

但是用習慣以後，對於這種非純靜態頁面，離開selenium感覺就完全不會爬蟲了。

『肆』如何用python爬取js動態生成內容的頁面

抓取js動態生成的內容的頁面有兩種基本的解決方案

1用dryscrape庫動態抓取頁面
js腳本是通過瀏覽器來執行並返回信息的，所以，抓取js執行後的頁面，一個最直接的方式就是用python模擬瀏覽器的行為。WebKit 是一個開源的瀏覽器引擎，python提供了許多庫可以調用這個引擎，dryscrape便是其中之一，它調用webkit引擎來處理包含js等的網頁！

2 selenium web測試框架

selenium是一個web測試框架，它允許調用本地的瀏覽器引擎發送網頁請求，所以，它同樣可以實現抓取頁面的要求。

熱點內容

osx賬戶恢復配置文件發布：2025-04-27 10:09:29 瀏覽：966

安卓m1卡破解發布：2025-04-27 10:08:41 瀏覽：557

系統保護文件是什麼發布：2025-04-27 10:08:32 瀏覽：200

冒險島老物品代碼發布：2025-04-27 10:01:24 瀏覽：834

南航app如何綁定護照發布：2025-04-27 10:01:23 瀏覽：140

公眾號小程序怎麼製作發布：2025-04-27 09:54:54 瀏覽：24

同城買菜什麼網站發布：2025-04-27 09:52:26 瀏覽：211

鴻蒙系統如何顯示大文件發布：2025-04-27 09:37:17 瀏覽：484

文件解壓後可以刪掉哪些發布：2025-04-27 09:24:19 瀏覽：357

怎麼清除c盤垃圾文件發布：2025-04-27 09:23:45 瀏覽：720

js都要掌握哪些內容發布：2025-04-27 09:18:54 瀏覽：906

四角號碼字典有哪幾個版本發布：2025-04-27 09:18:48 瀏覽：869

資料庫入侵dede 發布：2025-04-27 09:18:06 瀏覽：700

日本用什麼app聽歌發布：2025-04-27 09:08:10 瀏覽：562

cmd新建空文件發布：2025-04-27 08:58:44 瀏覽：481

廣聯達app在哪裡找發布：2025-04-27 08:42:56 瀏覽：125

javaudp網路編程發布：2025-04-27 08:34:54 瀏覽：263

如何快速統計文件大小發布：2025-04-27 08:24:35 瀏覽：395

dnf90版本奶爸寂靜9加點發布：2025-04-27 08:24:32 瀏覽：506

5s升級ios811好嗎發布：2025-04-27 08:23:49 瀏覽：773

導航:首頁 > 編程語言 > python怎麼爬js網站

python怎麼爬js網站

與python怎麼爬js網站相關的資料

友情鏈接