python爬取js動態(tài)網(wǎng)頁 [求助] python如何爬取，網(wǎng)頁上調(diào)用JS函數(shù)打開的視頻鏈接？

2021-03-15

2236

[求助] python如何爬取，網(wǎng)頁上調(diào)用JS函數(shù)打開的視頻鏈接？Selenium phantom JS模擬點擊按鈕，或者編寫另一個代碼來實現(xiàn)JS函數(shù)openvideo（）；按照第一步來解析新頁面，看

[求助] python如何爬取，網(wǎng)頁上調(diào)用JS函數(shù)打開的視頻鏈接？

Selenium phantom JS模擬點擊按鈕，或者編寫另一個代碼來實現(xiàn)JS函數(shù)openvideo（）；按照第一步來解析新頁面，看看是否可以找到視頻的原始地址；如果在第二步中找到視頻的原始地址，從視頻的原始地址下載視頻。

當(dāng)我使用jsup編寫爬蟲程序時，通常會遇到HTML不返回的內(nèi)容。但是瀏覽器顯示了一些東西。所有這些都是分析頁的HTTP請求日志。分析頁面JS代碼來解決問題。

1. 某些頁面元素被隱藏->替換選擇器解決方案

2。一些數(shù)據(jù)保存在JS/JSON對象中->截取相應(yīng)的字符串，分析并求解

3。通過API接口調(diào)用-> forge請求獲取數(shù)據(jù)

有一個終極方法

4。使用無頭瀏覽器如phantomjs或casperjs

Chrome出來的無頭瀏覽器，無頭是沒有界面的，據(jù)說這件事，phantomjs宣布停止更新，但phantomjs仍然可以使用，也是無頭瀏覽器?；蛘咧苯尤ノt