java爬虫怎么抓取js动态生成的内容

我用Jsoup写爬虫，一般遇到html返回没有的内容。但是浏览器显示有的内容。都是分析页面的http请求日志。分析页面JS代码来解决。1、有些页面元素被隐藏起来了->换selector解决 2、有些数据保存在js/json对象中->截取对应的串，分析解决 3、通过api接口调用->伪造请求获得数据还有一个终极方法 4、使用...

java爬虫怎么抓取js动态生成的内容

如果评论是通过AJAX显示的，那么抓取有一定难度。你的爬虫需要能够解释JS，并解惑JS的内容。但如果你只针对少数的网站进行抓取，则可以针对这些网站开发专用的蜘蛛。人工分析其JS，从中找到其获取评论的AJAX接口，然后抓之。这样简单。还可以用爬虫操作一个浏览器，通过浏览器的接口获取其运行完成后的显示的内容2017-07-20

我用Jsoup写爬虫，一般遇到html返回没有的内容。但是浏览器显示有的内容。都是分析页面的http请求日志。分析页面JS代码来解决。
1、有些页面元素被隐藏起来了->换selector解决
2、有些数据保存在js/json对象中->截取对应的串，分析解决
3、通过api接口调用->伪造请求获得数据
还有一个终极方法
4、使用phantomjs或者casperjs这种headless浏览器2018-08-02

用nodejs+puppeteer，解析dom结构获取，或者直接观察返回数据的接口，看能不能直接调用2021-07-28

mengvlog 阅读 473 次 更新于 2025-10-30 14:14:09 我来答关注问题 0

3 个回答檬味博客专题活动

其他Python类似问题

为什么这么多人开始学Python？ 132次阅读
[Python] 3.1 各种loop语句的语法与应用——for loop 210次阅读
python的基本控制结构有哪些 100次阅读
java网络爬虫怎么实现抓取登录后的页面 43次阅读
java 网络爬虫怎么实现 45次阅读
python中如何打开网站？ 131次阅读

檬味博客在线解答立即免费咨询

Python相关话题

二维数组python 有用 (36)
python拟合有用 (41)
python排列有用 (37)
python日志有用 (37)
python计算机二级有用 (50)
python基本有用 (48)
pythonkey 有用 (38)
封装python 有用 (34)
python范围有用 (36)
python字节有用 (47)