用java写爬虫程序，有个网站获取不到链接，求指导

//读取网页上的内容方法---2010.01.25 public String getOneHtml(String htmlurl) throws IOException { URL url;String temp;final StringBuffer sb = new StringBuffer();try { url = new URL(htmlurl);// 读取网页全部内容 final BufferedReader in = new BufferedReader(new InputStreamReader...

//读取网页上的内容方法---------------------2010.01.25 public String getOneHtml(String htmlurl) throws IOException {
URL url;
String temp;
final StringBuffer sb = new StringBuffer();
try {
url = new URL(htmlurl);
// 读取网页全部内容
final BufferedReader in = new BufferedReader(new InputStreamReader(
url.openStream(),"GBK"));
while ((temp = in.readLine()) != null) {
sb.append(temp);
}
in.close();
} catch (final MalformedURLException me) {
System.out.println("你输入的URL格式有问题！请仔细输入");
me.getMessage();

} catch (final IOException e) {
e.printStackTrace();

}
return sb.toString();
}上面这个方法是根据你传入的url爬取整个网页的内容，然后你写个正则表达式去匹配这个字符串的内容。2015-07-21

第一个是用js做的跳转
点击链接以后设置他下面一个表单属性的值
<input type="hidden" name="documentId" value="" />
然后提交了这个表单搞到值了以后直接你设置 documentId=xxx 往表单action里面发数据就搞到链接了2015-07-21

可能是正则表达式写错了，你用工具测试一下。2021-07-30

把网站地址链接加入2015-07-21

mengvlog 阅读 53 次 更新于 2025-12-17 06:30:21 我来答关注问题 0

4 个回答檬味博客专题活动

其他Java类似问题

如何使用Java语言实现一个网页爬虫 60次阅读
如何用JAVA写一个知乎爬虫 61次阅读
要配个Java环境是下jdk还是jre 305次阅读
分享一段代码-用Java抓取冯小刚的微博 60次阅读
java随机数指定的范围就比如说60到100？急啊！请各位高手帮忙一下。 135次阅读
java7 pkg文件是什么格式？ 61次阅读

檬味博客在线解答立即免费咨询

Java相关话题

java获取时间有用 (64)
java最大值有用 (52)
java怎么输入有用 (51)
java建立有用 (50)
java打开文件有用 (57)
java图书有用 (60)
java继承类有用 (56)
java类继承有用 (62)
java登陆有用 (74)
java岗位有用 (67)