如何使用Java语言实现一个网页爬虫

try { // 生成一个URL对象，要获取源代码的网页地址为：http://www.sina.com.cn url = new URL("http://www.jb51.net/article/97787.htm");// 打开URL urlConnection = (HttpURLConnection) url.openConnection();// 获取服务器响应代码 responsecode = urlConnection.getResponseCode();Stri...

如何使用Java语言实现一个网页爬虫

我给你代码
public class DEmo {
public static void match(String s1) {
Pattern p = Pattern.compile("<a(.*)>.*</a>");
Matcher m = p.matcher(s1);
while (m.find()) {
System.out.println(m.group(1));
}
}

public static void main(String args[]) {
URL url;
int responsecode;
HttpURLConnection urlConnection;
BufferedReader reader;
String line;
try {
// 生成一个URL对象，要获取源代码的网页地址为：http://www.sina.com.cn
url = new URL("http://www.jb51.net/article/97787.htm");
// 打开URL
urlConnection = (HttpURLConnection) url.openConnection();
// 获取服务器响应代码
responsecode = urlConnection.getResponseCode();
String temp = "";
if (responsecode == 200) {
// 得到输入流，即获得了网页的内容
reader = new BufferedReader(new InputStreamReader(
urlConnection.getInputStream(), "GBK"));
while ((line = reader.readLine()) != null) {
temp = temp + line;
}
System.out.println(temp);
match(temp);

} else {
System.out.println("获取不到网页的源码，服务器响应代码为：" + responsecode);
}
} catch (Exception e) {
System.out.println("获取不到网页的源码,出现异常：" + e);
}

}
}2016-12-02

mengvlog 阅读 61 次 更新于 2025-12-17 17:50:08 我来答关注问题 0

1 个回答檬味博客专题活动

其他Java类似问题

如何用JAVA写一个知乎爬虫 63次阅读
要配个Java环境是下jdk还是jre 306次阅读
揭秘说说：北京学编程哪个培训机构好 65次阅读
用java写爬虫程序，有个网站获取不到链接，求指导 54次阅读
分享一段代码-用Java抓取冯小刚的微博 61次阅读
java随机数指定的范围就比如说60到100？急啊！请各位高手帮忙一下。 135次阅读

檬味博客在线解答立即免费咨询

Java相关话题

java获取时间有用 (64)
java最大值有用 (52)
java怎么输入有用 (51)
java建立有用 (50)
java打开文件有用 (57)
java图书有用 (60)
java继承类有用 (56)
java类继承有用 (62)
java登陆有用 (74)
java岗位有用 (67)