求大神指导：用python的urllib.urlopen读取网页源码的问题

我之前遇到过类似的问题，现在也没解决。现象和你的差不多，就是在浏览器里边可以正常访问目标网址，在python解释器或者脚本中访问会超时。最终怀疑是windows浏览器设置相关的问题，楼主可以试试完整的urlopen方式:

try:
url = "http://api.themoviedb.org/3/search/person?api_key=API-KEY&query=natalie+portman"
header = { 'User-Agent': 'Mozilla/5.0 (Windows; U; Windows NT 5.1; en-US; rv:1.9.2.16) Gecko/20110319 Firefox/3.6.16' }
req = urllib2.Request(url, None, header)
f = urllib2.urlopen(req)
except urllib2.HTTPError, e:
print e.code
print e.msg
print e.header
print e.fp.read()

把模拟浏览器头加进去试试。2014-03-01

直接使用requests吧，更方便~
然后配合beautifulsoup~
或者，直接scrapy~2017-09-12

可以把代码和详细的错误信息贴一下么2014-02-28

mengvlog 阅读 8 次 更新于 2025-07-20 22:04:54 我来答关注问题 0

3 个回答檬味博客专题活动

其他Python类似问题

python怎么爬取数据 10次阅读
python 怎样爬去网页的内容 14次阅读
怎么使用python查看网页源代码 8次阅读
Python函数精解：sum函数 7次阅读
商业案例实战：Python数据可视化之四象限图 7次阅读
项目开发神器VsCode配置指南！含C++、Python、Java环境配置 9次阅读

檬味博客在线解答立即免费咨询

Python相关话题

二维数组python 有用 (8)
python拟合有用 (8)
python排列有用 (9)
python日志有用 (8)
python计算机二级有用 (7)
python基本有用 (6)
pythonkey 有用 (6)
封装python 有用 (7)
python范围有用 (7)
python字节有用 (9)