最近用python写了个小爬虫自动下点东西,但是url 是含中文的,而且中文似乎是 gbk 编码然后转成 url的。举个例子吧,我如果有个unicode字符串“历史上那些牛人们.pdf”,那么我转换成url之后是, t="%20%E5%8E%86%E5%8F%B2%E4%B8%8A%E9%82%A3%E4%BA%9B%E7%89%9B%E4%BA%BA%E4%BB%...
Selector(text=None, type=None, namespaces=None, root=None,base_url=None, _expr=None)创建解析HTML或XML文本的对象 参数:text 在python2中是一个Unicode对象,在python3中是一个str对象 type 定义Selector类型,可以是"html",“xml"或者是None(默认),如果为None则默认选择为"html”base_url...
这里不再赘述,重点是后面的-d,它在官方帮助的解释是:-d, --data DATA HTTP POST data (H)--data-ascii DATA HTTP POST ASCII data (H)--data-binary DATA HTTP POST binary data (H)--data-urlencode DATA HTTP POST data url encoded (H)--delegation STRING GSS...
port=443): Max retries exceeded with url: /t/ZTRwQYYgn/ (Caused by SSLError(SSLEOFError(8, 'EOF occurred in violation of protocol (_ssl.c:1129)')))的情况常见,主要由两种原因导致。原因
py2exe – 将 Python 脚本变为独立软件包(Windows)。pynsist – 一个用来创建 Windows 安装程序的工具,可以在安装程序中打包 Python本身。构建工具 将源码编译成软件。buildout – 一个构建系统,从多个组件来创建,组装和部署应用。BitBake – 针对嵌入式 Linux 的类似 make 的构建工具。fabricate ...