加入 Gitee
与超过 1200万 开发者一起发现、参与优秀开源项目,私有仓库也完全免费 :)
免费加入
文件
克隆/下载
utils.py 647 Bytes
一键复制 编辑 原始数据 按行查看 历史
William 提交于 2019-12-05 13:57 . upload file
#!/usr/bin/env python3
# -*- coding: utf-8 -*-
import requests, bs4
def url2soup(url, headers={}, data=None):
"""url -> soup
处理任意编码的网页,返回BeautifulSoup对象
"""
if data:
response = requests.post(url, data=data, headers=headers)
else:
response = requests.get(url, headers=headers)
encodings = requests.utils.get_encodings_from_content(response.text)
if encodings:
encoding = encodings[0]
else:
encoding = response.apparent_encoding
encode_content = response.content.decode(encoding, 'replace')
return bs4.BeautifulSoup(encode_content, "lxml")
Loading...
马建仓 AI 助手
尝试更多
代码解读
代码找茬
代码优化