代码拉取完成,页面将自动刷新
#!/usr/bin/env python3
# -*- coding: utf-8 -*-
import requests, bs4
def url2soup(url, headers={}, data=None):
"""url -> soup
处理任意编码的网页,返回BeautifulSoup对象
"""
if data:
response = requests.post(url, data=data, headers=headers)
else:
response = requests.get(url, headers=headers)
encodings = requests.utils.get_encodings_from_content(response.text)
if encodings:
encoding = encodings[0]
else:
encoding = response.apparent_encoding
encode_content = response.content.decode(encoding, 'replace')
return bs4.BeautifulSoup(encode_content, "lxml")
此处可能存在不合适展示的内容,页面不予展示。您可通过相关编辑功能自查并修改。
如您确认内容无涉及 不当用语 / 纯广告导流 / 暴力 / 低俗色情 / 侵权 / 盗版 / 虚假 / 无价值内容或违法国家有关法律法规的内容,可点击提交进行申诉,我们将尽快为您处理。