加入 Gitee
与超过 1200万 开发者一起发现、参与优秀开源项目,私有仓库也完全免费 :)
免费加入
文件
该仓库未声明开源许可证文件(LICENSE),使用请关注具体项目描述及其代码上游依赖。
克隆/下载
第一章作业.py 1.03 KB
一键复制 编辑 原始数据 按行查看 历史
王涛 提交于 2020-05-26 23:06 . py27期-珠海-王涛-第五周作业
import lxml.etree as le
with open('edu.html','r',encoding='utf-8') as f:
# 读取本地的edu.html
html = f.read()
# 把html转换成xml对象
html_x = le.HTML(html)
# 得到6个div对象
div_x_s = html_x.xpath('//div[@class="classify_cList"]')
# 构造数据存储对象
data_s = []
# 对6个包含1级分类和2级分类对象做遍历
for div_x in div_x_s:
# 得到1级分类
category1 = div_x.xpath('./h3/a/text()')[0]
# 得到这个1级分类下的所有2级分类
category2_s = div_x.xpath('./div/span/a/text()')
# 添加数据到存储对象
data_s.append(
dict(
category1 = category1,
category2_s = category2_s
)
)
# 打印data_s
# print(data_s)
# 对data_s进行遍历打印
for data in data_s:
print(data.get('category1'))
for category2 in data.get('category2_s'):
print(' ',category2)
马建仓 AI 助手
尝试更多
代码解读
代码找茬
代码优化