加入 Gitee
与超过 1200万 开发者一起发现、参与优秀开源项目,私有仓库也完全免费 :)
免费加入
文件
该仓库未声明开源许可证文件(LICENSE),使用请关注具体项目描述及其代码上游依赖。
克隆/下载
crawl_yun_man_man.py 1.18 KB
一键复制 编辑 原始数据 按行查看 历史
Administrator 提交于 2024-01-30 04:07 . init
#!/usr/bin/env python3
# -*- coding: utf-8 -*-
"""
@author: 徐胜虎
@contact:1813366784@qq.com
@version: 1.0.0
@license: Apache Licence
@file: crawl_yun_man_man.py.py
@time: 2024/1/29 13:47
"""
import requests # 库
from bs4 import BeautifulSoup # BeautifulSoup爬虫经常用的,具体不太明白
headers = { # 用来模拟是浏览器正常发出的请求,每个浏览器都不同
'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/65.0.3325.146 Safari/537.36'
}
url = 'https://www.ymm56.com/zhaoche/'
res = requests.get(url, headers=headers)
soup = BeautifulSoup(res.text, 'lxml')
for elem in soup.findAll(name='div', attrs={'class': 'zhaoche-cargolist-detail'}):
print(elem.select('h3 a')[0].get_text(strip=True))
print(elem.select('p')[0].get_text(strip=True))
print(elem.select('p')[1].get_text(strip=True))
print(elem.select('p')[3].get_text(strip=True))
print(elem.select('p')[4].get_text(strip=True))
print(elem.select('p')[5].get_text(strip=True))
print(elem.select('p')[6].get_text(strip=True))
print(elem.select('p')[7].get_text(strip=True))
print(elem.select('p')[8].get_text(strip=True))
Loading...
马建仓 AI 助手
尝试更多
代码解读
代码找茬
代码优化