master

分支 (1)

管理

管理

master

python-project
/
crawl_yun_man_man.py

#!/usr/bin/env python3
# -*- coding: utf-8 -*-

"""
@author: 徐胜虎
@contact:1813366784@qq.com
@version: 1.0.0
@license: Apache Licence
@file: crawl_yun_man_man.py.py
@time: 2024/1/29 13:47
"""

import requests  # 库
from bs4 import BeautifulSoup  # BeautifulSoup爬虫经常用的，具体不太明白

headers = {  # 用来模拟是浏览器正常发出的请求,每个浏览器都不同
    'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/65.0.3325.146 Safari/537.36'
}

url = 'https://www.ymm56.com/zhaoche/'
res = requests.get(url, headers=headers)
soup = BeautifulSoup(res.text, 'lxml')

for elem in soup.findAll(name='div', attrs={'class': 'zhaoche-cargolist-detail'}):
    print(elem.select('h3 a')[0].get_text(strip=True))
    print(elem.select('p')[0].get_text(strip=True))
    print(elem.select('p')[1].get_text(strip=True))
    print(elem.select('p')[3].get_text(strip=True))
    print(elem.select('p')[4].get_text(strip=True))
    print(elem.select('p')[5].get_text(strip=True))
    print(elem.select('p')[6].get_text(strip=True))
    print(elem.select('p')[7].get_text(strip=True))
    print(elem.select('p')[8].get_text(strip=True))