代码拉取完成,页面将自动刷新
同步操作将从 耿直的小爬虫/Python爬虫 强制同步,此操作会覆盖自 Fork 仓库以来所做的任何修改,且无法恢复!!!
确定后同步将在后台操作,完成时将刷新页面,请耐心等待。
import requests
from selenium import webdriver
from pyquery import PyQuery as pq
import pymongo
from bs4 import BeautifulSoup
clien=pymongo.MongoClient(host='改成自己的数据库IP')
db=clien.Used_car
coll=db.The_car
headers={
'User-Agent':'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.36 SE 2.X MetaSr 1.0'
}
def A_used_car(page):
Url='https://www.guazi.com/gl/buy/o%s/#bread'%page
brow=webdriver.Chrome()
brow.get(Url)
Web_content=brow.page_source
doc=pq(Web_content)
content=doc('.car-a').items()
for i in content:
#cute=pq(i.find('.t').html()).text()
#print(cute)
#print(i.find('.car-a').attr('title'))
data={
'车名字':i.attr('title'),
'年数和里程数':i.find('.t-i').text().replace('\n',''),
'价格':i.find('.line-through').text()
}
print(data)
coll.insert_one(data)
brow.close()
for i in range(1,65):
A_used_car(i)
此处可能存在不合适展示的内容,页面不予展示。您可通过相关编辑功能自查并修改。
如您确认内容无涉及 不当用语 / 纯广告导流 / 暴力 / 低俗色情 / 侵权 / 盗版 / 虚假 / 无价值内容或违法国家有关法律法规的内容,可点击提交进行申诉,我们将尽快为您处理。