代码拉取完成,页面将自动刷新
同步操作将从 xqm32/临高启明论坛同人爬取 强制同步,此操作会覆盖自 Fork 仓库以来所做的任何修改,且无法恢复!!!
确定后同步将在后台操作,完成时将刷新页面,请耐心等待。
import re
import os
from tag import *
from settings import *
def auto_title(content): # 以「第」字开头可以避免和首行标题的重复
return \
re.compile(r'^(第.{1,10}[章节].*)', re.M).sub(r'{0}\1{0}'.format(get_setting('标题样式')), content) \
if get_setting('章节标题') \
else content
def floor(fl):
set_quote(False)
set_first(True)
content = tag(fl)
if (not get_setting('回复') and is_quote()
or get_setting('限制字数') and len(content) < get_setting('限制阙值')):
log(f'^')
return str()
log(f'*' if is_quote() else f'.')
content = '\n'+get_setting('标题样式')+get_first()+get_setting('标题样式')+'\n'+content \
if len(content) > get_setting('字数阙值') \
else '\n'+get_first()+'\n'+content
if is_quote():
content = '\n{{同人注释start}}\n'+content+'\n{{同人注释end}}\n'
if get_setting('分割线'):
content += '\n----\n'
return content
def page(p):
log(f'正在处理源码')
content = str()
for i in p.xpath('//div[@class="pcb"]'):
content += floor(i)
log(f' √\n')
return content
def post(url, fr=1, to=1, fn=None):
content = str()
fn = fn if fn else get_tid(url)
if not os.path.exists('output'):
os.mkdir('output')
for n in range(fr, to+1):
content += page(get(generate_url(url, n)))
content = re.compile(r'(\n|\r\n)+').sub('\n\n', content)
content = auto_title(content)
log(f'正在写入文本至:output/{fn}.mw')
with open(f'output/{fn}.mw', 'w', encoding='utf-8_sig') as f:
f.write(content)
log(f' √\n')
return
if __name__ == '__main__':
arg = input().split()
if len(arg) == 1:
post(arg[0])
elif len(arg) == 2:
post(arg[0], int(arg[1]))
elif len(arg) == 3:
post(arg[0], int(arg[1]), int(arg[2]))
elif len(arg) == 4:
post(arg[0], int(arg[1]), int(arg[2]), arg[3])
此处可能存在不合适展示的内容,页面不予展示。您可通过相关编辑功能自查并修改。
如您确认内容无涉及 不当用语 / 纯广告导流 / 暴力 / 低俗色情 / 侵权 / 盗版 / 虚假 / 无价值内容或违法国家有关法律法规的内容,可点击提交进行申诉,我们将尽快为您处理。