加入 Gitee
与超过 1200万 开发者一起发现、参与优秀开源项目,私有仓库也完全免费 :)
免费加入
文件
克隆/下载
solve.py 1.96 KB
一键复制 编辑 原始数据 按行查看 历史
xqm32 提交于 2020-04-15 15:16 . 修复错误,添加字数限制
import re
import os
from tag import *
from settings import *
def auto_title(content): # 以「第」字开头可以避免和首行标题的重复
return \
re.compile(r'^(第.{1,10}[章节].*)', re.M).sub(r'{0}\1{0}'.format(get_setting('标题样式')), content) \
if get_setting('章节标题') \
else content
def floor(fl):
set_quote(False)
set_first(True)
content = tag(fl)
if (not get_setting('回复') and is_quote()
or get_setting('限制字数') and len(content) < get_setting('限制阙值')):
log(f'^')
return str()
log(f'*' if is_quote() else f'.')
content = '\n'+get_setting('标题样式')+get_first()+get_setting('标题样式')+'\n'+content \
if len(content) > get_setting('字数阙值') \
else '\n'+get_first()+'\n'+content
if is_quote():
content = '\n{{同人注释start}}\n'+content+'\n{{同人注释end}}\n'
if get_setting('分割线'):
content += '\n----\n'
return content
def page(p):
log(f'正在处理源码')
content = str()
for i in p.xpath('//div[@class="pcb"]'):
content += floor(i)
log(f' √\n')
return content
def post(url, fr=1, to=1, fn=None):
content = str()
fn = fn if fn else get_tid(url)
if not os.path.exists('output'):
os.mkdir('output')
for n in range(fr, to+1):
content += page(get(generate_url(url, n)))
content = re.compile(r'(\n|\r\n)+').sub('\n\n', content)
content = auto_title(content)
log(f'正在写入文本至:output/{fn}.mw')
with open(f'output/{fn}.mw', 'w', encoding='utf-8_sig') as f:
f.write(content)
log(f' √\n')
return
if __name__ == '__main__':
arg = input().split()
if len(arg) == 1:
post(arg[0])
elif len(arg) == 2:
post(arg[0], int(arg[1]))
elif len(arg) == 3:
post(arg[0], int(arg[1]), int(arg[2]))
elif len(arg) == 4:
post(arg[0], int(arg[1]), int(arg[2]), arg[3])
Loading...
马建仓 AI 助手
尝试更多
代码解读
代码找茬
代码优化