Jcseg是基于mmseg算法的一个轻量级Java中文分词器,同时集成了关键字提取,关键短语提取,关键句子提取和文章自动摘要等功能,并且提供了一个基于Jetty的web服务器,方便各大语言直接http调用,同时提供了最新版本的lucene、solr、elasticsearch、opensearch的搜索分词接口
强力 Java 爬虫,列表分页、详细页分页、ajax、微内核高扩展、配置灵活
webmagic 是一个无须配置、便于二次开发的爬虫框架,它提供简单灵活的API,只需少量代码即可实现一个爬虫。
elasticsearch便捷版本,集成了一些常用的插件
基于Spring Boot构建将,某个微博账号、微信公众号转为RSS服务,提供RSS订阅源 Rss Tool for Weibo. Wechat
Elasticsearch权威指南中文版