同步操作将从 yuenbin商城/kettle商城-smartKettle商城源码 强制同步,此操作会覆盖自 Fork 仓库以来所做的任何修改,且无法恢复!!!
确定后同步将在后台操作,完成时将刷新页面,请耐心等待。
本产品是基于开源Kettle自研的Kettle核心接口调用基础组件,其实早在5年前就想搞了,构思了很久,拖到现在,不过还行,现在也不晚吧
最初的想法是启蒙于当年给烟草做过的一个数据交换平台的项目,数据的抽取是基于Kettle 5.x版本, 使用kettle的spoon客户端做的数据抽取
为企业解决了棘手并且重要的ETL问题,因此Kettle是一款非常优秀的开源数据抽取工具。
同时,kettle自身也有很多的问题,比如,
- 只能使用客户端配置作业、转换
- 跨平台移植困难
- 数据安全性较差,系统一旦崩溃,文件库的内容容易丢失
- 客户端非常耗内存、CPU,只适合配置,不适合做业务
- Web界面极其简单、丑陋,生产环境无法投入使用
基于上述几个企业痛点,我才决定工作之余,每天借用一点休息时间,慢慢积累,坚持不懈,才有了今天Smart Kettle调度平台的出世,也希望能切实
帮助到企业解决数据抽取、调度、监控的问题。
Smart Kettle 官方交流群①(500人):668964239
Smart Kettle 官方交流群②(500人):668964239
联系邮箱: 869952837@qq.com
Smart Kettle是针对上述企业的痛点,对kettle的使用做了一些包装、优化,使其在web端也能
具备基础的kettle作业、转换的配置、调度、监控,能在很大一定程度上协助企业完成不同业务场景下
数据的ETL(抽取、转换、加工)的能力。
注意:本系统并非是对kettle源码的再造,而是借助kettle的API,实现kettle在web端功能华丽的转身
技术栈:
- 前端使用nginx 作为前端服务器
- 前端使用vue作为展现框架
- 数据库端使用mysql作为基础数据库
- 数据库监控使用Druid作为基础监控
- 定时调度使用Quartz作为基础插件
- 后端框架使用Springboot+Mybatis作为组合
演示环境:
- 域名访问 :
http://yuenbin.cn/test-kettle-admin
用户名-密码:superadmin或admin-1
- ip访问:
http://101.132.24.211/test-kettle-admin
用户名-密码:superadmin或admin-1
整个工程的目录结构如下:
后端工程:
├─doc
│ └─database
│ ├─MySql_ds0 --基础数据库设置
│ └─MySql_ds1 --基础数据库设置
├─docker --容器部署详情
├─folder
├─jenkins --jenkins持续部署详情
├─settings --maven默认配置
├─src
│ ├─main
│ │ ├─java
│ │ │ └─org
│ │ │ └─yaukie
│ │ │ └─frame
│ │ │ ├─autocode --代码机入口
│ │ │ │ ├─controller
│ │ │ │ ├─dao
│ │ │ │ │ └─mapper
│ │ │ │ ├─model
│ │ │ │ └─service
│ │ │ │ ├─api
│ │ │ │ └─impl
│ │ │ ├─config --系统基础配置入口
│ │ │ ├─kettle
│ │ │ │ ├─api --kettle核心接口所在位置
│ │ │ │ ├─core
│ │ │ │ ├─listener --kettle监听所在位置
│ │ │ │ ├─quartz --定时器所在位置
│ │ │ │ └─service
│ │ │ ├─listener
│ │ │ └─pool --线程池配置所在位置
│ │ └─resources --核心配置所在位置
│ │ ├─mapper
│ │ ├─template
│ │ └─ui
│ │ └─images
│ └─test
│ └─java
│ └─org
│ └─yaukie
│ └─frame --核心逻辑所在位置
前端工程:
├─docker
│ ├─dev
│ └─prod
├─jenkins
├─public
│ ├─cron
│ └─json
├─src
│ ├─api
│ │ ├─login-form
│ │ ├─main
│ │ │ └─components
│ │ │ ├─a-back-top
│ │ │ ├─error-store
│ │ │ ├─fullscreen
│ │ │ ├─header-bar
│ │ │ │ ├─custom-bread-crumb
│ │ │ │ └─sider-trigger
│ │ │ ├─language
│ │ │ ├─side-menu
│ │ │ ├─tags-nav
│ │ │ └─user
│ │ ├─page-box
│ │ │ └─src
│ │ │ └─styles
│ │ │ └─css
│ │ ├─page-table
│ │ │ └─src
│ │ │ ├─components
│ │ │ └─styles
│ │ │ └─css
│ │ ├─parent-view
│ │ ├─search-box
│ │ │ └─src
│ │ │ └─styles
│ │ │ └─css
│ │ ├─upload-file
│ │ │ └─src
│ │ │ └─styles
│ │ │ └─css
│ │ ├─upload-img
│ │ │ └─src
│ │ │ └─styles
│ │ │ ├─css
│ │ │ └─images
│ │ ├─upload-img-list
│ │ │ └─src
│ │ │ └─styles
│ │ │ └─css
│ │ ├─upload-video
│ │ │ └─src
│ │ │ └─styles
│ │ │ ├─css
│ │ │ └─images
│ │ └─weeks
│ │ └─src
│ ├─config
│ ├─directive
│ │ └─module
│ ├─libs --工具类
│ ├─locale --国际化配置
│ │ └─lang
│ ├─mock
│ │ └─data
│ ├─router --基础路由配置
│ │ └─modules
│ ├─store --系统状态机
│ │ └─module
│ ├─styles
│ │ └─components
│ └─view --调度平台核心前端功能
│ ├─business --业务配置
│ ├─examples
│ │ ├─common
│ │ └─page
│ ├─exception --异常监控
│ ├─homepage --调度大屏
│ │ └─common
│ ├─job --作业调度
│ ├─log --日志监控
│ ├─login --登录模板
│ ├─pool --线程池配置
│ ├─repo --资源库配置
│ ├─scheduler --定时器调度
│ ├─task --定时调度
│ ├─trans --转换调度
│ └─warning --告警监控
登录界面
登录界面内置了两个账号,一个是admin,一个是superadmin,密码1
调度大盘
调度大盘上半部分,展示近期实例运行详情,包括运行成功、运行失败、运行中、以及未运行的实例总体概况
调度大盘中间部分,则通过图表统计作业以及转换实例的分类情况
调度大盘下半部分,则主要展示实例在某段时间的运行趋势如何,可以透过折线图很直观的看出每个时间段的
执行情况,包括运行失败、运行成功的次数分布
调度大盘的最下面则主要统计任务告警情况
作业调度
调度管理分为作业调度以及转换调度,作业调度包括作业名称、描述、运行状态以及运行时间等信息展示 ,
在作业调度查询界面,选择创建作业(按模板),则将会根据选定模板创建作业
在作业调度查询界面,选择新建作业(已有),则将会从资源库中选择已通过客户端配置好的
作业
在作业调度查询界面,选中目标作业之后,在上方点击合适的执行按钮,将会执行对应任务,并实时监控任务状态
在作业调度查询界面,选中目标作业之后,点击调度监控,则可以查看作业的调度图
上述所有操作,转换调度的操作方式同作业类似
转换调度
转换调度查询列表,详细描述转换调度执行情况、执行历史、实时监控执行进度等功能
实时查看转换调度运行情况
可随时编辑转换信息
可随时编辑转换信息
定时调度
在作业调度界面,选中执行方式,在执行方式中,选择定时任务执行,则进入到定时执行调度界面
在作业定时界面中,您可以选择任意的定时规则
资源库目录树
可以维护多个资源库,本系统同时支持文件库以及数据库资源库,但建议使用数据库作为资源库,文件库作为
资源库使用过程中,经常会出现一些奇怪的问题,并且从数据备份角度来讲,不安全
文件库资源库
支持文件库资源库的配置,可通过配置文件不同的传输类型,自定义远程服务器及本地服务的文件库配置,
如下图所示:
SFTP/FTPS/FTP的配置情况如下图所示,可以通过配置远程机器,获取到远程的资源库目录信息
数据库资源库
支持数据库资源库配置,可通过配置数据库地址,连接资源库,此中方式更好的保护资源库信息,
使得后期业务更新、数据迁移、数据备份变得更加有效、也更加安全,如下图所示:
告警监控
告警监控主要采集作业任务或转换任务在某段时间内的执行细节,并将执行细节以异常记录的形式存储下来
便于后续任务调度过程中任务执行细节的跟踪,方便开发或运维人员精准找出任务异常原因
调度日志
支持作业/转换调度的日志检控管理,为业务场景提供全链条的日志跟踪机制,用户可以自由下载业务日志
通过实时监控日志调用情况,监控业务场景
登陆日志
支持不同用户登录日志监控,此举是为了监控用户登录/使用情况
操作日志
支持用户操作行为监控,将系统关键节点操作行为记录下来,用作系统行为分析
setting.xml
,方便从本人的阿里云仓库下载相应的jar包,仓库地址配置为: <servers>
<server>
<id>rdc-releases</id>
<username>Y3z0VZ</username>
<password>Bb8byTSlq0</password>
</server>
<server>
<id>rdc-snapshots</id>
<username>Y3z0VZ</username>
<password>Bb8byTSlq0</password>
</server>
</servers>
```
<pluginRepository>
<id>snapshots</id>
<url>https://maven.aliyun.com/nexus/content/groups/public</url>
<releases>
<enabled>false</enabled>
</releases>
<snapshots>
<enabled>true</enabled>
</snapshots>
</pluginRepository>
<pluginRepository>
<id>rdc-releases</id>
<url>https://repo.rdc.aliyun.com/repository/128991-release-EJH8o1/</url>
<releases>
<enabled>true</enabled>
</releases>
<snapshots>
<enabled>false</enabled>
</snapshots>
</pluginRepository>
<pluginRepository>
<id>rdc-snapshots</id>
<url>https://repo.rdc.aliyun.com/repository/128991-snapshot-NY2Ub0/</url>
<releases>
<enabled>false</enabled>
</releases>
<snapshots>
<enabled>true</enabled>
</snapshots>
</pluginRepository>
</pluginRepositories>
</profile>
内容不要更改,因为里面配置的是我本人的阿里云仓库地址,密码不会再改变,如果有变化,会在网站统一通知,届时,
重新下载即可 ,仓库环境配置好之后,静静等待jar下载吧,等下载完毕,要去仓库检查一下是否有如下几个jar:
```xml
x1-simple-job-2021.4.jar
x-kettle-core-2021.4.jar
x-common-base-2021.5.jar
x-common-pro-2021.5.jar
x-common-auth-2021.5.jar
如果本地仓库有如上几个jar,那么恭喜您,下载成功,接下来开始进入到步骤三:
#配置服务器
#配置服务器
#配置服务器
server:
port: ${XTL_APP_SERVER_PORT:9876}
servlet:
context-path: ${XTL_APP_SERVER_PATH:/xtl-server}
#配置数据源
spring:
redis:
# 默认不开启 则使用内置Map 作为缓存使用
enabled: ${XTL_REDIS_ENABLED:false} # redis缓存开关【如果有redis建议开启,提高性能】
host: ${XTL_REDIS_HOST:127.0.0.1}
port: ${XTL_REDIS_PORT:6379}
password: ${XTL_REDIS_PASS:root}
jedis:
pool:
max-active: 8
max-wait: -1
max-idle: 500
min-idle: 0
lettuce:
shutdown-timeout: 0
application:
name: ${XTL_APP_NAME:xtl-app} # 应用名称【使用默认就行】
datasource:
druid:
# 主库数据源
master:
#系统数据库访问地址【必填项】
url: ${XTL_APP_MASTER_DATASOURCE_URL:jdbc:mysql://localhost:3306/xtl?useUniCode=true&characterEncoding=UTF-8&zeroDateTimeBehavior=convertToNull&useSSL=true&serverTimezone=GMT%2B8}
#系统数据库用户名【必填项】
username: ${XTL_APP_MASTER_DATASOURCE_USERNAME:root}
#系统数据库密码【必填项】
password: ${XTL_APP_MASTER_DATASOURCE_PASS:root}
# 从库数据源
slave:
# 从数据源开关/默认关闭
enabled: false
url: jdbc:mysql://localhost:3306/test_01?useUniCode=true
username: root
password: root
# 关闭sharding-jdbc 必须为false
shardingsphere:
enabled: false
# 设置时区
jackson:
date-format: yyyy-MM-dd HH:mm:ss
time-zone: GMT+8
kettle:
scheduler:
#是否开启定时调度,默认为fals,则系统启动不会自动执行定时
enabled: ${XTL_KETTLE_SCHEDULER:false} #kettle定时调度启用为true,应用启动之后,自动将任务加入到定时器执行,设置为false则需要手动触发定时任务
log:
file:
#日志物理路径【必填项】
path: ${XTL_KETTLE_LOG_FILE_PATH:/xtl/kettle/logs} # 这个地方建议一定要配置一个存放目录,方便后期下载,查看历史执行记录,如果为"",则不会产生日志到服务器
size: ${XTL_KETTLE_LOG_FILE_SIZE:10} # 控制日志文件的大小,默认是10M,超过10M则截断请求
repo:
# 自定义数据库资源库 使用之前必须先定义资源库【必填项】
name: ${XTL_KETTLE_REPO_NAME:临时资源库} # 资源库名称【必填项】
hostName: ${XTL_KETTLE_DB_HOST:localhost} # 数据库连接地址【必填项】
dbPort: ${XTL_KETTLE_DB_PORT:3306} # 数据库端口 资源库目前仅支持MySQL【必填项】
dbName: ${XTL_KETTLE_DB_NAME:etl} # 数据库实例名【必填项】
userName: ${XTL_KETTLE_DB_USERNAME:root} #数据库用户名【必填项】
passWord: ${XTL_KETTLE_DB_PASS:root} # 数据库密码【必填项】
repoLoginName: ${XTL_KETTLE_REPO_LOGINNAME:admin} #资源库登录账户 默认admin【必填项】
repoLoginPass: ${XTL_KETTLE_REPO_LOGINPASS:admin} #资源库登录密码 默认admin【必填项】
# 该线程池会优先充满至最大的线程数(JDK默认优先将任务提交到队列,队列满了再充满至最大的线程数)
pool:
# 线程池前缀
namePrefix: ${XTL_THREAD_POOL_PREFIX:kettleThreadPool}
# 核心线程数
coreThreads: ${XTL_THREAD_POOL_CORE:20}
# 最大的线程数
maxThreads: ${XTL_THREAD_POOL_MAX:50}
# 队列容量
queueCapacity: ${XTL_THREAD_POOL_QUEUE_CAPACITY:100}
# 5分钟空闲则释放
keepAliveTimeMin: ${XTL_THREAD_POOL_KEEPALIVE:5}
# Swagger配置
swagger:
# 是否开启swagger
enabled: true
# 请求前缀
pathMapping: /
#当前系统版本号
version: V2021.5
# 系统验证配置
yaukie:
auth:
enabled: true # 系统开启权限认证模块【使用默认就行】
encoder:
type: md5 # 使用MD5加密方式,如果不设置,则使用强散列函数【使用默认就行】
# 是否开启权限认证模块
# 如果开启登录验证模块,此配置有效
token:
# 令牌自定义标识
header: Authorization # TOKEN 头【使用默认就行】
# 令牌密钥
secret: yuenbin@inspur.com&yaukie@163.com # TOKEN加密使用的秘钥【使用默认就行】
# 令牌有效期(默认10分钟) 如果不配置 按照10分钟过期
expire: 10 # 令牌TOKEN过期时间,默认十分钟【使用默认就行】
# 令牌刷新间隔 1 分钟
refresh: 1 # 零头TOKEN刷新间隔默认1分钟【使用默认就行】
logging:
#系统日志存放路径
path: ${XTL_APP_LOG_PATH:/maven/xtl-web-server/logs}
level:
org.yaukie.frame.autocode.dao.mapper: debug
root: ${XTL_APP_LOG_LEVEL:info}
#扫描mapper配置,统一放到classpath目录下
mybatis:
mapper-locations: classpath*:mapper/**/*Mapper.xml
configuration:
log-impl: org.apache.ibatis.logging.stdout.StdOutImpl
配置注释写的很清楚了,这里不再解释,如有不懂的地方,请留言
步骤四
步骤三完成之后,需要在本地建立一个应用数据库,数据库脚本详见:doc->database->Mysql,包括建表语句及初始化数据
请自行在本地执行,并完善yml配置 。
步骤五
步骤四完成之后,开始配置kettle资源库数据库,虽然本系统同时支持文件库以及数据库资源库,但还是强烈建议使用数据库作为
资源库,考虑数据移植方便性、安全性、高效性,使用数据库作为资源库,资源库请自行建立,并完善yml配置。
步骤六
上述步骤执行完毕之后,请将如下内容复制到pom.xml
文件中去,如果不加此文件,本地跑会有问题
<resources>
<resource>
<directory>src/main/java</directory>
<includes>
<include>**/*.yml</include>
<include>**/*.xml</include>
</includes>
<filtering>false</filtering>
</resource>
<resource>
<directory>src/main/resources</directory>
<includes>
<include>**/*.yml</include>
<include>**/*.xml</include>
</includes>
<filtering>false</filtering>
</resource>
</resources>
如果要构建一键启动,重新打包,请按照如下方式修改pom.xml
文件,这种方式打成的jar包,不会包括xml以及kjb文件
<resources>
<resource>
<directory>src/main/resources</directory>
<excludes>
<exclude>**/*.yml</exclude>
<exclude>**/*.kjb</exclude>
</excludes>
<filtering>true</filtering>
</resource>
</resources>
如上配置可以减少jar包的体积
需要注意的是:
1、由于本系统升级之后,支持Kettle 9.2.0.0-179版本,因此需要配置一下 kettle-password-encoder-plugins.xml
文件
本系统依赖包x-kettle-core-2021.4.jar
已经集成了上述xml插件,因此,读者不需要再集成
2、直接使用Kettle 9.2.0.0-179版本,系统启动会报[simple-jndi] is not directory
异常,原因未知,为解决此问题,在根目录下面
建了一个simple-jndi
的目录,除非读者不使用9.2.0.0-179版本的Kettle,否则不要私自删除目录!
3、如果读者了解原因,也请留言,本人会及时更新升级
步骤七
资源库一定要设定好,按照配置文件给的信息,必须配一个资源库,默认为数据库类型的资源库,系统启动的时候需要加载、初始化,否则系统
跑不起来
请参考 application-dev.yml
文件的资源库配置
重申一下:
默认的资源库名称为:xtl(名称可以随便更改),默认是数据库类型并且为Mysql,x_repository数据库中的默认repo_id为1326379690046259200
这个值是系统初始化的时候给定的,请不要更改!请不要更改!请不要更改!
步骤八
上述内容都配置好之后,这里运行:
Start.java
启动应用,并在浏览器访问:http://ip:port/xtl-server/swagger-ui.html ,出现如下截图,那么恭喜您启动成功:
下载 x-smart-kettle-font 前端应用 ,下载地址详见上述简介
# clone the project
git clone http://open.inspur.com/yuenbin/x-smart-kettle-front.git
git clone https://gitee.com/yaukie/x-smart-kettle-front.git
git clone http://github.com/yaukie/x-smart-kettle-front.git
// install dependencies
npm install
// develop
npm run dev
vue-config.js
,把后端服务器的地址换成您的地址即可 devServer: {
proxy: {
"/xtl-server": {
target: "http://localhost:9876/xtl-server/",
pathRewrite: { "^/xtl-server": "" },
changeOrigin: true
}
}
}
然后执行 npm run dev
本地启动应用,出现如下控制台打印的信息,则恭喜您前端也启动成功!
懒人模式使用方式针对那些不想下载源码,也不想自己搭建本地环境、下载依赖,说白了就是想通过傻瓜式的方式使用本系统。
那么,本人也为有这类需求的读者或企业提供了最省时省力的使用方式,详情请点击如下链接访问,查看具体使用教程:
懒人教程请点击:
-> https://my.oschina.net/yaukie/blog/4993603
本平台采用前后端分离,前后端都支持docker 远程镜像部署、拉取,支持云部署,读者可根据需要拉取镜像,完成本地化部署
- Smart Kettle 前端
前端镜像地址为:registry.cn-qingdao.aliyuncs.com/yaukie/kettle-admin:2021.4
--- 1. 登录服务器,执行如下docker命令,拉取Smart Kettle镜像,
docker pull registry.cn-qingdao.aliyuncs.com/yaukie/kettle-admin:2021.4
出现上图的images,说明镜像拉取成功了
--- 2. 启动镜像文件
执行 docker images 命令,拿到对应的镜像ID
然后执行如下命令,
docker run --name test-kettle-admin -p 80:80 -d d84b07291e84
执行上述命令之后,在系统上再执行 docker ps ,查看已经启动的容器信息
出现上述的信息表示,系统启动成功!
然后直接在浏览器中,输入http://ip/test-kettle-admin 访问即可,如下图所示:
Smart Kettle 目前尚未完全实现Kettle web 端的编排,因此使用此系统还需要借助Kettle 客户端完成复杂作业及转换
的设计、测试,但提供了友好、优美、简洁的前端监控能力,kettle 组件的web端流程编排是以后本系统前进的方向,努力
实现的终极目标,也期待读者能持续关注升级、更新。
注意:模块不依赖于框架,可以独立使用。
当前该调度监控平台于2021年初正式上线,截止最新统计时间为止,Smart Kettle已接入的公司包括不限于:
- 1、xx软件股份有限公司 http://xx.com.cn
- 2、北京浪潮天元集团 https://lcjtgs.dyq.cn/
- 3、南京竹石信息科技有限公司 http://www.mymedunion.com/
更多接入的公司,欢迎在 登记地址 登记,登记仅仅为了产品推广。
开源不易,感谢捐赠
No matter how much the donation amount is enough to express your thought, thank you very much :)
To donate
无论捐赠金额多少都足够表达您这份心意,非常感谢 :)
前往捐赠
@Author: yuenbin
屌丝一枚,码农搬运工,正努力成为互联网行业的土豪,多多益善,来者不拒!
佛祖保佑捐赠这些人写程序永无bug,工资翻倍,迎娶白富美,走上人生巅峰!
此处可能存在不合适展示的内容,页面不予展示。您可通过相关编辑功能自查并修改。
如您确认内容无涉及 不当用语 / 纯广告导流 / 暴力 / 低俗色情 / 侵权 / 盗版 / 虚假 / 无价值内容或违法国家有关法律法规的内容,可点击提交进行申诉,我们将尽快为您处理。