同步操作将从 data_harness_cloud/data_harness-数据中台 强制同步,此操作会覆盖自 Fork 仓库以来所做的任何修改,且无法恢复!!!
确定后同步将在后台操作,完成时将刷新页面,请耐心等待。
👋 加入我们 [即将到来]
当前团队在集中开发大模型开发平台,接下来将打通数据中台和大模型开发训练,实现数据治理、利用与大模型无缝连接,项目更新频率会降低,进行集中更新,项目依旧在持续维护。
“驭数轻云数据平台”(以下简称驭数平台)是驭数团队开源的数据平台,平台致力于为中小企业提供易用、低门槛基于大模型打造的数据平台,助力企业便捷、低成本的实现“掌控数据、轻盈如云”的愿景。驭数平台短期目标致力于满足企业的基础数据梳理、数据治理、数据中台等数据功能,远景目标是基于大模型为广大企业提供开源可用的Data Fabric实现平台。
开发团队是一群热爱开源的小伙伴,各自在多年的工作以及项目实践中发现,很多企业想建设企业自己的数据平台的时候往往找不到一款趁手工具。而且商业平台的价格昂贵,实施成本高,基本不可能进行二次开发。往往企业可能需要的功能只是其中的一点,但是不得不面对大集群、多功能的捆绑购买。团队经过一段时间的准备,为企业、个人在数据的应用以及数据平台建设,提供多一种选择。同时随着大模型的发展,团队将深入思考大模型在数据领域的应用,以及在数据领域的各个环节如何与大模型结合,并且这些成果将会同步更新在开源平台。
平台的开发刚起步,还有非常多的问题,希望社区的小伙伴多一些包容,也欢迎更多的小伙伴能够加入到团队一起共建。
因集成了AI服务,有限的算力需要不断的用于训练模型,暂时需要申请体验,用户名与密码请联系开发团队,后期算力改善后将完全开放体验。
驭数平台由如下特性:
驭数开源数据平台旨在与开源社区一起推动大模型与数据技术发展,恳请开发者和大家遵守开源协议,勿将开源模型和代码及基于开源项目产生的衍生物用于任何可能给国家和社会带来危害的用途以及用于任何未经过安全评估的服务。
由于会提供模型,尽管模型在训练的各个阶段都尽力确保数据的合规性和准确性,但由于模型规模较小,且模型受概率随机性因素影响,无法保证输出内容的准确。同时模型的输出容易被用户的输入误导。本项目不承担开源模型和代码导致的数据安全、舆情风险或发生任何模型被误导、滥用、传播、不当利用而产生的风险和责任。
模块 | Doris/MySQL | Hadoop体系 |
---|---|---|
系统管理模块 | 完成 | 待计划 |
数据资源模块 | 完成 | 待计划 |
数据蓝图模块 | 完成 | 待计划 |
数据开发模块 | 完成 | 待计划 |
数据发现模块 | 开发中 | 待计划 |
数据服务模块 | 开发中 | 待计划 |
数据工厂模块 | 开发中 | 待计划 |
数据可视模块 | 计划->开发中 | 待计划 |
数据运营模块 | 计划 | 待计划 |
AI大模型探索模块 | 开发中 | 待计划 |
模块 | Doris/MySQL | Hadoop体系 |
---|---|---|
系统管理模块 | 开发中 | 待计划 |
数据资源模块 | 开发中 | 待计划 |
数据蓝图模块 | 计划 | 待计划 |
数据开发模块 | 计划 | 待计划 |
数据发现模块 | 计划 | 待计划 |
数据服务模块 | 计划 | 待计划 |
数据工厂模块 | 计划 | 待计划 |
数据可视模块 | 计划 | 待计划 |
数据运营模块 | 计划 | 待计划 |
AI大模型探索模块 | 计划 | 待计划 |
项目登录页
目录边栏
AI大模型对话
AI大模型对话示例
数据规划
模型概览和设计
新建模型
数据开发
数据传输
任务调度列表
模块 | 组件 | 版本 | 计划 |
---|---|---|---|
前端 | vue | 3.x | TS |
后端 | Springboot | 2.x | 3.x |
架构 | 单体 | -- | 微服务 |
部署 | Docker | -- | K8S |
数据传输 | Seatunnel | 2.x | flink |
任务调度 | Quartz | -- | DolphinSchedule |
存算引擎 | Doris/MySQl | -- | Hadoop |
LLM大模型 | 开源模型/商用模型 | -- | 微调数据行业模型 |
此处可能存在不合适展示的内容,页面不予展示。您可通过相关编辑功能自查并修改。
如您确认内容无涉及 不当用语 / 纯广告导流 / 暴力 / 低俗色情 / 侵权 / 盗版 / 虚假 / 无价值内容或违法国家有关法律法规的内容,可点击提交进行申诉,我们将尽快为您处理。