首页
开源
资讯
活动
开源许可证
软件工程云服务
软件代码质量检测云服务
持续集成与部署云服务
社区个性化内容推荐服务
贡献审阅人推荐服务
群体化学习服务
重睛鸟代码扫描工具
登录
注册
代码拉取完成,页面将自动刷新
Watch
1
Star
0
Fork
866
DONGHAORAN
/
ModelLink
forked from
Ascend
/
ModelLink
Fork 仓库
加载中
取消
确认
确定同步?
同步操作将从
Ascend/ModelLink
强制同步,此操作会覆盖自 Fork 仓库以来所做的任何修改,且无法恢复!!!
确定后同步将在后台操作,完成时将刷新页面,请耐心等待。
同步 Wiki
(当前仓库的 wiki 将会被覆盖!)
取消
确定
代码
Issues
0
Pull Requests
0
Wiki
2
统计
标签
标签名
描述
提交信息
操作
0.1.0
主要支持7个系列大模型预训练,deepspeed系列存在断点续训问题,可通过二进制模式规避
1b775a1
2024-01-08 12:33
下载
1.0.0
支持8个系列大模型,预训练、推理、评估,Megatron(23年11月底版本)插件化重构完成
f33da62
2024-04-16 10:22
下载
1.1.0
功能变更: 1. 新版本--overlap-param-gather参数只支持mcore模型 2. jit-compile参数由环境变量控制转为--jit-compile脚本参数控制,不配置默认为false 3. 环境变量PYTORCH_NPU_ALLOC_CONF=expandable_segments:True使能虚拟内存,不配置默认为关闭虚拟内存 配套变更: 1. MindSpeed配套升级至2b0edd2 commitid 2. Megatron-LM配套升级至core r0.6.0分支 新增模型及特性: 1. 新增支持模型chatglm3、gpt3、codallama、yi、LLaMA3、Qwen1.5、Mistral-7B、gemma、aquila2模型 2. 非共享储存情况下非主节点数据缓存检测和生成 3. VPP权重转换 4. 确定性计算 5. profiling功能 6. 支持mc2,但默认不使能
321c3f0
2024-07-17 08:52
下载
v1.1
支持18个系列大模型,megatron-LM 后端为 core_0.6.0
a58a2b1
2024-06-27 17:43
下载
v1.0
支持8个系列大模型,预训练、推理、评估,Megatron(23年11月底版本)插件化重构完成
f33da62
2024-04-16 10:22
下载
v1.0.0
支持8个系列大模型,预训练、推理、评估,Megatron(23年11月底版本)插件化重构完成
f33da62
2024-04-16 10:22
下载
v0.1.0
主要支持7个系列大模型预训练,deepspeed系列存在断点续训问题,可通过二进制模式规避
1b775a1
2024-01-08 12:33
下载
下载
请输入验证码,防止盗链导致资源被占用
取消
下载