用于文本生成推理的 Rust、Python 和 gRPC 服务器
Exllama 是对 Llama 的 HF 转换器实现进行更高效的内存重写,以用于量化权重
OpenMLDB是一个开源机器学习数据库,面向机器学习应用提供正确、高效数据供给。