News

我在使用Megatron-Swift训练以下模型的时候,对应的模型以及版本号和显存占用 Swift性能测试对比表 Swift版本 模型 上下文长度 并行配置 单卡显存占用 Tensor Core利用率 Swift3.6.0.dev0 Qwen3-14B-Base 16K TP2 85% 73% Swift3.6.0.dev0 Qwen2.5-32B-Base 32K TP8 56% 58% ...
Contribute to supcon-international/25-AdventureX-SUPCON-Hackathon development by creating an account on GitHub.