PaddlePaddle 3.2.2 发布


PaddlePaddle 3.2.2 正式上线,本次版本围绕分布式并行能力、算子实现机制以及硬件兼容性三大方向进行了多项关键优化与功能增强,显著提升了框架的整体运行效率与系统可靠性。
1. 分布式训练能力升级
- 重构 FlexCheckpoint 的重切分通信逻辑,提升检查点保存与恢复效率;为
paddle.nn.Layer类新增full方法,支持便捷获取模型全部参数;增强对 HuggingFace 标准 Checkpoint 格式的原生加载支持。(#76249, #76291) - 在
group_sharded_optimizer_stage2优化器中新增sharded_state_dict接口,便于分片状态的灵活管理与序列化。#76311 - 修复
paddle.load加载 safetensors 文件时device_id参数失效及潜在 core dump 问题。#76317 - 引入
PipelineDatasetPreprocessor预处理机制,有效规避流水线并行场景下的内存泄漏风险。#76260
2. 算子机制优化
- 解决
to_tensor在 BFloat16 类型列表输入场景下存在的精度偏差问题,保障低精度计算一致性。#76242
3. 硬件适配增强
- 同步更新独立 XPU 内存监控模块,使其与最新内存管理策略保持兼容与一致。#76056
更新详情请参阅:https://www.php.cn/link/d72c5c85c6c5a1da806d45e917a714ee
源码获取地址:点击下载
网友留言(0 条)