用 10% GPU 跑通万亿参数 RL!马骁腾拆解万亿参数大模型的后训练实战
左手是提示词的工程化约束,右手是 Context Learning 的自我进化。
扫描二维码添加微信
微信号:18103268866
扫描二维码添加QQ
QQ号:3525642302
请使用微信扫描二维码查看当前页面
左手是提示词的工程化约束,右手是 Context Learning 的自我进化。