从 WorkflowTemplate 到执行监控,SAP AI Core 的 ML Operations 实战参考
我最近在看 SAP AI Core 的 ML Operations 这一层时,有一个很强的感觉,传统 SAP 项目里熟悉的那套生命周期管理思路,又在 AI 场景里换了一种形态出现了。以前我们谈 ABAP 程序、RAP BO、CDS View、OData Service,会自然想到开发对象、传输、激活、权限、运行日志、性能跟踪、错误排查。到了 SAP AI Core 里,名字变成了 Scenario、Executable、Configuration、Execution、Artifact、Metric、Schedule,但思路没有断,仍然是把一段业务能力从设计态推到运行态,再从运行态反馈到下一轮优化。在 S/4HANA 项目中,AI 很容易被讲成一个很大的概念,尤其是放到 PPT 里时,模型、向量、Embedding、LLM、Fine-tuning、RAG 全部挤在一起,看起来热闹,落地时却经常没有抓手。ML Operations 的价值就在这里,它不是讨论模型本身有多聪明,而是把模型训练、批量推理、数据集管理、结果沉淀、指标对比、定时重训这些脏活累活收进一个可管理的框架里。对于习惯 SAP 工程化方法的人来说,这层能力很重要,因为企业系统最怕的不是单次 Demo 跑不起来,而是上线之后没人知道模型从哪来、用的哪版数据、参数怎么设、训练失败在哪里、下一次重训会不会覆盖掉关键产物。SAP AI Core 里的 ML Operations 到底管什么SAP AI Core 的训练流程基于 Argo Workflows。Argo Workflows 是 Kubernetes 原生的工作流引擎,适合把预处理、训练、评估、批量推理这些步骤拆成