阿里AI的可行性:代价、逻辑与临界点
关于阿里巴巴AI战略的市场评价正在陷入两极分化的困境。一方以财务数据为据——2026财年自由现金流净流出466亿元、经调整EBITA同比暴跌84%、第四季度经营亏损8.48亿元——得出“烧钱无度、方向不明”的结论。另一方则以增长指标为凭——云收入同比增长40%、AI产品收入占比突破30%、MaaS平台Token收入五个月增长15倍——宣称“战略已进入兑现期”。两种叙事各有依据但都未能完整回答一个核心问题阿里AI战略在理论上是否可行若可行其可行性的边界与临界点在哪里一、全栈布局的结构性逻辑理解阿里AI战略的起点不是财务指标而是对AI行业竞争趋势的判断。大模型的能力差距正在快速收窄。通义Qwen3.7-Max在GPQA Diamond等评测中超越所有国产模型Qwen3.6-Plus在SWE-bench真实编程任务中以58.7%的通过率击败GPT-4o的56.2%40亿参数的Qwen3.5-4B在WildChat测试中以499胜、431负击败参数大50倍的GPT-4o。这些数据指向一个事实参数竞赛阶段正在结束模型能力的商品化正在加速。商品化的直接后果是定价权的转移。当A、B、C三家模型能力相差无几时客户将选择价格最低或生态最便利的供应商。在这种格局下单纯依赖模型调用收入的企业将面临利润率的持续压缩。全栈布局——自研芯片控制推理成本、自研模型保留差异化空间、MaaS平台锁定企业工作流、C端应用获取用户反馈——本质上是对商品化趋势的结构性对冲。这一逻辑在成本端已有初步验证。平头哥的倚天、含光芯片虽未达到英伟达的绝对性能但在推理场景中通过软硬协同优化单位Token成本已降至采购外部方案的约60%。当Token日调用量达到百亿级别时这一成本优势将转化为可观的毛利率差。阿里云MaaS业务的Token收入在五个月内增长15倍正是规模效应开始显现的信号。二、组织动荡的实质从实验室到工厂2026年初通义千问技术负责人林俊旸携核心团队离职被广泛解读为“阿里AI人心涣散”的证据。但这一事件的实质是阿里AI从“学术导向”向“工程导向”转型的必然摩擦。林俊旸倾向保持预训练、后训练、基础设施垂直整合的团队结构以追求迭代效率。管理层则希望拆分为专业化分工的独立团队以匹配产品化、规模化的交付节奏。这不是谁对谁错的问题而是AI研发从探索期进入工程期后的典型路径分歧。吴泳铭随后推动的ATH(Alibaba Token Hub)事业群整合以及周靖人(首席AI架构师)、李飞飞(阿里云CTO)、吴泽明(集团技术委员会)构成的“三位一体”架构实质上是将AI从一个“研究项目”升级为“业务系统”。决策权高度集中的代价是抑制了多元化探索但收益是资源的统一调配和执行节奏的可控。组织动荡是否已经结束未必。但将林俊旸离职简单等同于战略失败忽略了转型期人才流动的常态性。更值得关注的问题是新架构能否在保持执行效率的同时留住足够多的技术骨干。这需要时间验证。三、市场估值的悖论折扣与押注并存资本市场的态度同样呈现内在矛盾。一方面阿里估值明显承压。2026年4月阿里美股滚动PE在22-26倍区间低于亚马逊的约33倍。从年初高点到3月底阿里回撤32%-35%跑输纳斯达克和恒生科技指数。摩根士丹利、高盛等机构在AI主题下更倾向于将仓位向腾讯和字节倾斜。另一方面摩根大通在将阿里目标价小幅下调的同时重申“增持”评级并明确指出市场对阿里的估值“仅反映其国内电商业务的价值而阿里云及即时零售平台在估值中均被完全忽略”。花旗预测阿里云AI相关收入将以90%的年复合增长率增至2031年的5855亿元。这一估值困境的根源是时间维度的错配。短期利润表展示的是AI投入的当期成本长期估值模型依赖的是AI资产的未来收益。当两套评价体系同时作用于同一家公司时得出的结论必然是分裂的。关键在于未来收益折现到当下的价值是否足以覆盖当前的现金流消耗四、场景错位的合理性追问批评者最常提出的质疑是阿里拥有全球最大的电商场景为何将AI资源大量投向通用助手App(千问)而非聚焦电商AI这一质疑有道理但需要进一步拆解。千问App月活1.66亿仅次于豆包是用数十亿推广费换来的。通用助手赛道的用户迁移成本极低留存率普遍不理想。从投入产出比看这确实不如将同等资源用于电商搜索推荐、客服自动化、供应链预测等确定性场景。但阿里内部可能存在另一种逻辑通用模型的泛化能力是电商AI的基础。一个只在电商数据上训练的模型很难处理跨领域的复杂指令而一个在通用场景中打磨过的模型在下放到电商场景时往往表现更好。此外C端App的用户交互数据对模型迭代具有不可替代的价值——真实用户的对话数据远比实验室标注数据丰富。这种“以通用带垂直”的策略是否存在更好的平衡点答案是肯定的。问题不在于阿里选择了通用助手而在于通用助手的投入比重是否过高。从现有信息看阿里并未披露电商AI的专项投入规模。如果电商AI实际上获得更多资源而通用助手只是“面子工程”那么批评的靶子可能并不存在。反之如果资源确实过度向通用助手倾斜那就是战略层面的错误配置。五、三个临界点阿里AI战略的可行性最终取决于三个临界点能否安全跨越。第一模型商品化的速度。如果未来两到三年内顶尖模型能力的差距进一步缩小推理价格降至当前水平的十分之一甚至更低那么全栈布局的成本优势将被稀释。届时阿里必须依靠规模——而非技术溢价——来维持利润。规模本身是阿里云的强项但需要足够的时间来积累客户和调用量。第二电商基本盘的韧性。阿里2025财年淘天集团收入增速已降至个位数拼多多、抖音、快手的挤压仍在持续。核心业务产生的现金流是AI投入的财务基础。如果电商业务增速进一步放缓甚至下滑AI的资本开支将难以为继。这是阿里AI最脆弱的一环——腾讯有微信这个稳定的现金流引擎阿里有电商但面临激烈竞争。第三组织整合的执行力。ATH事业群的集权模式效率高但容错率低。吴泳铭一人承担战略决策与执行落地的双重责任短期内可以快速推进但中长期需要建立制度化的决策和纠错机制。如果关键决策出现偏差缺乏有效的内部反馈和修正渠道损失将是系统性的。六、可行但有严苛前提阿里AI战略不是无头苍蝇式的盲目乱撞。全栈布局有其清晰的理论基础——对模型商品化趋势的结构性对冲。组织重构有其内在逻辑——从学术探索向工程交付的转型。市场估值的分歧反映了时间维度的真实错配而非单纯的偏见。但这套战略的可行性建立在三个严苛的前提之上模型商品化速度不至于快过自研芯片的成本下降速度电商基本盘在拼多多、抖音的挤压下仍能保持正现金流组织集权模式在执行中不出现重大偏差。这三个前提的任何一个被打破整个战略都将面临重估。阿里不是在做一个低风险的确定性投资而是在进行一次高风险的、有理论支撑的战略押注。批评者低估了其中的逻辑支持者低估了其中的风险。两者的交汇点才是对阿里AI战略最接近真实的判断。