时间序列数据与因果模型1
Flow based approach for Dynamic Temporal Causal models with non-Gaussian or Heteroscedastic Noises这篇NeurIPS 2025论文提出FANTOM是首个能同时处理「多时段非高斯异方差噪声」的时序因果发现框架自动学习时段数量、边界与每个时段独立因果图还给出严格可辨识性证明。一、要解决的核心痛点现实时序金融、脑电、气候有三大难题现有方法全搞不定非平稳数据分多个未知时段每个时段因果结构不一样非高斯噪声不满足正态分布异方差噪声噪声方差随时间/变量变化比如脑电、金融波动现有方法缺陷CD-NOD只能输出汇总图不输出时段专属图CASTOR只能处理高斯噪声RPCMCI要先验知道时段数只支持滞后边DYNOTEARS/PCMCI/Rhino只能单时段、同方差二、核心创新一句话概括用「贝叶斯EM 条件归一化流 时序图神经网络」自动把非平稳时序切成 K 个时段每个时段学一张专属因果DAG同时兼容非高斯/异方差噪声并证明模型可辨识。三、整体框架1. 模型结构输入多元时序 (x_t)隐变量(z_t) → 表示当前属于哪个时段两大模块E步时段分配算每个时间步属于哪个时段的概率M步因果图学习每个时段学自己的DAG与噪声分布2. 关键技术ELBO 贝叶斯EM把对数似然拆成下界交替优化时段分配与因果结构条件归一化流CNF拟合任意复杂噪声非高斯/异方差把复杂噪声映射为标准正态时序图神经网络TGNN同时建模瞬时因果和滞后因果自动确定时段数初始化多分几段迭代合并自动收敛到真实K四、理论贡献论文严格证明单时段异方差模型可辨识多时段混合模型可辨识时段数、边界、因果图都能唯一确定假设很轻因果马氏性、平稳性、最小性、充分性无隐混杂这是多时段异方差下第一个完整可辨识理论。五、实验结论1. 合成数据异方差噪声FANTOM 全方位第一SHD最低、F1最高非高斯噪声瞬时边F1≈99%时段识别准确率≈99.4%CASTOR/RPCMCI 在异方差下直接失效2. 真实数据风洞实验时段识别99.9%因果F1 38.5%远超所有基线癫痫EEG无监督识别癫痫/正常时段平均准确率82.7%癫痫时段因果图更密集符合医学认知3. 消融实验必须用CNF才能处理异方差去掉就崩对初始化窗口、最小时段长度不敏感数据标准化不影响效果CASTOR会崩六、优缺点速览✅ 优点同时支持多时段、非高斯、异方差自动找时段数边界每个时段DAG瞬时滞后因果一起学有可辨识性证明真实场景EEG/风洞效果强❌ 局限每个时段需要足够样本初始化窗口太大会丢信息计算比传统方法重七、适用场景金融时序不同市场状态牛/熊/震荡的因果切换脑电/EEG/fMRI正常/癫痫时段因果差异工业/传感器多工况、变噪声场景气候多状态系统的动态因果八、和你上一篇 UnCLe 的对比关键方法核心定位噪声时段因果类型理论UnCLe动态因果逐时间点变不限连续渐变逐时刻图无辨识性证明FANTOM多时段因果分段平稳非高斯/异方差分段突变每段一张图有严格可辨识一句话选法因果连续慢慢变→ 用 UnCLe因果突然跳变、分几段、噪声复杂 → 用 FANTOM