ICLR Time Series Papers · 交互式数据分析

ICLR Time Series 相关论文交互式数据分析

页面将 87 篇论文拆解为任务方向、方法标签、应用领域、关键词、作者合作关系和论文详情。可以用搜索与筛选快速定位某类论文，例如 “diffusion + forecasting”、“medical + anomaly”、“LLM + representation”。

全文搜索

主任务

方法/主题标签

作者

总体总结：全量 87 篇论文的研究图景

该板块固定基于全部论文统计，不随搜索或筛选变化。

All papers · 87

综合来看，这批 ICLR time series 论文的主线已经从“单一预测精度竞赛”扩展为“面向真实世界的通用时序建模”：既继续围绕长期预测、多变量依赖和异常检测发力，也系统讨论基础模型适配、生成式概率建模、缺失/不规则采样、分布漂移、校准、解释性、评测协议和边缘部署等问题。

主任务为 Forecasting

44.8%，仍是最大主任务。

涉及鲁棒 / 泛化 / 漂移

约 39.1%，可靠性议题突出。

涉及基础模型 / 预训练

与 LLM、Adapter、微调和压缩共同出现。

独特问题 / 新方法候选

其中高信号 26 篇，中高信号 17 篇。

1. 研究重心：预测仍最大，但问题边界变宽

主任务中 Forecasting 有 39 篇，而标签层面有 53 篇涉及预测。预测论文不再只比较 MAE/MSE，而是把跨变量相关、周期异质性、非平稳、概念漂移、测试时适配、缺失查询和概率校准纳入问题定义。

展开详情预测从“点误差”变成“真实场景建模”

这组预测论文的共同变化是：预测任务本身被重新细分。过去常见设定是给定规则采样的历史窗口，直接预测未来值；现在的论文更关心变量之间是否相关、周期是否一致、测试分布是否变化、输出是否可校准、缺失和异步是否会破坏模型，以及预测结果能否被解释或在部署端运行。

跨变量与结构关系从通道独立转向显式建模变量相关、图结构、局部跨变量交互，减少“各变量各预测”的信息损失。

非平稳与测试时适配把概念漂移、输出分布偏移和实时监控中的变化纳入训练/推理流程，而不是只在固定 benchmark 上比较误差。

概率与可靠性从点预测扩展到边缘分布、联合分布、置信区间和一致性约束，强调预测是否可信。

部署与效率在保证预测能力的同时降低参数量、推理成本和硬件需求，让模型能进入边缘设备或在线系统。

代表论文：它们分别把预测问题边界推向不同方向

#1 MixLinear: Extreme Low Resource Multivariate Time Series Forecasting with $0.1K$ Parameters

Forecasting · Transformer/Mamba/Attention · Linear/Convolutional · 3 位作者

极低资源预测：把“长期预测是否一定需要大模型”变成核心问题。

问题长期多变量预测需要同时捕捉复杂时间依赖与趋势变化，但 Transformer 等高精度模型参数量和计算开销较大，不适合部署在硬件受限设备上。

方法提出 MixLinear，在时域用正交分段趋势提取分离段内/段间相关性，在频域用自适应低秩谱滤波压缩全局趋势，把线性模型参数规模从 O(n²) 降到 O(n)。
#2 CoRA: Boosting Time Series Foundation Models for Multivariate Forecasting through Correlation-aware Adapter

Forecasting · Foundation/Pre-trained Models · Linear/Convolutional · Federated/Data/Optimization · 7 位作者

基础模型适配：补足 TSFM 忽略通道相关的短板。

问题现有时间序列基础模型多采用通道独立建模，偏重时间依赖泛化，却忽略多变量预测中不同类型的通道相关性。

方法提出轻量可插拔的 CoRA 相关性感知适配器，将相关矩阵分解为低秩的时变与时不变部分，用可学习多项式建模动态相关，并用异质-局部双对比学习识别正/负相关。
#3 PHAT: Modeling Period Heterogeneity for Multivariate Time Series Forecasting

Forecasting · Transformer/Mamba/Attention · 10 位作者

周期异质性：处理不同变量周期不一致且动态变化的真实情况。

问题真实多变量序列中不同变量往往具有不同且会变化的周期，已有模型虽能建模周期性，却容易忽略这种“周期异质性”。

方法提出 PHAT，把输入组织为周期桶张量，按相近周期、相位对齐和周期内偏移限制交互；再用正负注意力从周期对齐与偏离两方面建模周期依赖，并注入周期先验。
#4 Reliable Probabilistic Forecasting of Irregular Time Series through Marginalization-Consistent Flows

Forecasting · Diffusion/Flow/Generative · Probabilistic/Uncertainty · Irregular/Missing/Asynchronous · 6 位作者

不规则/缺失场景：把概率查询的一致性作为预测质量标准。

问题不规则、缺失时间序列的联合概率预测尚不充分，现有 normalizing flow 方法表达力强但缺少边际化一致性，导致子集变量的边际预测不可靠。

方法提出 MOSES，用可分离流的混合来参数化随机过程：每个分量结合潜在多元高斯与单变量可逆变换，使模型可以解析边际化，从而支持可靠的边际和联合概率查询。
#8 COSA: Context-aware Output-Space Adapter for Test-Time Adaptation in Time Series Forecasting

Forecasting · Linear/Convolutional · Robustness/Generalization/Shift · 2 位作者

测试时适配：关注部署后输出空间和上下文变化。

问题部署后的预测模型在非平稳和分布漂移下性能下降，而现有测试时适应方法常通过输入/输出双适配器间接改动分布，难以分析且不够简洁。

方法提出 COSA 输出空间适配器，在冻结基模型后直接对预测残差进行门控校正；利用近期已观测真实值构造轻量上下文向量，只在测试时更新线性层和门控参数。
#13 ResCP: Reservoir Conformal Prediction for Time Series Forecasting

Forecasting · Probabilistic/Uncertainty · Representation/Self-supervised · 4 位作者

置信区间：用 conformal prediction 给预测不确定性提供覆盖保证。

问题序列数据上的 conformal prediction 往往需要复杂模型捕捉时间依赖，小样本下易失败，分布变化时还需要昂贵重训。

方法提出训练免费的 ResCP，用 reservoir computing 表示当前状态，根据 reservoir state 相似度动态重加权历史残差/非一致性分数，从而在保持可扩展性的同时适配局部时间动态。
#26 Towards Robust Real-World Multivariate Time Series Forecasting: A Unified Framework for Dependency, Asynchrony, and Missingness

Forecasting · Transformer/Mamba/Attention · Irregular/Missing/Asynchronous · Robustness/Generalization/Shift · 4 位作者

真实世界统一设定：同时处理依赖、异步和缺失。

问题真实多变量序列常同时存在复杂通道依赖、通道异步采样和缺失值，现有模型通常只处理其中一部分或做简化假设。

方法提出 ChannelTokenFormer，用灵活的 Transformer 通道 token 架构显式建模跨通道交互，同时适配通道级异步采样和测试时缺失块，提升真实条件下鲁棒性。
#37 Tackling Time-Series Forecasting Generalization via Mitigating Concept Drift

Forecasting · Transformer/Mamba/Attention · Robustness/Generalization/Shift · 3 位作者

概念漂移：把泛化失败归因到时间序列中分布随时间变化。

问题时间序列泛化受分布漂移影响，已有工作更多关注 temporal shift，而 concept drift 在预测中的处理不足。

方法提出 ShifTS，先缓解 temporal shift，再在统一框架中处理 concept drift；通过软注意力从 lookback 与 horizon 序列中提取不变模式，作为模型无关增强。

2. 方法谱系：大模型化与轻量化并行

一条路线是 Foundation / LLM / 多模态化：预训练模型、语言模型提示、视觉-时序对齐和科学时间序列理解持续增加。另一条路线是面向落地的轻量化：低秩、线性/卷积、Adapter、检索增强、蒸馏、压缩和边缘推理，说明“更大模型”和“更可部署模型”同时是热点。

展开详情不是单纯变大，而是“底座 + 适配 + 压缩”并行

这一板块最明显的趋势是方法路线分叉：一边把时间序列接入基础模型、LLM、多模态模型和科学理解任务；另一边强调如何少调参、少参数、快速选择、低秩压缩和边缘部署。两条路线并不冲突：大模型提供通用表征和跨任务能力，轻量化/适配技术决定这些能力能否在具体时序任务中落地。

基础模型 / LLM / 多模态化把数值序列与文本、图像、科学任务、临床记录和金融推理连接起来，重点是通用理解、跨域迁移和复杂推理。

Adapter / 选择 / 微调不从零训练，而是在已有 TSFM 上做协变量适配、相关性适配、模型组合选择或稳定微调。

低秩 / 小模型 / 压缩用低秩结构、线性模型、小型预训练模型和可压缩性分析，在有限资源下保持性能。

数据与训练范式联邦数据集学习、数据质量评分、自动增强和 domain-shared transformation 让训练数据本身成为方法的一部分。

代表论文：大模型化与轻量化两条路线

#57 UniCA: Unified Covariate Adaptation for Time Series Foundation Model

Foundation Models · Forecasting · Foundation/Pre-trained Models · Multimodal · 12 位作者

异质协变量适配：让 TSFM 处理类别、文本、图像等非数值辅助信息。

问题现有 TSFM 主要面向实值序列，难以处理包含类别变量、文本、图像等异质协变量的通用 covariate-aware forecasting。

方法提出 UniCA，先把异质协变量通过 covariate homogenization 转换为高级同质序列表征，再用统一 attention fusion 与 TSFM 表征融合，在保留泛化能力的同时利用额外协变量。
#58 TimeOmni-1: Incentivizing Complex Reasoning with Time Series in Large Language Models

LLM/Text Reasoning · Forecasting · LLM/Text/Language · Multimodal · 10 位作者

时序复杂推理：把任务从预测扩展到感知、外推、因果和决策。

问题现有多模态时间序列数据集多停留在浅层对齐或问答，缺少真正要求感知、外推和决策的复杂时间序列推理任务与高质量数据。

方法提出 TSR-Suite，定义场景理解、因果发现、事件感知预测和决策等原子任务，并构建 23K+ 样本；进一步训练 TimeOmni-1，通过多阶段任务混合、奖励函数和优化策略提升时序推理。
#62 SciTS: Scientific Time Series Understanding and Generation with LLMs

LLM/Text Reasoning · Forecasting · LLM/Text/Language · Multimodal · 15 位作者

科学时间序列：用 benchmark 评估 LLM/多模态模型对科学序列的理解与生成。

问题科学时间序列具有非周期、异质、高频和超长等特性，现有多模态 LLM 把数值序列转文本或图像会造成序列过长或精度损失，缺少系统 benchmark。

方法提出 SciTS，覆盖 12 个科学领域、43 个任务和 50K+ 实例，评测 text-only LLM、多模态 LLM 和统一时间序列模型；并给出 TimeOmni 作为扩展 LLM 处理科学时序的示例框架。
#20 Aurora: Towards Universal Generative Multimodal Time Series Forecasting

Forecasting · Foundation/Pre-trained Models · Multimodal · Diffusion/Flow/Generative · 7 位作者

通用生成式多模态预测：把多模态输入纳入统一预测框架。

问题跨领域预测中，相似历史模式可能因领域知识不同而产生不同未来；单模态 TSFM 缺少文本/图像领域知识，端到端多模态模型又不支持跨域零样本。

方法提出 Aurora 多模态时间序列基础模型，在跨域多模态语料上预训练，通过 tokenization、encoding、distillation 提取领域知识，用 modality-guided attention 注入时间表示，并用 prototype-guided flow matching 做生成式概率预测。
#70 TSPulse: Tiny Pre-Trained Models with Disentangled Representations for Rapid Time-Series Analysis

Representation/Data Processing · Classification · Anomaly/Event Detection · Foundation/Pre-trained Models · 8 位作者

小型预训练模型：用 1M 级模型与解耦表征追求快速分析。

问题现有预训练时间序列模型把时间/频率、局部/全局等异质信号混在单一大 embedding 中，限制迁移和零样本使用。

方法提出 TSPulse，使用约 1M 参数的超轻预训练模型族，通过 masked reconstruction 与显式解耦学习 temporal、spectral、semantic 三种视图，并用轻量 post-hoc fuser 按任务选择性融合。
#1 MixLinear: Extreme Low Resource Multivariate Time Series Forecasting with $0.1K$ Parameters

Forecasting · Transformer/Mamba/Attention · Linear/Convolutional · 3 位作者

极低参数预测：以 0.1K 参数挑战高精度预测模型。

问题长期多变量预测需要同时捕捉复杂时间依赖与趋势变化，但 Transformer 等高精度模型参数量和计算开销较大，不适合部署在硬件受限设备上。

方法提出 MixLinear，在时域用正交分段趋势提取分离段内/段间相关性，在频域用自适应低秩谱滤波压缩全局趋势，把线性模型参数规模从 O(n²) 降到 O(n)。
#15 Test-Time Efficient Pretrained Model Portfolios for Time Series Forecasting

Forecasting · Foundation/Pre-trained Models · Benchmark/Evaluation/Survey · Federated/Data/Optimization · 7 位作者

预训练模型组合：测试时选择高效 portfolio，而不是固定单一模型。

问题时间序列基础模型是否必须越大越好尚不清楚，单一大型模型在测试时可能成本高、参数多。

方法构建由多个小型预训练预测模型组成的 portfolio，通过集成或模型选择获得竞争性能；研究发现专家模型组合优于普通泛化模型组合，且 post-training 生成专家比测试时微调更省计算。
#74 Understanding Transformers for Time Series: Rank Structure, Flow-of-ranks, and Compressibility

General Modeling Analysis · Foundation/Pre-trained Models · Transformer/Mamba/Attention · Linear/Convolutional · 10 位作者

Transformer 可压缩性：从 rank structure 解释并压缩时间序列 Transformer。

问题文本/视觉中总结的 Transformer 经验不能直接套到时间序列，时间序列 embedding 的低秩谱结构、层间 rank 变化和可压缩性尚不清晰。

方法从 rank structure 角度分析时间序列 Transformer，提出 flow-of-ranks 解释深层非线性混合如何提升 rank，并据此对 Chronos 做低秩压缩，在几乎不损失精度下显著降低推理时间和内存。
#86 Lost in the Non-convex Loss Landscape: How to Fine-tune the Large Time Series Model?

Foundation Models · Foundation/Pre-trained Models · LLM/Text/Language · Transformer/Mamba/Attention · 3 位作者

大模型微调：通过损失景观平滑改善 LTSM 全量微调。

问题大时间序列模型直接微调时损失景观病态且非凸，容易过拟合或落入差的局部区域，甚至不如从头训练。

方法提出 SFF 平滑全量微调：随机初始化一个辅助 LTSM，并与预训练模型权重线性插值以平滑原损失景观，在保留预训练知识的同时扰动尖锐极小值、提升可训练性。

3. 可靠性：从干净 benchmark 走向真实数据

40 篇涉及评测/基准，34 篇涉及鲁棒与分布变化，14 篇涉及缺失/不规则/异步数据。这表明研究关注点正在从“模型能否在标准数据集上更准”转向“模型是否能在真实噪声、缺失、漂移和不同部署条件下稳定工作”。

展开详情可靠性议题覆盖数据、模型、评估和部署

可靠性不只是鲁棒训练一个子方向，而是贯穿任务设定：数据可能不规则、异步、缺失、污染；模型可能过度泛化或被归一化抹掉异常；基础模型可能准确但概率不校准；因果发现方法可能在假设被破坏时失效。因此，这批论文把 benchmark、诊断、校准、conformal 保证、真实污染和异常定位都纳入了可靠性研究。

数据可靠性关注不规则采样、异步、缺失、真实污染、稀疏事件和临床/工业数据中的噪声。

模型可靠性分析 TSFM 是否会过度泛化、是否校准、是否在异常检测中真的优于简单统计基线。

评估可靠性通过新 benchmark、stress test、假设违反和真实 corruptions 检验方法是否只是在干净数据上有效。

部署可靠性在线预测、信号监控和 conformal 框架强调误报、覆盖率、分布漂移和无需微调的部署方式。

代表论文：从不同角度把“可靠性”具体化

#40 PYRREGULAR: A Unified Framework for Irregular Time Series, with Classification Benchmarks

Classification · Irregular/Missing/Asynchronous · Medical/Healthcare/Wearable · Robustness/Generalization/Shift · 2 位作者

不规则时间序列评测：为分类任务提供统一框架和 benchmark。

问题不规则时间序列分类研究分散，数据格式、工具和评测基准不统一，导致方法难以公平比较和复用。

方法提出 PYRREGULAR 统一框架与标准数据仓库，采用通用数组格式整合 34 个不规则时间序列分类数据集，并在其上评测 12 类分类器。
#17 Local Geometry Attention for Time Series Forecasting under Realistic Corruptions

Forecasting · Transformer/Mamba/Attention · Linear/Convolutional · Robustness/Generalization/Shift · 4 位作者

真实污染鲁棒性：处理 realistic corruptions 下的预测稳定性。

问题Transformer 在预测中表现强，但常不能捕捉时间序列的局部几何结构，因而在真实噪声和异常污染下鲁棒性不足。

方法提出 LGA 局部几何注意力，基于局部高斯过程理论学习 query-specific 距离度量以适配数据内在几何；同时提出 TSRBench，用统计上合理的真实污染评估鲁棒预测。
#26 Towards Robust Real-World Multivariate Time Series Forecasting: A Unified Framework for Dependency, Asynchrony, and Missingness

Forecasting · Transformer/Mamba/Attention · Irregular/Missing/Asynchronous · Robustness/Generalization/Shift · 4 位作者

真实多变量设定：统一处理依赖、异步和缺失。

问题真实多变量序列常同时存在复杂通道依赖、通道异步采样和缺失值，现有模型通常只处理其中一部分或做简化假设。

方法提出 ChannelTokenFormer，用灵活的 Transformer 通道 token 架构显式建模跨通道交互，同时适配通道级异步采样和测试时缺失块，提升真实条件下鲁棒性。
#51 Adaptive Conformal Anomaly Detection with Time Series Foundation Models for Signal Monitoring.

Anomaly/Event Detection · Foundation/Pre-trained Models · Probabilistic/Uncertainty · Explainability/XAI · 6 位作者

工业信号监控：用 TSFM + conformal 做无需微调的异常检测。

问题工业信号监测常面临标注/训练数据少、需要快速部署和稳定误报控制，同时分布漂移会破坏固定阈值。

方法提出后处理式自适应 conformal 异常检测，直接利用预训练时间序列基础模型预测，无需微调；用加权分位 conformal bounds 和历史预测自适应学习权重，输出可解释为 p-value 的异常分数。
#52 When Foundation Models are One-Liners: Limitations and Future Directions for Time Series Anomaly Detection

Anomaly/Event Detection · Forecasting · Foundation/Pre-trained Models · Benchmark/Evaluation/Survey · 3 位作者

基础模型诊断：质疑“预测误差可直接做异常检测”的常见假设。

问题时间序列基础模型用于异常检测时常依赖重构/预测误差，但“异常更难重构或预测”的假设可能并不成立。

方法系统评估 MOMENT、Chronos、TimesFM、Time-MoE 和 TSPulse 等五类 TSFM，在不同模型大小和窗口下与 moving-window variance、squared-difference 等一行基线比较，并据此提出未来方向。
#53 Complexity- and Statistics-Guided Anomaly Detection in Time Series Foundation Models

Anomaly/Event Detection · Forecasting · Foundation/Pre-trained Models · Benchmark/Evaluation/Survey · 6 位作者

过度泛化/过度平稳化：诊断 TSFM 异常检测中的结构性失败。

问题TFM 做重构式异常检测会出现 overgeneralization（异常也能被重构）和 overstationarization（归一化移除均值/方差等异常特征）。

方法提出复杂度指标 α 衡量数据对 TFM 的难度，并用 Complexity-Aware Ensemble 自适应组合 TFM 与统计模型；同时在不重训的情况下把均值、方差等统计特征重新引入重构。
#56 Beyond Accuracy: Are Time Series Foundation Models Well-Calibrated?

Foundation Models · Forecasting · Foundation/Pre-trained Models · Probabilistic/Uncertainty · 5 位作者

概率校准：评估 TSFM 是否不只准确、而且可信。

问题时间序列基础模型虽有高预测精度，但其概率校准性质仍少被研究，而校准对实际风险决策很关键。

方法系统评估 5 个近期 TSFM 和 2 个强基线，考察模型过/欠置信、不同 prediction heads 的影响以及长期自回归预测中的校准变化。
#84 TCD-Arena: Assessing Robustness of Time Series Causal Discovery Methods Against Assumption Violations

Causal/Structure Learning · Causal/Counterfactual/Intervention · Robustness/Generalization/Shift · Benchmark/Evaluation/Survey · 4 位作者

因果发现鲁棒性：系统测试假设违反下方法何时失效。

问题时间序列因果发现依赖强且难验证的假设，实际应用中缺乏对假设违反时鲁棒性的系统评估。

方法提出 TCD-Arena，可模块化、可定制地逐步施加 33 类假设违反并评估因果发现算法；通过约 3000 万次实验揭示方法鲁棒性谱系，并研究 CD ensemble 的潜在改进。
#13 ResCP: Reservoir Conformal Prediction for Time Series Forecasting

Forecasting · Probabilistic/Uncertainty · Representation/Self-supervised · 4 位作者

预测覆盖保证：用 reservoir conformal prediction 处理时序预测不确定性。

问题序列数据上的 conformal prediction 往往需要复杂模型捕捉时间依赖，小样本下易失败，分布变化时还需要昂贵重训。

方法提出训练免费的 ResCP，用 reservoir computing 表示当前状态，根据 reservoir state 相似度动态重加权历史残差/非一致性分数，从而在保持可扩展性的同时适配局部时间动态。

4. 生成式与概率建模成为重要支线

Diffusion / Flow / Generative 标签命中 20 篇，Probabilistic / Uncertainty 命中 11 篇。这些工作覆盖概率预测、联合分布、反事实/干预、异常检测、插补、生成、超分辨率和物理约束等任务，代表时间序列从点预测向分布建模和可采样场景扩展。

展开详情从“给一个值”转向“给分布、样本和可控生成”

生成式与概率建模的价值在于：很多时序任务并不存在唯一未来。金融、医疗、交通、气象、神经信号和工业监控都需要多个可能轨迹、置信区间、反事实结果、插补样本或物理一致的生成结果。因此，这一支线把 diffusion、flow matching、normalizing flow、latent diffusion、conformal prediction 和能量/物理约束引入时序建模。

概率预测与校准建模边缘/联合分布，输出置信区间或可采样预测，而不只输出点估计。

可控生成与反事实在干预、条件约束、物理规律或任务目标下生成未来轨迹。

异常/插补/超分辨率用生成模型恢复缺失、识别异常、提升分辨率或生成训练数据。

理论诊断关注 latent diffusion 的 posterior stability、flow 的边缘一致性和时序生成 benchmark 的有效性。

代表论文：生成式与概率路线的不同用途

#4 Reliable Probabilistic Forecasting of Irregular Time Series through Marginalization-Consistent Flows

Forecasting · Diffusion/Flow/Generative · Probabilistic/Uncertainty · Irregular/Missing/Asynchronous · 6 位作者

边缘化一致性：让不规则/缺失时序的概率查询保持一致。

问题不规则、缺失时间序列的联合概率预测尚不充分，现有 normalizing flow 方法表达力强但缺少边际化一致性，导致子集变量的边际预测不可靠。

方法提出 MOSES，用可分离流的混合来参数化随机过程：每个分量结合潜在多元高斯与单变量可逆变换，使模型可以解析边际化，从而支持可靠的边际和联合概率查询。
#6 Conditionally Whitened Generative Models for Probabilistic Time Series Forecasting

Forecasting · Diffusion/Flow/Generative · Probabilistic/Uncertainty · Robustness/Generalization/Shift · 9 位作者

概率预测生成模型：用条件白化改善概率预测分布。

问题多变量概率预测受非平稳性、变量依赖和分布漂移影响，扩散/流匹配模型常忽略条件均值与协方差等有用先验。

方法提出 CW-Gen 条件白化框架，先用 JMCE 同时估计条件均值与滑动窗口协方差，再构建 CW-Diff 和 CW-Flow，把这些先验作为终端分布/白化信息注入生成模型。
#16 MMPD: Diverse Time Series Forecasting via Multi-Mode Patch Diffusion Loss

Forecasting · Diffusion/Flow/Generative · Probabilistic/Uncertainty · 5 位作者

多模态未来：用 multi-mode patch diffusion 产生多样预测。

问题常用 MSE 回归损失隐含单峰高斯假设，难以表达真实场景中多种可能未来和多模态预测分布。

方法提出 MMPD 损失，可接在任意输出未来 latent tokens 的 patch backbone 上；用条件扩散模型建模未来分布，用 Patch Consistent MLP 做去噪，并在推理中用演化的变分 GMM 生成多模式预测及概率。
#21 TEDM: Time Series Forecasting with Elucidated Diffusion Models

Forecasting · Diffusion/Flow/Generative · Linear/Convolutional · Benchmark/Evaluation/Survey · 3 位作者

扩散预测：将 elucidated diffusion model 用于时间序列预测。

问题图像扩散模型的成功尚未充分迁移到时间序列预测，关键障碍是时间序列具有顺序结构且预测采样延迟需受控。

方法提出 TEDM，将 elucidated diffusion 的设计空间显式适配到序列结构，直接从数据估计噪声/信号缩放而非外部 schedule，并把采样复杂度降为随预测 horizon 线性增长。
#25 DoFlow: Flow-based Generative Models for Interventional and Counterfactual Forecasting on Time Series

Forecasting · Anomaly/Event Detection · Diffusion/Flow/Generative · Graph/Spatio-temporal · 3 位作者

干预与反事实：用 flow-based 生成模型回答干预/反事实预测。

问题多变量系统预测不仅需要观察性预测，还需要回答干预和反事实问题，并提供未来轨迹似然用于异常检测。

方法提出 DoFlow，在因果 DAG 上定义 continuous normalizing flow，利用 CNF 的编码-解码机制生成观察、干预与反事实预测，并基于显式 likelihood 进行异常检测。
#28 Flow-based Conformal Prediction for Multi-dimensional Time Series

Forecasting · Diffusion/Flow/Generative · Probabilistic/Uncertainty · Transformer/Mamba/Attention · 3 位作者

多维 conformal：结合 flow 与 conformal prediction 处理多维覆盖。

问题时间序列 conformal prediction 需要处理观测和非一致性分数相关性，同时还要构造多维输出预测集。

方法提出基于 flow 与 classifier-free guidance 的 conformal prediction 方法，给出非渐近边际覆盖和有限样本条件覆盖界，在保持目标覆盖的同时生成更小的多维预测集。
#48 ICDiffAD: Implicit Conditioning Diffusion Model for Time Series Anomaly Detection

Anomaly/Event Detection · Diffusion/Flow/Generative · Robustness/Generalization/Shift · Benchmark/Evaluation/Survey · 4 位作者

异常检测：用隐式条件扩散建模异常场景。

问题时间序列异常检测受噪声和时间异质性影响，生成式重构方法难以保持高保真；扩散模型的随机性又会带来不可消除的重构方差。

方法提出 ICDiffAD，通过 SNR Scheduler 控制可量化噪声尺度学习正常模式，并用 SNR implicit conditioning 从部分污染输入初始化反向扩散，在保留信号一致性的同时削弱异常成分。
#63 CTBench: Cryptocurrency Time Series Generation Benchmark

Generation · Forecasting · Classification · Diffusion/Flow/Generative · 8 位作者

生成 benchmark：面向加密货币序列，用交易效用评估生成质量。

问题加密货币市场 24/7 交易、波动剧烈且 regime shift 快，现有时间序列生成 benchmark 缺少 crypto 特性和交易导向评估。

方法提出 CTBench，整理 452 个 token 数据并用 13 个指标评价生成模型；核心采用双任务评估：Predictive Utility 衡量合成数据对预测的保真，Statistical Arbitrage 衡量对均值回归交易信号的支持。
#75 SRT: Super-Resolution for Time Series via Disentangled Rectified Flow

Representation/Data Processing · Diffusion/Flow/Generative · Transformer/Mamba/Attention · Representation/Self-supervised · 3 位作者

时序超分辨率：用 disentangled rectified flow 生成高分辨率序列。

问题高时间分辨率数据对分析很重要，但采集常受成本和可行性限制；图像超分方法不能直接迁移到时间序列。

方法提出 SRT，用 disentangled rectified flow 从低分辨率输入恢复高分辨率信号：先分解趋势和季节项，用 implicit neural representation 对齐目标分辨率，再用 cross-resolution attention 生成细节；SRT-large 通过预训练支持零样本超分。
#76 PINFDiT: Energy-Based Physics-Informed Diffusion Transformers for General-purpose Time Series Tasks

Dynamics/Physics-informed · Forecasting · Foundation/Pre-trained Models · Diffusion/Flow/Generative · 5 位作者

物理约束生成：在推理阶段注入 model-free 物理引导。

问题科学时间序列常样本少、物理动态复杂、观测缺失、多分辨率采样，并要求生成结果满足物理一致性。

方法提出 PINFDiT，使用 diffusion transformer 捕捉时间依赖并通过综合 masking 处理不完美数据；推理时加入 model-free physics-guided Langevin correction，在不改架构/不重训下平衡分布保真和物理约束。
#77 A Study of Posterior Stability in Time-Series Latent Diffusion

General Modeling Analysis · Diffusion/Flow/Generative · Representation/Self-supervised · Benchmark/Evaluation/Survey · 3 位作者

latent diffusion 诊断：研究时序 latent diffusion 的 posterior stability。

问题latent diffusion 用于时间序列可能出现 posterior collapse，使潜变量影响随时间快速衰减并退化为较弱的 VAE 式生成。

方法先用 dependency measures 量化 recurrent decoder 对输入变量的敏感性以诊断 collapse，再提出 posterior-stable latent diffusion，把扩散过程解释为变分推断，去除风险 KL 正则并惩罚 decoder insensitivity。

高频方法/主题信号

Forecasting53 篇 · 60.9%预测与序列建模仍是主轴Benchmark/Evaluation/Survey40 篇 · 46.0%评测协议与基准意识增强Robustness/Generalization/Shift34 篇 · 39.1%真实分布漂移、污染与泛化Transformer/Mamba/Attention32 篇 · 36.8%序列架构仍活跃Representation/Self-supervised29 篇 · 33.3%表征学习和自监督成为底座Multivariate/Cross-variable26 篇 · 29.9%多变量、通道和跨变量依赖Foundation/Pre-trained Models25 篇 · 28.7%预训练/基础模型外溢Diffusion/Flow/Generative20 篇 · 23.0%生成式与概率建模升温Medical/Healthcare/Wearable12 篇 · 13.8%高风险应用场景集中

共性热门问题 Top 6

生成式建模：Diffusion / Flow / Flow Matching16 篇
基础模型的适配、选择、微调与压缩15 篇
非平稳、分布漂移与真实污染鲁棒性14 篇
多变量依赖、通道相关与跨变量交互13 篇
医疗、可穿戴与科学时间序列13 篇
LLM、多模态信息与时序推理12 篇

共性问题部分覆盖 12 类反复出现的问题；这里展示命中论文最多的 6 类。

独特性候选结构

新方法范式18 篇
新问题设定18 篇
理论/诊断11 篇
新评估/基准7 篇
新应用/数据场景4 篇

这说明不少论文不是简单替换模型，而是在提出新的问题设定、评估对象、理论诊断或方法范式。

合作与应用侧特征

作者侧共有 439 位去重作者，平均每篇 5.69 位作者，中位数为 5；最常见的是 6 人合作论文，共 16 篇。

应用侧仍以通用模型/基准/开放域为主（51 篇），但信号监控/异常监测（15 篇）和医疗/健康/可穿戴（12 篇）已经形成较清晰落地方向。

总体判断：这 87 篇论文可以看作时间序列研究从“架构创新 + 标准预测任务”走向“基础模型、真实世界可靠性、生成式概率建模和任务重新定义”的过渡期。若用于选题，最值得关注的交叉点是：基础模型如何处理多变量相关与缺失、生成式模型如何提供可靠不确定性、评测协议如何覆盖分布漂移与真实污染、以及医疗/可穿戴/工业监控等高风险场景如何兼顾精度、解释性和部署成本。

核心观察

Forecasting 仍是最大板块：主任务中有 39 篇被归为 Forecasting，约占 44.8%。这部分不只关注精度，也大量涉及跨变量建模、周期性、检索增强、后处理、测试时适配、概念漂移、缺失/异步等现实问题。

基础模型与 LLM 正在外溢到多个任务：方法标签中 “Foundation/Pre-trained Models” 命中 25 篇，“LLM/Text/Language” 命中 10 篇。它们不仅用于预测，也出现在异常检测、分类、科学时间序列理解、金融技术分析和临床表示学习中。

多变量建模是独立热点：新增 “Multivariate/Cross-variable” 标签命中 26 篇，主要覆盖多变量预测、跨通道相关、协变量/外生变量、多维预测集、不规则多变量数据和 ICU 等场景。

生成式方法持续升温：Diffusion/Flow/Generative 标签命中 20 篇，覆盖概率预测、反事实/干预预测、异常检测、生成、插补、超分辨率和物理约束任务。

可靠性议题明显突出：Robustness/Generalization/Shift 命中 34 篇，Probabilistic/Uncertainty 命中 11 篇，说明论文不再只看单一预测误差，而是在校准、分布漂移、缺失、污染、置信区间和联合分布上发力。

应用侧有清晰热点：医疗/健康/可穿戴标签命中 12 篇，此外还有金融/加密资产、遥感卫星、A/B 测试、信号监控等场景。

应用领域概览

应用统计基于标题与英文摘要中的领域关键词，属于启发式归类；同一论文可能被多个应用标签命中。

主任务分布

方法/主题标签 Top

作者数量分布

任务 × 方法/主题矩阵

颜色越深表示该主任务下命中该方法/主题标签的论文越多。点击非零格子可同时筛选任务和标签。

全量关键词云

高频短语

作者合作网络

节点大小表示当前筛选结果中的论文数，连线表示共同署名。点击节点按作者筛选。

高频作者

共性热门问题与解决办法

按当前筛选结果中的命中论文数排序。

阅读方式：每张卡片概括一个反复出现的问题，再列出代表论文的差异化解决路线。该归纳基于标题、摘要以及论文检索表中的问题/方法摘要，适合快速把握这批论文的研究热点。

独特问题 / 新问题与新方法

按独特性信号强度和当前筛选结果排序。

阅读方式：这里筛出更像“新问题设定、前人较少系统探索的问题、新评估对象或新方法范式”的论文。判断依据主要是标题、英文摘要中的研究空白表述，以及论文检索表中的问题/方法摘要；它适合做选题雷达，不等同于完整文献查新结论。

论文检索表

点击表头排序；点击“展开”查看摘要与问题/方法。

#	标题	主任务	标签	作者数	作者	摘要词数	链接	操作