ICLR Time Series 相关论文交互式数据分析

页面将 87 篇论文拆解为任务方向、方法标签、应用领域、关键词、作者合作关系和论文详情。可以用搜索与筛选快速定位某类论文,例如 “diffusion + forecasting”、“medical + anomaly”、“LLM + representation”。

总体总结:全量 87 篇论文的研究图景

该板块固定基于全部论文统计,不随搜索或筛选变化。
All papers · 87
综合来看,这批 ICLR time series 论文的主线已经从“单一预测精度竞赛”扩展为“面向真实世界的通用时序建模”:既继续围绕长期预测、多变量依赖和异常检测发力,也系统讨论基础模型适配、生成式概率建模、缺失/不规则采样、分布漂移、校准、解释性、评测协议和边缘部署等问题。
39
主任务为 Forecasting
44.8%,仍是最大主任务。
34
涉及鲁棒 / 泛化 / 漂移
约 39.1%,可靠性议题突出。
25
涉及基础模型 / 预训练
与 LLM、Adapter、微调和压缩共同出现。
58
独特问题 / 新方法候选
其中高信号 26 篇,中高信号 17 篇。

1. 研究重心:预测仍最大,但问题边界变宽

主任务中 Forecasting 有 39 篇,而标签层面有 53 篇涉及预测。预测论文不再只比较 MAE/MSE,而是把跨变量相关、周期异质性、非平稳、概念漂移、测试时适配、缺失查询和概率校准纳入问题定义。

展开详情预测从“点误差”变成“真实场景建模”

这组预测论文的共同变化是:预测任务本身被重新细分。过去常见设定是给定规则采样的历史窗口,直接预测未来值;现在的论文更关心变量之间是否相关、周期是否一致、测试分布是否变化、输出是否可校准、缺失和异步是否会破坏模型,以及预测结果能否被解释或在部署端运行。

跨变量与结构关系从通道独立转向显式建模变量相关、图结构、局部跨变量交互,减少“各变量各预测”的信息损失。
非平稳与测试时适配把概念漂移、输出分布偏移和实时监控中的变化纳入训练/推理流程,而不是只在固定 benchmark 上比较误差。
概率与可靠性从点预测扩展到边缘分布、联合分布、置信区间和一致性约束,强调预测是否可信。
部署与效率在保证预测能力的同时降低参数量、推理成本和硬件需求,让模型能进入边缘设备或在线系统。
代表论文:它们分别把预测问题边界推向不同方向
  • Forecasting · Transformer/Mamba/Attention · Linear/Convolutional · 3 位作者
    极低资源预测:把“长期预测是否一定需要大模型”变成核心问题。
    问题长期多变量预测需要同时捕捉复杂时间依赖与趋势变化,但 Transformer 等高精度模型参数量和计算开销较大,不适合部署在硬件受限设备上。
    方法提出 MixLinear,在时域用正交分段趋势提取分离段内/段间相关性,在频域用自适应低秩谱滤波压缩全局趋势,把线性模型参数规模从 O(n²) 降到 O(n)。
  • Forecasting · Foundation/Pre-trained Models · Linear/Convolutional · Federated/Data/Optimization · 7 位作者
    基础模型适配:补足 TSFM 忽略通道相关的短板。
    问题现有时间序列基础模型多采用通道独立建模,偏重时间依赖泛化,却忽略多变量预测中不同类型的通道相关性。
    方法提出轻量可插拔的 CoRA 相关性感知适配器,将相关矩阵分解为低秩的时变与时不变部分,用可学习多项式建模动态相关,并用异质-局部双对比学习识别正/负相关。
  • Forecasting · Transformer/Mamba/Attention · 10 位作者
    周期异质性:处理不同变量周期不一致且动态变化的真实情况。
    问题真实多变量序列中不同变量往往具有不同且会变化的周期,已有模型虽能建模周期性,却容易忽略这种“周期异质性”。
    方法提出 PHAT,把输入组织为周期桶张量,按相近周期、相位对齐和周期内偏移限制交互;再用正负注意力从周期对齐与偏离两方面建模周期依赖,并注入周期先验。
  • Forecasting · Diffusion/Flow/Generative · Probabilistic/Uncertainty · Irregular/Missing/Asynchronous · 6 位作者
    不规则/缺失场景:把概率查询的一致性作为预测质量标准。
    问题不规则、缺失时间序列的联合概率预测尚不充分,现有 normalizing flow 方法表达力强但缺少边际化一致性,导致子集变量的边际预测不可靠。
    方法提出 MOSES,用可分离流的混合来参数化随机过程:每个分量结合潜在多元高斯与单变量可逆变换,使模型可以解析边际化,从而支持可靠的边际和联合概率查询。
  • Forecasting · Linear/Convolutional · Robustness/Generalization/Shift · 2 位作者
    测试时适配:关注部署后输出空间和上下文变化。
    问题部署后的预测模型在非平稳和分布漂移下性能下降,而现有测试时适应方法常通过输入/输出双适配器间接改动分布,难以分析且不够简洁。
    方法提出 COSA 输出空间适配器,在冻结基模型后直接对预测残差进行门控校正;利用近期已观测真实值构造轻量上下文向量,只在测试时更新线性层和门控参数。
  • Forecasting · Probabilistic/Uncertainty · Representation/Self-supervised · 4 位作者
    置信区间:用 conformal prediction 给预测不确定性提供覆盖保证。
    问题序列数据上的 conformal prediction 往往需要复杂模型捕捉时间依赖,小样本下易失败,分布变化时还需要昂贵重训。
    方法提出训练免费的 ResCP,用 reservoir computing 表示当前状态,根据 reservoir state 相似度动态重加权历史残差/非一致性分数,从而在保持可扩展性的同时适配局部时间动态。
  • Forecasting · Transformer/Mamba/Attention · Irregular/Missing/Asynchronous · Robustness/Generalization/Shift · 4 位作者
    真实世界统一设定:同时处理依赖、异步和缺失。
    问题真实多变量序列常同时存在复杂通道依赖、通道异步采样和缺失值,现有模型通常只处理其中一部分或做简化假设。
    方法提出 ChannelTokenFormer,用灵活的 Transformer 通道 token 架构显式建模跨通道交互,同时适配通道级异步采样和测试时缺失块,提升真实条件下鲁棒性。
  • Forecasting · Transformer/Mamba/Attention · Robustness/Generalization/Shift · 3 位作者
    概念漂移:把泛化失败归因到时间序列中分布随时间变化。
    问题时间序列泛化受分布漂移影响,已有工作更多关注 temporal shift,而 concept drift 在预测中的处理不足。
    方法提出 ShifTS,先缓解 temporal shift,再在统一框架中处理 concept drift;通过软注意力从 lookback 与 horizon 序列中提取不变模式,作为模型无关增强。

2. 方法谱系:大模型化与轻量化并行

一条路线是 Foundation / LLM / 多模态化:预训练模型、语言模型提示、视觉-时序对齐和科学时间序列理解持续增加。另一条路线是面向落地的轻量化:低秩、线性/卷积、Adapter、检索增强、蒸馏、压缩和边缘推理,说明“更大模型”和“更可部署模型”同时是热点。

展开详情不是单纯变大,而是“底座 + 适配 + 压缩”并行

这一板块最明显的趋势是方法路线分叉:一边把时间序列接入基础模型、LLM、多模态模型和科学理解任务;另一边强调如何少调参、少参数、快速选择、低秩压缩和边缘部署。两条路线并不冲突:大模型提供通用表征和跨任务能力,轻量化/适配技术决定这些能力能否在具体时序任务中落地。

基础模型 / LLM / 多模态化把数值序列与文本、图像、科学任务、临床记录和金融推理连接起来,重点是通用理解、跨域迁移和复杂推理。
Adapter / 选择 / 微调不从零训练,而是在已有 TSFM 上做协变量适配、相关性适配、模型组合选择或稳定微调。
低秩 / 小模型 / 压缩用低秩结构、线性模型、小型预训练模型和可压缩性分析,在有限资源下保持性能。
数据与训练范式联邦数据集学习、数据质量评分、自动增强和 domain-shared transformation 让训练数据本身成为方法的一部分。
代表论文:大模型化与轻量化两条路线
  • Foundation Models · Forecasting · Foundation/Pre-trained Models · Multimodal · 12 位作者
    异质协变量适配:让 TSFM 处理类别、文本、图像等非数值辅助信息。
    问题现有 TSFM 主要面向实值序列,难以处理包含类别变量、文本、图像等异质协变量的通用 covariate-aware forecasting。
    方法提出 UniCA,先把异质协变量通过 covariate homogenization 转换为高级同质序列表征,再用统一 attention fusion 与 TSFM 表征融合,在保留泛化能力的同时利用额外协变量。
  • LLM/Text Reasoning · Forecasting · LLM/Text/Language · Multimodal · 10 位作者
    时序复杂推理:把任务从预测扩展到感知、外推、因果和决策。
    问题现有多模态时间序列数据集多停留在浅层对齐或问答,缺少真正要求感知、外推和决策的复杂时间序列推理任务与高质量数据。
    方法提出 TSR-Suite,定义场景理解、因果发现、事件感知预测和决策等原子任务,并构建 23K+ 样本;进一步训练 TimeOmni-1,通过多阶段任务混合、奖励函数和优化策略提升时序推理。
  • LLM/Text Reasoning · Forecasting · LLM/Text/Language · Multimodal · 15 位作者
    科学时间序列:用 benchmark 评估 LLM/多模态模型对科学序列的理解与生成。
    问题科学时间序列具有非周期、异质、高频和超长等特性,现有多模态 LLM 把数值序列转文本或图像会造成序列过长或精度损失,缺少系统 benchmark。
    方法提出 SciTS,覆盖 12 个科学领域、43 个任务和 50K+ 实例,评测 text-only LLM、多模态 LLM 和统一时间序列模型;并给出 TimeOmni 作为扩展 LLM 处理科学时序的示例框架。
  • Forecasting · Foundation/Pre-trained Models · Multimodal · Diffusion/Flow/Generative · 7 位作者
    通用生成式多模态预测:把多模态输入纳入统一预测框架。
    问题跨领域预测中,相似历史模式可能因领域知识不同而产生不同未来;单模态 TSFM 缺少文本/图像领域知识,端到端多模态模型又不支持跨域零样本。
    方法提出 Aurora 多模态时间序列基础模型,在跨域多模态语料上预训练,通过 tokenization、encoding、distillation 提取领域知识,用 modality-guided attention 注入时间表示,并用 prototype-guided flow matching 做生成式概率预测。
  • Representation/Data Processing · Classification · Anomaly/Event Detection · Foundation/Pre-trained Models · 8 位作者
    小型预训练模型:用 1M 级模型与解耦表征追求快速分析。
    问题现有预训练时间序列模型把时间/频率、局部/全局等异质信号混在单一大 embedding 中,限制迁移和零样本使用。
    方法提出 TSPulse,使用约 1M 参数的超轻预训练模型族,通过 masked reconstruction 与显式解耦学习 temporal、spectral、semantic 三种视图,并用轻量 post-hoc fuser 按任务选择性融合。
  • Forecasting · Transformer/Mamba/Attention · Linear/Convolutional · 3 位作者
    极低参数预测:以 0.1K 参数挑战高精度预测模型。
    问题长期多变量预测需要同时捕捉复杂时间依赖与趋势变化,但 Transformer 等高精度模型参数量和计算开销较大,不适合部署在硬件受限设备上。
    方法提出 MixLinear,在时域用正交分段趋势提取分离段内/段间相关性,在频域用自适应低秩谱滤波压缩全局趋势,把线性模型参数规模从 O(n²) 降到 O(n)。
  • Forecasting · Foundation/Pre-trained Models · Benchmark/Evaluation/Survey · Federated/Data/Optimization · 7 位作者
    预训练模型组合:测试时选择高效 portfolio,而不是固定单一模型。
    问题时间序列基础模型是否必须越大越好尚不清楚,单一大型模型在测试时可能成本高、参数多。
    方法构建由多个小型预训练预测模型组成的 portfolio,通过集成或模型选择获得竞争性能;研究发现专家模型组合优于普通泛化模型组合,且 post-training 生成专家比测试时微调更省计算。
  • General Modeling Analysis · Foundation/Pre-trained Models · Transformer/Mamba/Attention · Linear/Convolutional · 10 位作者
    Transformer 可压缩性:从 rank structure 解释并压缩时间序列 Transformer。
    问题文本/视觉中总结的 Transformer 经验不能直接套到时间序列,时间序列 embedding 的低秩谱结构、层间 rank 变化和可压缩性尚不清晰。
    方法从 rank structure 角度分析时间序列 Transformer,提出 flow-of-ranks 解释深层非线性混合如何提升 rank,并据此对 Chronos 做低秩压缩,在几乎不损失精度下显著降低推理时间和内存。
  • Foundation Models · Foundation/Pre-trained Models · LLM/Text/Language · Transformer/Mamba/Attention · 3 位作者
    大模型微调:通过损失景观平滑改善 LTSM 全量微调。
    问题大时间序列模型直接微调时损失景观病态且非凸,容易过拟合或落入差的局部区域,甚至不如从头训练。
    方法提出 SFF 平滑全量微调:随机初始化一个辅助 LTSM,并与预训练模型权重线性插值以平滑原损失景观,在保留预训练知识的同时扰动尖锐极小值、提升可训练性。

3. 可靠性:从干净 benchmark 走向真实数据

40 篇涉及评测/基准,34 篇涉及鲁棒与分布变化,14 篇涉及缺失/不规则/异步数据。这表明研究关注点正在从“模型能否在标准数据集上更准”转向“模型是否能在真实噪声、缺失、漂移和不同部署条件下稳定工作”。

展开详情可靠性议题覆盖数据、模型、评估和部署

可靠性不只是鲁棒训练一个子方向,而是贯穿任务设定:数据可能不规则、异步、缺失、污染;模型可能过度泛化或被归一化抹掉异常;基础模型可能准确但概率不校准;因果发现方法可能在假设被破坏时失效。因此,这批论文把 benchmark、诊断、校准、conformal 保证、真实污染和异常定位都纳入了可靠性研究。

数据可靠性关注不规则采样、异步、缺失、真实污染、稀疏事件和临床/工业数据中的噪声。
模型可靠性分析 TSFM 是否会过度泛化、是否校准、是否在异常检测中真的优于简单统计基线。
评估可靠性通过新 benchmark、stress test、假设违反和真实 corruptions 检验方法是否只是在干净数据上有效。
部署可靠性在线预测、信号监控和 conformal 框架强调误报、覆盖率、分布漂移和无需微调的部署方式。
代表论文:从不同角度把“可靠性”具体化
  • Classification · Irregular/Missing/Asynchronous · Medical/Healthcare/Wearable · Robustness/Generalization/Shift · 2 位作者
    不规则时间序列评测:为分类任务提供统一框架和 benchmark。
    问题不规则时间序列分类研究分散,数据格式、工具和评测基准不统一,导致方法难以公平比较和复用。
    方法提出 PYRREGULAR 统一框架与标准数据仓库,采用通用数组格式整合 34 个不规则时间序列分类数据集,并在其上评测 12 类分类器。
  • Forecasting · Transformer/Mamba/Attention · Linear/Convolutional · Robustness/Generalization/Shift · 4 位作者
    真实污染鲁棒性:处理 realistic corruptions 下的预测稳定性。
    问题Transformer 在预测中表现强,但常不能捕捉时间序列的局部几何结构,因而在真实噪声和异常污染下鲁棒性不足。
    方法提出 LGA 局部几何注意力,基于局部高斯过程理论学习 query-specific 距离度量以适配数据内在几何;同时提出 TSRBench,用统计上合理的真实污染评估鲁棒预测。
  • Forecasting · Transformer/Mamba/Attention · Irregular/Missing/Asynchronous · Robustness/Generalization/Shift · 4 位作者
    真实多变量设定:统一处理依赖、异步和缺失。
    问题真实多变量序列常同时存在复杂通道依赖、通道异步采样和缺失值,现有模型通常只处理其中一部分或做简化假设。
    方法提出 ChannelTokenFormer,用灵活的 Transformer 通道 token 架构显式建模跨通道交互,同时适配通道级异步采样和测试时缺失块,提升真实条件下鲁棒性。
  • Anomaly/Event Detection · Foundation/Pre-trained Models · Probabilistic/Uncertainty · Explainability/XAI · 6 位作者
    工业信号监控:用 TSFM + conformal 做无需微调的异常检测。
    问题工业信号监测常面临标注/训练数据少、需要快速部署和稳定误报控制,同时分布漂移会破坏固定阈值。
    方法提出后处理式自适应 conformal 异常检测,直接利用预训练时间序列基础模型预测,无需微调;用加权分位 conformal bounds 和历史预测自适应学习权重,输出可解释为 p-value 的异常分数。
  • Anomaly/Event Detection · Forecasting · Foundation/Pre-trained Models · Benchmark/Evaluation/Survey · 3 位作者
    基础模型诊断:质疑“预测误差可直接做异常检测”的常见假设。
    问题时间序列基础模型用于异常检测时常依赖重构/预测误差,但“异常更难重构或预测”的假设可能并不成立。
    方法系统评估 MOMENT、Chronos、TimesFM、Time-MoE 和 TSPulse 等五类 TSFM,在不同模型大小和窗口下与 moving-window variance、squared-difference 等一行基线比较,并据此提出未来方向。
  • Anomaly/Event Detection · Forecasting · Foundation/Pre-trained Models · Benchmark/Evaluation/Survey · 6 位作者
    过度泛化/过度平稳化:诊断 TSFM 异常检测中的结构性失败。
    问题TFM 做重构式异常检测会出现 overgeneralization(异常也能被重构)和 overstationarization(归一化移除均值/方差等异常特征)。
    方法提出复杂度指标 α 衡量数据对 TFM 的难度,并用 Complexity-Aware Ensemble 自适应组合 TFM 与统计模型;同时在不重训的情况下把均值、方差等统计特征重新引入重构。
  • Foundation Models · Forecasting · Foundation/Pre-trained Models · Probabilistic/Uncertainty · 5 位作者
    概率校准:评估 TSFM 是否不只准确、而且可信。
    问题时间序列基础模型虽有高预测精度,但其概率校准性质仍少被研究,而校准对实际风险决策很关键。
    方法系统评估 5 个近期 TSFM 和 2 个强基线,考察模型过/欠置信、不同 prediction heads 的影响以及长期自回归预测中的校准变化。
  • Causal/Structure Learning · Causal/Counterfactual/Intervention · Robustness/Generalization/Shift · Benchmark/Evaluation/Survey · 4 位作者
    因果发现鲁棒性:系统测试假设违反下方法何时失效。
    问题时间序列因果发现依赖强且难验证的假设,实际应用中缺乏对假设违反时鲁棒性的系统评估。
    方法提出 TCD-Arena,可模块化、可定制地逐步施加 33 类假设违反并评估因果发现算法;通过约 3000 万次实验揭示方法鲁棒性谱系,并研究 CD ensemble 的潜在改进。
  • Forecasting · Probabilistic/Uncertainty · Representation/Self-supervised · 4 位作者
    预测覆盖保证:用 reservoir conformal prediction 处理时序预测不确定性。
    问题序列数据上的 conformal prediction 往往需要复杂模型捕捉时间依赖,小样本下易失败,分布变化时还需要昂贵重训。
    方法提出训练免费的 ResCP,用 reservoir computing 表示当前状态,根据 reservoir state 相似度动态重加权历史残差/非一致性分数,从而在保持可扩展性的同时适配局部时间动态。

4. 生成式与概率建模成为重要支线

Diffusion / Flow / Generative 标签命中 20 篇,Probabilistic / Uncertainty 命中 11 篇。这些工作覆盖概率预测、联合分布、反事实/干预、异常检测、插补、生成、超分辨率和物理约束等任务,代表时间序列从点预测向分布建模和可采样场景扩展。

展开详情从“给一个值”转向“给分布、样本和可控生成”

生成式与概率建模的价值在于:很多时序任务并不存在唯一未来。金融、医疗、交通、气象、神经信号和工业监控都需要多个可能轨迹、置信区间、反事实结果、插补样本或物理一致的生成结果。因此,这一支线把 diffusion、flow matching、normalizing flow、latent diffusion、conformal prediction 和能量/物理约束引入时序建模。

概率预测与校准建模边缘/联合分布,输出置信区间或可采样预测,而不只输出点估计。
可控生成与反事实在干预、条件约束、物理规律或任务目标下生成未来轨迹。
异常/插补/超分辨率用生成模型恢复缺失、识别异常、提升分辨率或生成训练数据。
理论诊断关注 latent diffusion 的 posterior stability、flow 的边缘一致性和时序生成 benchmark 的有效性。
代表论文:生成式与概率路线的不同用途
  • Forecasting · Diffusion/Flow/Generative · Probabilistic/Uncertainty · Irregular/Missing/Asynchronous · 6 位作者
    边缘化一致性:让不规则/缺失时序的概率查询保持一致。
    问题不规则、缺失时间序列的联合概率预测尚不充分,现有 normalizing flow 方法表达力强但缺少边际化一致性,导致子集变量的边际预测不可靠。
    方法提出 MOSES,用可分离流的混合来参数化随机过程:每个分量结合潜在多元高斯与单变量可逆变换,使模型可以解析边际化,从而支持可靠的边际和联合概率查询。
  • Forecasting · Diffusion/Flow/Generative · Probabilistic/Uncertainty · Robustness/Generalization/Shift · 9 位作者
    概率预测生成模型:用条件白化改善概率预测分布。
    问题多变量概率预测受非平稳性、变量依赖和分布漂移影响,扩散/流匹配模型常忽略条件均值与协方差等有用先验。
    方法提出 CW-Gen 条件白化框架,先用 JMCE 同时估计条件均值与滑动窗口协方差,再构建 CW-Diff 和 CW-Flow,把这些先验作为终端分布/白化信息注入生成模型。
  • Forecasting · Diffusion/Flow/Generative · Probabilistic/Uncertainty · 5 位作者
    多模态未来:用 multi-mode patch diffusion 产生多样预测。
    问题常用 MSE 回归损失隐含单峰高斯假设,难以表达真实场景中多种可能未来和多模态预测分布。
    方法提出 MMPD 损失,可接在任意输出未来 latent tokens 的 patch backbone 上;用条件扩散模型建模未来分布,用 Patch Consistent MLP 做去噪,并在推理中用演化的变分 GMM 生成多模式预测及概率。
  • Forecasting · Diffusion/Flow/Generative · Linear/Convolutional · Benchmark/Evaluation/Survey · 3 位作者
    扩散预测:将 elucidated diffusion model 用于时间序列预测。
    问题图像扩散模型的成功尚未充分迁移到时间序列预测,关键障碍是时间序列具有顺序结构且预测采样延迟需受控。
    方法提出 TEDM,将 elucidated diffusion 的设计空间显式适配到序列结构,直接从数据估计噪声/信号缩放而非外部 schedule,并把采样复杂度降为随预测 horizon 线性增长。
  • Forecasting · Anomaly/Event Detection · Diffusion/Flow/Generative · Graph/Spatio-temporal · 3 位作者
    干预与反事实:用 flow-based 生成模型回答干预/反事实预测。
    问题多变量系统预测不仅需要观察性预测,还需要回答干预和反事实问题,并提供未来轨迹似然用于异常检测。
    方法提出 DoFlow,在因果 DAG 上定义 continuous normalizing flow,利用 CNF 的编码-解码机制生成观察、干预与反事实预测,并基于显式 likelihood 进行异常检测。
  • Forecasting · Diffusion/Flow/Generative · Probabilistic/Uncertainty · Transformer/Mamba/Attention · 3 位作者
    多维 conformal:结合 flow 与 conformal prediction 处理多维覆盖。
    问题时间序列 conformal prediction 需要处理观测和非一致性分数相关性,同时还要构造多维输出预测集。
    方法提出基于 flow 与 classifier-free guidance 的 conformal prediction 方法,给出非渐近边际覆盖和有限样本条件覆盖界,在保持目标覆盖的同时生成更小的多维预测集。
  • Anomaly/Event Detection · Diffusion/Flow/Generative · Robustness/Generalization/Shift · Benchmark/Evaluation/Survey · 4 位作者
    异常检测:用隐式条件扩散建模异常场景。
    问题时间序列异常检测受噪声和时间异质性影响,生成式重构方法难以保持高保真;扩散模型的随机性又会带来不可消除的重构方差。
    方法提出 ICDiffAD,通过 SNR Scheduler 控制可量化噪声尺度学习正常模式,并用 SNR implicit conditioning 从部分污染输入初始化反向扩散,在保留信号一致性的同时削弱异常成分。
  • Generation · Forecasting · Classification · Diffusion/Flow/Generative · 8 位作者
    生成 benchmark:面向加密货币序列,用交易效用评估生成质量。
    问题加密货币市场 24/7 交易、波动剧烈且 regime shift 快,现有时间序列生成 benchmark 缺少 crypto 特性和交易导向评估。
    方法提出 CTBench,整理 452 个 token 数据并用 13 个指标评价生成模型;核心采用双任务评估:Predictive Utility 衡量合成数据对预测的保真,Statistical Arbitrage 衡量对均值回归交易信号的支持。
  • Representation/Data Processing · Diffusion/Flow/Generative · Transformer/Mamba/Attention · Representation/Self-supervised · 3 位作者
    时序超分辨率:用 disentangled rectified flow 生成高分辨率序列。
    问题高时间分辨率数据对分析很重要,但采集常受成本和可行性限制;图像超分方法不能直接迁移到时间序列。
    方法提出 SRT,用 disentangled rectified flow 从低分辨率输入恢复高分辨率信号:先分解趋势和季节项,用 implicit neural representation 对齐目标分辨率,再用 cross-resolution attention 生成细节;SRT-large 通过预训练支持零样本超分。
  • Dynamics/Physics-informed · Forecasting · Foundation/Pre-trained Models · Diffusion/Flow/Generative · 5 位作者
    物理约束生成:在推理阶段注入 model-free 物理引导。
    问题科学时间序列常样本少、物理动态复杂、观测缺失、多分辨率采样,并要求生成结果满足物理一致性。
    方法提出 PINFDiT,使用 diffusion transformer 捕捉时间依赖并通过综合 masking 处理不完美数据;推理时加入 model-free physics-guided Langevin correction,在不改架构/不重训下平衡分布保真和物理约束。
  • General Modeling Analysis · Diffusion/Flow/Generative · Representation/Self-supervised · Benchmark/Evaluation/Survey · 3 位作者
    latent diffusion 诊断:研究时序 latent diffusion 的 posterior stability。
    问题latent diffusion 用于时间序列可能出现 posterior collapse,使潜变量影响随时间快速衰减并退化为较弱的 VAE 式生成。
    方法先用 dependency measures 量化 recurrent decoder 对输入变量的敏感性以诊断 collapse,再提出 posterior-stable latent diffusion,把扩散过程解释为变分推断,去除风险 KL 正则并惩罚 decoder insensitivity。

高频方法/主题信号

Forecasting53 篇 · 60.9%预测与序列建模仍是主轴Benchmark/Evaluation/Survey40 篇 · 46.0%评测协议与基准意识增强Robustness/Generalization/Shift34 篇 · 39.1%真实分布漂移、污染与泛化Transformer/Mamba/Attention32 篇 · 36.8%序列架构仍活跃Representation/Self-supervised29 篇 · 33.3%表征学习和自监督成为底座Multivariate/Cross-variable26 篇 · 29.9%多变量、通道和跨变量依赖Foundation/Pre-trained Models25 篇 · 28.7%预训练/基础模型外溢Diffusion/Flow/Generative20 篇 · 23.0%生成式与概率建模升温Medical/Healthcare/Wearable12 篇 · 13.8%高风险应用场景集中

共性热门问题 Top 6

  • 生成式建模:Diffusion / Flow / Flow Matching16 篇
  • 基础模型的适配、选择、微调与压缩15 篇
  • 非平稳、分布漂移与真实污染鲁棒性14 篇
  • 多变量依赖、通道相关与跨变量交互13 篇
  • 医疗、可穿戴与科学时间序列13 篇
  • LLM、多模态信息与时序推理12 篇

共性问题部分覆盖 12 类反复出现的问题;这里展示命中论文最多的 6 类。

独特性候选结构

  • 新方法范式18 篇
  • 新问题设定18 篇
  • 理论/诊断11 篇
  • 新评估/基准7 篇
  • 新应用/数据场景4 篇

这说明不少论文不是简单替换模型,而是在提出新的问题设定、评估对象、理论诊断或方法范式。

合作与应用侧特征

作者侧共有 439 位去重作者,平均每篇 5.69 位作者,中位数为 5;最常见的是 6 人合作论文,共 16 篇。

应用侧仍以通用模型/基准/开放域为主(51 篇),但信号监控/异常监测(15 篇)和医疗/健康/可穿戴(12 篇)已经形成较清晰落地方向。

总体判断:这 87 篇论文可以看作时间序列研究从“架构创新 + 标准预测任务”走向“基础模型、真实世界可靠性、生成式概率建模和任务重新定义”的过渡期。若用于选题,最值得关注的交叉点是:基础模型如何处理多变量相关与缺失、生成式模型如何提供可靠不确定性、评测协议如何覆盖分布漂移与真实污染、以及医疗/可穿戴/工业监控等高风险场景如何兼顾精度、解释性和部署成本。

核心观察

Forecasting 仍是最大板块:主任务中有 39 篇被归为 Forecasting,约占 44.8%。这部分不只关注精度,也大量涉及跨变量建模、周期性、检索增强、后处理、测试时适配、概念漂移、缺失/异步等现实问题。
基础模型与 LLM 正在外溢到多个任务:方法标签中 “Foundation/Pre-trained Models” 命中 25 篇,“LLM/Text/Language” 命中 10 篇。它们不仅用于预测,也出现在异常检测、分类、科学时间序列理解、金融技术分析和临床表示学习中。
多变量建模是独立热点:新增 “Multivariate/Cross-variable” 标签命中 26 篇,主要覆盖多变量预测、跨通道相关、协变量/外生变量、多维预测集、不规则多变量数据和 ICU 等场景。
生成式方法持续升温:Diffusion/Flow/Generative 标签命中 20 篇,覆盖概率预测、反事实/干预预测、异常检测、生成、插补、超分辨率和物理约束任务。
可靠性议题明显突出:Robustness/Generalization/Shift 命中 34 篇,Probabilistic/Uncertainty 命中 11 篇,说明论文不再只看单一预测误差,而是在校准、分布漂移、缺失、污染、置信区间和联合分布上发力。
应用侧有清晰热点:医疗/健康/可穿戴标签命中 12 篇,此外还有金融/加密资产、遥感卫星、A/B 测试、信号监控等场景。

应用领域概览

应用统计基于标题与英文摘要中的领域关键词,属于启发式归类;同一论文可能被多个应用标签命中。

主任务分布

方法/主题标签 Top

作者数量分布

任务 × 方法/主题矩阵

颜色越深表示该主任务下命中该方法/主题标签的论文越多。点击非零格子可同时筛选任务和标签。

全量关键词云

高频短语

作者合作网络

节点大小表示当前筛选结果中的论文数,连线表示共同署名。点击节点按作者筛选。

高频作者

共性热门问题与解决办法

按当前筛选结果中的命中论文数排序。
阅读方式:每张卡片概括一个反复出现的问题,再列出代表论文的差异化解决路线。该归纳基于标题、摘要以及论文检索表中的问题/方法摘要,适合快速把握这批论文的研究热点。

独特问题 / 新问题与新方法

按独特性信号强度和当前筛选结果排序。
阅读方式:这里筛出更像“新问题设定、前人较少系统探索的问题、新评估对象或新方法范式”的论文。判断依据主要是标题、英文摘要中的研究空白表述,以及论文检索表中的问题/方法摘要;它适合做选题雷达,不等同于完整文献查新结论。

论文检索表

点击表头排序;点击“展开”查看摘要与问题/方法。
# 标题 主任务 标签 作者数 作者 摘要词数 链接 操作