我们推出了 Timer-XL,这是一个用于统一时间序列预测的生成式 Transformer。为了统一预测 1D 和 2D 时间序列,我们将主要用于 1D 序列因果生成的下一个标记预测推广为多变量下一个标记预测。所提出的范例将各种预测场景统一表述为长上下文生成问题 ...
0 0 0 2025/04/21 arXiv:2410.04803v4 tw5486
在这项工作中,我们首次尝试在更具挑战性的代码生成场景(即类级代码生成)中评估llm ... ...
0 0 0 2025/04/21 arXiv:2308.01861v2 jade
近年来,大型语言模型(LLM)在与代码相关的任务中的应用引起了极大的关注。但是,现有的评估基准通常集中在有限的方案上,例如代码生成或完成,这并不能反映开发人员在现实世界中面临的各种挑战。为了解决这个问题,我们介绍了综合Codecodeeval,这是一种旨在评估各种开发任务中的LCM的基准,包括代码生成,完成,API建议和测试案例生成 ...
0 0 0 2025/04/21 arXiv:2409.10280v1 heyi
NLP的最新进展激起了分析社交媒体文本数据的重大兴趣,以识别指示心理健康问题的语言特征。但是,表达性叙事故事(ENS)的领域(ENS)是个人和情感上充斥的叙事,这些叙事提供了丰富的心理洞察力 - 毫无疑问。这项研究通过利用来自Reddit的数据集来弥合这一差距,重点是来自有或没有自宣告抑郁症的人的ENS ...
0 0 0 2025/04/21 arXiv:2412.16302v1 tianxi.wan
自主代理人的开发越来越依赖于多模式语言模型(MLMS)来执行具有GUI环境的自然语言所描述的任务,例如网站,台式计算机或手机。交互式环境中MLM代理的现有基准受到其关注单个环境的限制,缺乏详细和广义评估方法以及构建任务和评估人员的复杂性。为了克服这些局限性,我们介绍了Crab,这是旨在支持跨环境任务的第一个代理基准框架,结合了基于图的细粒评估方法以及有效的任务和评估器构建机制 ...
0 0 0 2025/04/21 arXiv:2407.01511v2 niuzai
鉴于当前的社会距离法规,社交媒体已成为大多数人的主要交流方式。这导致了许多无法亲自获得援助的精神疾病的人的隔离。他们越来越多地转向社交媒体表达自己,并寻求应对疾病的指导 ...
0 0 0 2025/04/21 arXiv:2011.11226v1 tianxi.wan
图像识别和产生长期以来一直独立于彼此。随着通用代表学习的最新趋势,还促进了识别和发电任务的一般表示形式的发展。但是,初步尝试主要集中于发电性能,但仍在识别任务上偏低 ...
0 0 0 2025/04/21 arXiv:2306.05423v2 星辰大海
心理健康是现代社会中的关键问题,精神障碍有时可能会在没有适当治疗的情况下转向自杀意念。早期发现社会内容的精神障碍和自杀念头为有效的社会干预提供了潜在的方法。鉴定的情境化语言表示的最新进展促进了几种特定领域的预预读模型的发展,并促进了几种下游应用 ...
0 0 0 2025/04/21 arXiv:2110.15621v1 tianxi.wan

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您勇敢地改进翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)