arxiv的文档

arxiv 南京

个性签名 ...

Text-to-Code Generation with Modality-relative Pre-training

最近，大型的预训练的语言模型已扩展并应用于具有巨大成功的编程语言任务，通常是通过进一步预先培训严格的自然语言模型 - 培训序列通常包含自然和（线性化的）编程语言。这种方法有效地将序列的两种方式都映射到相同的嵌入空间中。但是，编程语言关键字（e ...

0 0 0 0 2025/07/08 arXiv:2402.05783v2 Yieww

multiGradICON: A Foundation Model for Multimodal Medical Image Registration

现代医疗图像注册方法可以使用深网预测变形。这些方法达到了最新的（SOTA）注册精度，并且通常很快。但是，与常规的非深度学习方法相比，深度学习（DL）方法是解剖学特定的 ...

0 0 0 0 2025/07/08 arXiv:2408.00221v2 Ferra_Lee

ReasonBridge: Efficient Reasoning Transfer from Closed to Open-Source Language Models

大型语言模型（LLMS）的最新进展揭示了封闭源和开源模型之间存在显着的性能差距，尤其是在需要复杂的推理和精确指导之后的任务中。本文介绍了Reason Bridge，这种方法可以通过新型的层次结构知识蒸馏框架有效地将推理能力从强大的封闭源转移到开源模型。我们开发了一个量身定制的数据集Reason1K，只有1,000个精心策划的推理轨迹强调了难度，多样性和质量 ...

0 0 0 0 2025/07/08 arXiv:2506.22865v1 kkkk

InfoDPCCA: Information-Theoretic Dynamic Probabilistic Canonical Correlation Analysis

从高维顺序数据中提取有意义的潜在表示是机器学习的至关重要挑战，其应用程序涵盖了自然科学和工程。我们介绍了InfoDPCCA，这是一种动态概率的规范相关分析（CCA）框架，旨在模拟两个相互依存的观测序列。 InfoDPCCA利用一个新型的信息理论目标来提取共享的潜在表示，该图表捕获数据流和平衡表示压缩和预测充足性之间的相互结构，同时还学习了分别编码针对每个序列特定信息的潜在组件 ...

0 0 0 0 2025/07/08 arXiv:2506.08884v1 13080420360

Acoustic Volume Rendering for Neural Impulse Response Fields

捕获准确的声学现象的现实音频综合对于在虚拟和增强现实中创造沉浸式体验至关重要。综合在任何位置接收的声音都取决于脉冲响应（IR）的估计，该响应（ir）的特征是在到达听众的位置之前，声音在一个场景中沿着不同的路径传播。在本文中，我们提出了声学量渲染（AVR），这是一种新型方法，可适应体积渲染技术，以模拟声学脉冲响应 ...

0 0 0 0 2025/07/08 arXiv:2411.06307v1 wenwen

WSCoach: Wearable Real-time Auditory Feedback for Reducing Unwanted Words in Daily Communication

可穿戴智能设备的兴起通过无处不在的行为跟踪和指导为自我完善提供了前所未有的机会。但是，有效的可穿戴行为干预系统的设计仍然相对尚未探索。为了解决这一差距，我们进行了对照研究，重点是减少不必要的单词（e ...

0 0 0 0 2025/07/08 arXiv:2507.04238v1 zhangqi33

Self-Evolving Multi-Agent Collaboration Networks for Software Development

LLM驱动的多代理协作（MAC）系统在功能级别的自动软件开发方面表现出了令人印象深刻的功能。但是，他们对人类设计的极大依赖将其适应性限制在现实世界软件开发的各种需求中。为了解决这一限制，我们介绍了Evomac，这是一种新型的Mac网络自我发展范式 ...

0 0 0 0 2025/07/08 arXiv:2410.16946v1 Loong

What to Say and When to Say it: Live Fitness Coaching as a Testbed for Situated Interaction

近年来，视觉语言模型显示出令人印象深刻的进展。但是，现有的模型在很大程度上仅限于基于转弯的互动，每个转弯都必须逐步进行（即 ...

0 0 0 0 2025/07/08 arXiv:2407.08101v3 yanyu

TimeDRL: Disentangled Representation Learning for Multivariate Time-Series

许多现实世界应用（例如医疗保健和工业）中的多元时间序列数据信息丰富，但由于缺乏标签和高维度而具有挑战性 ...

0 0 0 0 2025/07/08 arXiv:2312.04142v3 13080420360

LTGC: Long-tail Recognition via Leveraging LLMs-driven Generated Content

长尾识别是具有挑战性的，因为它要求模型从尾部类别中学习良好的表示，并解决所有类别的失衡。在本文中，我们提出了一个新颖的生成和微调框架LTGC，以通过利用生成的内容来处理长尾识别。首先，受大型模型中丰富的隐性知识的启发（e ...

0 0 0 0 2025/07/08 arXiv:2403.05854v4 zl1994