arxiv的文档

arxiv 南京

个性签名 ...

Learning to See in the Extremely Dark

基于学习的方法在弱光原始图像增强功能方面取得了令人鼓舞的进步，而它们对于极黑色的场景的能力，由于缺乏相应的数据集，因此环境照明效果下降到低至0.0001 lux的能力仍有待探索。为此，我们提出了一个配对的数据合成管道，能够在三个精确的照明范围内生成精心校准的极低原始图像 ...

0 0 0 0 2025/06/29 arXiv:2506.21132v1 chenzj36

Random Feature Attention

Transformer 是各种序列建模任务的最新模型。其核心是一个注意力函数，该功能在每个时间步中的输入之间对成对相互作用进行建模。尽管注意力很强大，但由于其序列长度的二次时间和空间复杂性，它不会有效地扩展到长序列 ...

0 0 0 0 2025/06/29 arXiv:2103.02143v2 zhr

Semantically-Aware Rewards for Open-Ended R1 Training in Free-Form Generation

评估开放式的长期生成是具有挑战性的，因为很难定义明显与不良输出分开的东西。现有的方法通常会错过关键，样式或相关性等关键方面，或者因数据预处理而偏见，从而使开放式的长期评估成为一个不受欢迎的问题。为了解决这一差距，我们提出了Prefbert，这是一个评分模型，用于评估GRPO中的开放式长期生成，并以良好和不良产出的不同奖励指导其培训 ...

0 0 0 0 2025/06/29 arXiv:2506.15068v1 Ahmoon

Junction Tree Variational Autoencoder for Molecular Graph Generation

我们试图根据特定的化学特性自动化分子的设计。用计算术语，此任务涉及分子图的连续嵌入和产生。我们的主要贡献是分子图的直接实现，这是先前通过生成线性微笑字符串而不是图形来完成的任务 ...

0 0 0 0 2025/06/29 arXiv:1802.04364v4 zy_

OmniThink: Expanding Knowledge Boundaries in Machine Writing through Thinking

使用大型语言模型的机器写作通常依赖于检索效果的一代。但是，这些方法仍然局限于模型预定范围范围的边界，从而限制了内容的生成丰富的信息。具体而言，香草退回的信息往往缺乏冗余的深度，新颖性和遭受的痛苦，这会对产生的物品的质量产生负面影响，从而导致浅，非原始和重复的产出 ...

0 0 0 0 2025/06/29 arXiv:2501.09751v2 Ahmoon

How much do language models memorize?

我们提出了一种新方法，用于估计一个模型'知道'的模型，并使用它来衡量现代语言模型的能力。对语言模型记忆的先前研究一直在努力将记忆与概括解散。我们将记忆正式分为两个组成部分：\ textIt {无意外的记忆}，模型包含有关特定数据集的信息，以及\ textit {pressilization}，模型包含有关真实数据生成过程的信息 ...

0 0 0 0 2025/06/29 arXiv:2505.24832v3 YONG

DeepEyes: Incentivizing "Thinking with Images" via Reinforcement Learning

大型视觉模型（VLM）在多模式的理解和推理方面表现出很强的能力，但是它们主要受到基于文本的推理过程的约束。但是，实现反映人类认知过程的视觉和文本推理的无缝整合仍然是一个重大挑战。特别是，有效地将高级视觉输入处理纳入推理机制仍然是一个悬而未决的问题 ...

0 0 0 0 2025/06/29 arXiv:2505.14362v2 Goodhao

FALCON: Learning Force-Adaptive Humanoid Loco-Manipulation

人形机车操作具有日常服务和工业任务的变革潜力，但通过3D最终效应力相互作用实现了精确的，可靠的全身控制，仍然是一个重大挑战。先前的方法通常仅限于轻巧的任务或四倍/轮式平台。为了克服这些局限性，我们提出了Falcon，这是一种基于双重加强学习的框架，用于强大的力适应性人型人体机器人的操作 ...

0 0 0 0 2025/06/29 arXiv:2505.06776v1 晚餐杀手

Lip-reading with Densely Connected Temporal Convolutional Networks

在这项工作中，我们介绍了密集连接的时间卷积网络（DC-TCN），用于隔离单词的唇部阅读。尽管时间卷积网络（TCN）最近在许多视觉任务中都表现出巨大的潜力，但其接受场的密度不足以模拟唇部阅读场景中的复杂时间动态。为了解决这个问题，我们将密集的连接引入网络，以捕获更强大的时间功能 ...

0 0 0 0 2025/06/29 arXiv:2009.14233v3 瞢闇

STAIR: Improving Safety Alignment with Introspective Reasoning

确保大语言模型（LLM）的安全性和无害性与在应用中的性能一样至关重要。但是，现有的安全一致性方法通常会遭受安全性绩效权衡和对越狱攻击的敏感性，这主要是由于它们依靠直接拒绝恶意查询的依赖。在本文中，我们提出了楼梯，这是一个新颖的框架，将安全一致性与Itrospective推理相结合 ...

0 0 0 0 2025/06/29 arXiv:2502.02384v1 brave