arxiv的文档

arxiv 南京

个性签名 ...

Analyzing Key Objectives in Human-to-Robot Retargeting for Dexterous Manipulation

运动学从人的手到机器人手的重新定位对于将敏捷从人类转移到操纵性和模仿学习中的机器人至关重要。但是，由于人体和机器人手之间的机械差异，不可能在机器人手上完全繁殖人的运动。重新定位的现有作品结合了各种优化目标，重点是手部配置的各个方面 ...

0 0 0 0 2025/06/24 arXiv:2506.09384v1 wchiyu98

Reformulation for Pretraining Data Augmentation

尽管大型语言模型在各种任务中具有令人印象深刻的能力，但它们的持续扩展不仅受到数据稀缺性的严重阻碍，而且还受到与培训期间与数据重复过多相关的绩效降低的影响。为了克服这种关键的瓶颈，我们提出了大规模的体裁理解方法（MGA）重新制定方法，这是一种受合成数据方法启发的轻巧且可扩展的增强技术。 MGA系统地将现有的语料库重新制定为多种多样的，富有上下文的变化，以减轻重复的负面影响，我们在这项工作中介绍了这种方法以及由此产生的7700亿个 Token mgacorpus ...

0 0 0 0 2025/06/24 arXiv:2502.04235v2 aaaa1

R.I.P.: Better Models by Survival of the Fittest Prompts

培训数据质量是最终模型质量的最重要驱动力之一。在这项工作中，我们介绍了一种基于低质量输入提示会导致高方差和低质量响应的假设来评估数据完整性的方法。这是通过衡量被拒绝的响应质量以及所选偏好对之间的奖励差距来实现的 ...

0 0 0 0 2025/06/24 arXiv:2501.18578v2 ymx

VGGT-SLAM: Dense RGB SLAM Optimized on the SL(4) Manifold

我们提出了VGGT-SLAM，这是一种密集的RGB SLAM系统，该系统是通过仅使用未校准的单眼摄像机从馈电场景重建方法逐渐和全球对齐的子构建的。相关作品使用相似性变换对齐子链扣（即 ...

0 0 0 0 2025/06/24 arXiv:2505.12549v2 kenshinx

Towards Robust Overlapping Speech Detection: A Speaker-Aware Progressive Approach Using WavLM

重叠的语音检测（OSD）旨在确定多个演讲者在对话中重叠的区域，这是多方语音处理中的关键挑战。这项工作提出了一种说话者感知的渐进式OSD模型，该模型利用渐进式培训策略来增强子任务之间的相关性，例如语音活动检测（VAD）和重叠检测。为了改善声学表示，我们探讨了最先进的自我监督学习（SSL）模型（包括WAVLM和WAV2VEC 2）的有效性 ...

0 0 0 0 2025/06/24 arXiv:2505.23207v1 zhangqi33

StruQ: Defending Against Prompt Injection with Structured Queries

大型语言模型（LLMS）的最新进展启用了令人兴奋的LLM集成应用程序，该应用程序通过利用其先进的语言理解能力来执行基于文本的任务。但是，随着LLM的改善，对它们的攻击也是如此。提示注射攻击是一个重要的威胁：它们欺骗模型与原始应用程序的说明偏离，而是遵循用户指令 ...

0 0 1 1 2025/06/24 arXiv:2402.06363v2 0x211

AutoSDT: Scaling Data-Driven Discovery Tasks Toward Open Co-Scientists

尽管长期以来与AI加速科学发现方面的努力，但由于有限的培训和评估数据有限，建立AI共同科学家仍然具有挑战性。为了解决此数据稀缺问题，我们提出AutoSDT，这是一种自动管道，该管道在现实世界中数据驱动的发现工作流中收集高质量的编码任务。 AutoSDT利用LLMS的编码功能和参数知识来搜索各种来源，选择生态上有效的任务并合成准确的任务指令和代码解决方案 ...

0 0 0 0 2025/06/24 arXiv:2506.08140v1 algcd

BASE-Q: Bias and Asymmetric Scaling Enhanced Rotational Quantization for Large Language Models

通过有效平滑权重和激活中的异常值，旋转对于大语言模型（LLM）的最新量化管道至关重要。但是，进一步优化旋转参数仅提供有限的性能增长并引入了重要的训练开销：由于旋转参数共享，必须同时加载全模型以实现反向传播，从而导致大量的记忆消耗和有限的实用性。在这项工作中，我们确定了当前旋转量化方法的两个基本局限性：（i）旋转无法使通道平均值对齐，从而导致更大的量化范围和增加的舍入误差；（ii）旋转使激活分布更类似高斯，从而增加了由剪辑误差引起的能量损失 ...

0 0 0 0 2025/06/24 arXiv:2506.15689v1 felixslu

Mitigating the Impact of Outlier Channels for Language Model Quantization with Activation Regularization

我们考虑了语言模型准确量化的问题，在该语言模型中，每个参数的权重和激活都均匀地量化为4位，这是GPU硬件在本质上支持的最低位宽度格式。在这种情况下，关键的挑战是激活量化：众所周知，语言模型包含的离群通道平均比其他通道高的数量级高，从而阻止了使用已知技术的准确的低位宽度量化。我们系统地研究了这种现象，发现这些异常通道在训练的早期就出现，并且它们在残留流的层中更频繁地发生 ...

0 0 0 0 2025/06/24 arXiv:2404.03605v2 Daenerays

Talent vs Luck: the role of randomness in success and failure

高度竞争的西方文化的主要主权范式源于这样的信念，即成功主要是归功于人才，智慧，技能，努力或冒险的个人特质，即使不是完全归功于个人素质。有时，我们愿意承认，一定程度的运气也可以在取得巨大的物质成功中发挥作用。但是，实际上，低估外部力量在个体成功的故事中的重要性是相当普遍的 ...

0 0 0 0 2025/06/23 arXiv:1802.07068v3 huaxin12345