arxiv的文档

arxiv 南京

个性签名 ...

ROCA: Robust CAD Model Retrieval and Alignment from a Single Image

我们提出了ROCA，这是一种新型的端到端方法，可将3D CAD模型从形状数据库中检索和对齐到单个输入图像。这使得从2D RGB观察中对观察到的场景进行3D感知，其特征是轻巧，紧凑，干净的CAD表示。我们方法的核心是基于密集的2d-3d对象对应关系并对齐对齐的可微分对齐优化 ...

0 0 0 0 2025/07/16 arXiv:2112.01988v2 wonglliam

Mixture-of-Recursions: Learning Dynamic Recursive Depths for Adaptive Token-Level Computation

缩放语言模型可以解锁令人印象深刻的功能，但是随附的计算和记忆需求使培训和部署既昂贵。现有的效率努力通常针对参数共享或自适应计算，从而打开了如何同时获得两者的问题。我们介绍了回归（MOR）的混合物，这是一个统一的框架，结合了单个递归 Transformer 内部的两个效率轴 ...

0 0 0 0 2025/07/16 arXiv:2507.10524v1 xubiao

PersonaLens: A Benchmark for Personalization Evaluation in Conversational AI Assistants

大型语言模型（LLMS）具有高级对话的AI助手。但是，有系统地评估这些助手的应用个性化的能力 - 在完成任务时适应了个人用户的偏好 - 怪物具有挑战性。现有的个性化基准专注于聊天，非转换任务或狭窄的域，未能捕获个性化任务辅助的复杂性 ...

0 0 0 0 2025/07/16 arXiv:2506.09902v1 ly123456

EVOLvE: Evaluating and Optimizing LLMs For In-Context Exploration

尽管在许多领域中取得了成功，但在需要不确定的最佳决策的情况下，大型语言模型（LLM）仍未研究。这至关重要，因为许多现实世界的应用程序，从个性化建议到医疗干预措施，要求LLM不仅可以预测，而且还积极学会通过探索来做出最佳决策。在这项工作中，我们测量了LLMS（IN）在匪徒中做出最佳决策的能力，这是一种与许多应用程序相关的州的无国务强化学习设置 ...

0 0 0 0 2025/07/16 arXiv:2410.06238v2 rongyu

Training a Generally Curious Agent

有效的探索对于与环境相互作用的智能系统至关重要，但是现有的语言模型通常在需要战略信息收集的情况下不足。在本文中，我们提出了一种微调方法，它使语言模型能够开发不限于特定环境的一般决策能力。通过培训来自需要各种策略的不同任务的合成互动数据，Paprika教授模型以基于环境反馈在信中的新任务上探索和调整其行为，而无需更新 ...

0 0 0 0 2025/07/16 arXiv:2502.17543v3 rongyu

SMART: Self-Aware Agent for Tool Overuse Mitigation

当前的大型语言模型（LLM）代理表现出强大的推理和工具使用功能，但通常缺乏自我意识，无法有效地平衡这些方法。这种不平衡会导致工具过度使用，在该工具中，模型不必要地依靠外部工具来使用参数知识来解决的任务，从而增加了计算开销。受到人类元认知的启发，我们引入了Smart（使用工具的战略模型感知推理），该范式增强了代理商的自我意识，以优化任务处理并减少工具过度使用 ...

0 0 0 0 2025/07/16 arXiv:2502.11435v2 Cantaloupe

CycleResearcher: Improving Automated Research via Automated Review

科学发现的自动化一直是研究界的长期目标，这是在加速知识创造的潜力的推动下。尽管使用商业大型语言模型（LLM）作为研究助理或想法生成器取得了重大进展，但使用开源LLMS自动化整个研究过程的可能性仍然很大程度上尚未开发。本文探讨了使用开源后培训后的LLM作为能够执行自动研究和审查的整个周期的自主剂，从文献审查和手稿准备到同行评审和纸质细化 ...

0 0 0 0 2025/07/16 arXiv:2411.00816v3 ly123456

SQLord: A Robust Enterprise Text-to-SQL Solution via Reverse Data Generation and Workflow Decomposition

将自然语言转换为SQL查询（NL2SQL）对于数据驱动的业务应用程序至关重要。现有的框架在开源数据集中受过培训，与复杂的业务逻辑挣扎，并且缺乏针对域特异性数据进行微调。此外，评估方法通常需要带注释的数据和可执行数据库环境，这些数据在现实世界中很少 ...

0 0 0 0 2025/07/16 arXiv:2507.10629v1 18916369915

Enhancing Few-Shot Stock Trend Prediction with Large Language Models

股票趋势预测的目标是预测未来的市场变动，以了解明智的投资决策。现有方法主要集中于通过接受大量注释数据训练的有监督模型来预测股票趋势。但是，人类注释可能是资源密集的，并且注释数据不容易获得 ...

0 0 0 0 2025/07/16 arXiv:2407.09003v1 yang1young

Towards Fast Multilingual LLM Inference: Speculative Decoding and Specialized Drafters

大型语言模型（LLM）彻底改变了自然语言处理，并扩大了其在各种商业应用中的适用性。但是，这些模型的部署受多语言设置中的高推理时间的限制。为了缓解这一挑战，本文探讨了投机解码助理模型的培训配方，该模型被利用来起草，然后由Target LLM验证其未来 Token ...

0 0 0 0 2025/07/16 arXiv:2406.16758v2 Willow