sealaes的文档

Data Shapley in One Training Run

数据Shapley提供了一个原则上的框架，用于将数据贡献归因于机器学习环境。但是，现有的方法需要对不同数据子集进行重新训练模型，这在计算密集型集中取消了其对大规模模型的应用。此外，它们为通过运行学习算法产生的任何模型产生相同的归因分数，这意味着他们无法对从算法的单个运行中获得的特定模型执行有针对性的归因 ...

0 0 0 0 2025/04/29 arXiv:2406.11011v2 sealaes

Paper2Code: Automating Code Generation from Scientific Papers in Machine Learning

尽管机器学习研究的迅速增长，但相应的代码实施通常无法实现，这使研究人员重现结果并在先前的工作基础上进行劳动密集型。同时，最近的大型语言模型（LLMS）在了解科学文档并生成高质量代码方面表现出色。受此启发的启发，我们介绍了PaperCoder，这是一个多代理LLM框架，将机器学习论文转换为功能代码存储库 ...

0 0 0 0 2025/04/27 arXiv:2504.17192v1 sealaes

Non-obvious Manipulability in Hedonic Games with Friends Appreciation Preferences

在本文中，我们在享乐游戏（HGS）的背景下，以朋友的欣赏（FA）偏好研究了一种轻松的策略性操纵性（NOM）。在HGS中，目的是根据他们的偏好将代理人分为联盟，这完全取决于他们被分配的联盟。在FA偏好下，代理商考虑了任何其他代理人，无论是朋友还是敌人，都更喜欢与更多朋友的联盟，如果有联系，那些敌人的敌人较少 ...

0 0 0 0 2025/03/14 arXiv:2501.00976v1 sealaes

Audio-Reasoner: Improving Reasoning Capability in Large Audio Language Models

多模式推理的最新进展在很大程度上忽略了音频方式。我们介绍了Audio-Reasoner，这是一种大规模的音频语言模型，用于在音频任务中进行深入推理。我们精心策划了具有简单注释的大规模和多样化的多任务音频数据集 ...

0 0 0 0 2025/03/09 arXiv:2503.02318v1 sealaes

KBQA-o1: Agentic Knowledge Base Question Answering with Monte Carlo Tree Search

知识基础问题回答（KBQA）旨在用大规模的结构化知识库（KB）回答自然语言问题。尽管有大型语言模型（LLMS）的进步，KBQA仍然面临KB意识，有效性和效率之间的不平衡以及对注释数据的高度依赖的挑战。为了应对这些挑战，我们提出了KBQA-O1，这是一种具有蒙特卡洛树搜索（MCTS）的新型代理KBQA方法 ...

0 0 1 2 2025/03/09 arXiv:2501.18922v1 sealaes

Towards Thinking-Optimal Scaling of Test-Time Compute for LLM Reasoning

最近的研究表明，使模型花费更多的时间通过更长的思想链（COT）进行思考，从而使其能够在复杂的推理任务中获得重大改进。尽管当前的研究继续通过扩展大型语言模型（LLMS）的COT长度来探索增加测试时间计算的好处，但我们担心当前追求测试时间扩展的潜在问题：过度扩展COT实际上会给模型的推理绩效带来不利影响吗？我们对数学推理任务的探索揭示了一个意外的发现，即使用更长的COTS缩放确实会损害某些域中LLM的推理性能。此外，我们发现存在最佳的缩放长度分布，在不同的域之间有所不同 ...

0 0 0 0 2025/03/07 arXiv:2502.18080v1 sealaes

Chain of Draft: Thinking Faster by Writing Less

大型语言模型（LLMS）在通过诸如Thebough（COT）提示之类的机制来解决复杂的推理任务方面表现出了显着的性能，该机制强调了详细的，逐步的推理。但是，人类通常采用更有效的策略：起草简洁的中间思想，只捕获基本信息。在这项工作中，我们提出了草稿链（COD），这是一种受人类认知过程启发的新型范式，在该过程中，LLMS在解决任务时会产生简约但内容丰富的中间推理输出 ...

0 0 0 0 2025/03/04 arXiv:2502.18600v2 sealaes

A Survey on Multimodal Recommender Systems: Recent Advances and Future Directions

从互联网上快速扩展的信息中获取有价值的数据已成为一个重大问题，并且推荐系统已成为一种广泛使用且有效的工具，可帮助用户发现感兴趣的项目。推荐系统的本质在于它们能够预测用户评级或各种项目的偏好，并随后根据历史互动数据和公开可用信息推荐最相关的评分。随着多种多媒体服务的出现，包括文本，图像，视频和音频，人类可以通过多种方式感知世界 ...

0 1 0 0 2025/03/01 arXiv:2502.15711v1 sealaes