arxiv的文档

arxiv 南京

个性签名 ...

Self-Memory Alignment: Mitigating Factual Hallucinations with Generalized Improvement

大型语言模型（LLMS）通常很难使他们的回答与客观事实保持一致，从而导致事实幻觉问题，这可能很难在没有相关知识的情况下检测和误导用户。尽管已采用后培训技术来减轻问题，但现有方法通常会遭受不同能力的概括和权衡的差。在本文中，我们建议通过直接增强LLM精确利用其现有记忆的基本能力来解决它 - 从培训前数据中获得的知识 ...

0 0 0 0 2025/08/04 arXiv:2502.19127v2 yang99

QuestGen: Effectiveness of Question Generation Methods for Fact-Checking Applications

即使对人类，验证事实核对主张也构成了重大挑战。最近的方法表明，将主张分解为相关问题以收集证据提高了事实检查过程的效率。在本文中，我们提供了经验证据，表明这个问题分解可以有效地自动化 ...

0 0 0 0 2025/08/04 arXiv:2407.21441v2 yang99

Representation Learning of Limit Order Book: A Comprehensive Study and Benchmarking

限制订单簿（LOB）是金融市场的主要基本数据，它可以很好地看待市场动态，而由于其强大的自相关性，交叉功能限制和特征量表差异，因此在处理受人尊敬的深层模型方面构成了重大挑战。现有的方法通常以端到端的方式与特定的下游任务紧密地融合，未能单独和明确地分析学习的表示形式，从而限制了它们的可重复性和概括性。本文对LOB表示学习进行了第一个系统的比较研究，旨在确定提取可转移的紧凑特征的有效方法，以捕获基本的LOB特性 ...

0 0 0 0 2025/08/04 arXiv:2505.02139v1 wang123123

Dynamic Gaussian Marbles for Novel View Synthesis of Casual Monocular Videos

高斯裂缝已成为新颖视图合成的流行代表，在效率，光度质量和组成可食用性方面具有明显的优势。成功之后，许多作品将高斯人扩大到4D，表明动态的高斯人保持了这些好处，同时跟踪场景几何形状远胜于替代表示。但是，这些方法将密集的多视频视频作为监督 ...

0 0 0 0 2025/08/03 arXiv:2406.18717v2 小小卡拉米

R-Stitch: Dynamic Trajectory Stitching for Efficient Reasoning

通过思考链（COT）推理通过鼓励推理期间的逐步中间推理来增强大语言模型的问题解决能力。虽然有效，但COT由于依赖于长期 Token 序列的自回归解码而引入了实质性的计算开销。现有的加速策略要么通过早期停止或压缩奖励设计降低序列长度，要么通过较小的型号通过投机解码来提高解码速度 ...

0 0 0 0 2025/08/03 arXiv:2507.17307v2 Likeforeverx

The Free Will Equation: Quantum Field Analogies for AGI

传统上，人工通用情报（AGI）研究着重于确定性规则下针对特定目标优化的算法。然而，类似人类的智力表现出自适应的自发性 - 一种做出意外选择或自由决策的能力，而不是严格由过去的数据或立即奖励决定。这种特征通常在宽松的意义上被称为“自由意志”，可能对创造力，稳健的适应和避免解决问题的烦恼至关重要 ...

0 0 0 0 2025/08/03 arXiv:2507.14154v1 kkkk

Improving Generative Ad Text on Facebook using Reinforcement Learning

生成人工智能（AI），特别是大型语言模型（LLM），有望推动变革性的经济变化。 LLM在大量的文本数据上进行了预先培训，以学习通用语言模式，但是随后的训练后阶段对于将其与特定的现实世界任务保持一致至关重要。强化学习（RL）是领先的培训后技术，但其经济影响仍然很大程度上没有被倍增和未经量化 ...

0 0 0 0 2025/08/03 arXiv:2507.21983v1 rentian

Extracting Important Tokens in E-Commerce Queries with a Tag Interaction-Aware Transformer Model

任何电子商务搜索引擎的主要任务是检索最相关的库存项，这些库存项最适合查询中的用户意图。由于许多原因，包括模棱两可的查询，买方和卖方之间的词汇量不对，由于存在太多或太少的标记，这项任务是不平凡的。为了应对这些挑战，使用查询重新调整，该查询通过 Token 删除，替换或扩展修改了用户查询，目的是在查询 Token 和用户的搜索意图之间弥合语义差距 ...

0 0 0 0 2025/08/03 arXiv:2507.10385v1 rentian

OMS: On-the-fly, Multi-Objective, Self-Reflective Ad Keyword Generation via LLM Agent

赞助搜索广告中的关键字决定对于广告活动的成功至关重要。尽管基于LLM的方法提供自动关键字生成，但它们面临三个主要局限性：依赖大规模查询键单词对数据，缺乏在线多目标性能监视和优化以及关键字选择中的质量较弱。这些问题通过监视和推理关键绩效指标（例如印象，点击，转换和CTA效力）来阻碍LLM在完全自动化关键字决策中的代理使用 ...

0 0 0 0 2025/08/03 arXiv:2507.02353v1 rentian

CTR-Driven Ad Text Generation via Online Feedback Preference Optimization

广告文字在确定在线广告中的点击率（CTR）方面起着至关重要的作用。大型语言模型（LLMS）提供了与手动广告文本创建相比的效率优势。但是，LLM生成的广告文本与人工制作的文本相比不能保证更高的CTR性能，从而揭示了广告文本的发电质量和在线性能之间的差距 ...

0 1 0 0 2025/08/03 arXiv:2507.20227v2 rentian