一译 —— 文档和论文翻译、对照阅读、讨论和社区

DB-GPT-Hub: Towards Open Benchmarking Text-to-SQL Empowered by Large Language Models

大型语言模型（llm）成为文本转sql llm sql方法通常分为基于提示的方法和调整方法。与基于提示的方法相比，对文本到sql的llm进行基准测试很重要，但尚未得到充分探索，部分原因是计算成本过高，部分原因是计算成本过高... ...

0 0 0 2025/04/08 arXiv:2406.11434v1 tonylaobai

From "Hallucination" to "Suture": Insights from Language Philosophy to Enhance Large Language Models

本文通过语言哲学和精神分析的角度探讨了大语言模型（LLM）中的幻觉现象。通过将Lacan的“指示符链”和“缝合点”的概念结合在一起，我们提出了锚固窗格框架，作为减轻幻觉的新方法。与对反复试验实验的主要依赖，数学公式的持续调整或强调质量量高于质量的资源密集型方法的主要依赖相反，我们的方法回到了语言学的基本原理，以分析LLMS幻觉的根本原因 ...

0 0 0 2025/04/08 arXiv:2503.14392v1 18232448525

CHARMS: Cognitive Hierarchical Agent with Reasoning and Motion Styles

为了解决自动驾驶模拟方案中低智力和简单车辆行为建模的当前挑战，本文提出了具有推理和运动样式（CHARMS）的认知层次结构代理。该模型可以推理其他车辆（如人类驾驶员）的行为，并以不同的决策方式做出反应，从而在驾驶场景中提高周围车辆的智力和多样性。通过介绍级别的K行为游戏理论，本文对人类驱动因素的决策过程进行了建模，并采用了深入的强化学习来以各种决策方式训练模型，从而模拟了不同的推理方法和行为特征 . ...

0 0 0 2025/04/08 arXiv:2504.02450v1 布朗瓶

Cross-View Image Set Geo-Localization

跨视图地理定位（CVGL）已被广泛应用于机器人导航和增强现实等领域。现有方法主要使用单个图像或固定视图图像序列作为查询，从而限制了透视多样性。相比之下，当人类从视觉上确定自己的位置时，他们通常四处走动以收集多种观点 ...

0 0 0 2025/04/08 arXiv:2412.18852v1 hobefrank

OpenCodeReasoning: Advancing Data Distillation for Competitive Coding

自从基于推理的大语言模型的出现以来，许多人从将推理能力提炼到学生模型中取得了巨大的成功。这些技术在编码任务上已经显着弥合了推理和标准LLM之间的差距。尽管如此，蒸馏推理模型的许多进展仍然锁定在专有数据集后面，或者缺乏有关数据策展，过滤和随后培训的细节 ...

0 0 0 2025/04/08 arXiv:2504.01943v1 盛大的2

ClearSight: Visual Signal Enhancement for Object Hallucination Mitigation in Multimodal Large language Models

对比解码策略被广泛用于减轻多模式大语模型（MLLM）中的对象幻觉。通过减少对语言先验的过度依赖，这些策略确保生成的内容保持在视觉输入中，从而产生上下文准确的输出。由于对比度解码不需要其他培训或外部工具，因此它既具有计算效率又具有多功能性，从而使其具有很高的吸引力 ...

0 0 0 2025/04/08 arXiv:2503.13107v1 18232448525

Advancing Semantic Caching for LLMs with Domain-Specific Embeddings and Synthetic Data

该报告通过采用专业的，微调的嵌入模型来研究增强语义缓存效果。语义缓存依赖于嵌入相似性而不是确切的关键匹配，这在平衡精度，查询延迟和计算效率方面带来了独特的挑战。我们建议利用较小的域特异性嵌入模型，并通过目标现实世界和合成生成的数据集进行了微调 ...

0 0 0 2025/04/08 arXiv:2504.02268v1 盛大的2

FG$^2$: Fine-Grained Cross-View Localization by Fine-Grained Feature Matching

我们提出了一种新型的细粒跨视图定位方法，该方法通过在两个图像之间匹配细粒度的细粒特征，估算周围环境中地面图像的3个自由度姿势。姿势是通过对齐从地面图像产生的点平面与从空中图像采样的点平面来估计的。为了生成接地点，我们首先将地面图像特征映射到3D点云 ...

0 0 0 2025/04/08 arXiv:2503.18725v1 hobefrank

来一起翻译吧！

为了您和其他读者获得更好的阅读体验，请您勇敢地改进翻译，特别是一些显而易见的机器翻译错误。

虽然我们追求卓越，但我们并不要求翻译十全十美，因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译，您不必担心会因为您的失误导致无法挽回的破坏。（改编自维基百科）