一译 —— 文档和论文翻译、对照阅读、讨论和社区

RepoAudit: An Autonomous LLM-Agent for Repository-Level Code Auditing

代码审核是一个代码审核过程，目的是查找错误。大型语言模型（LLMS）在此任务中显示出很大的潜力，它提供了分析程序而无需汇编并在指定的提示后启用自定义的错误检测的能力。但是，将LLMS应用于存储库级代码审核带来了显着的挑战 ...

0 0 0 2025/04/21 arXiv:2501.18160v2 jiang

Boosting Large Language Model for Speech Synthesis: An Empirical Study

大型语言模型（LLM）在自然语言处理方面取得了重大进步，并同时将语言能力扩展到其他方式，例如语音和愿景。然而，以前的大多数工作都着重于提示具有听觉理解的感知能力的LLM，并且具有语音合成能力增强LLM的有效方法仍然模棱两可。在本文中，我们通过结合预先训练的LLM Llama/opt和文本到语音综合模型VALL-E来对增强LLM具有产生语音的能力进行全面的经验探索 ...

0 0 0 2025/04/21 arXiv:2401.00246v1 gubaobao

How new data permeates LLM knowledge and how to dilute it

大型语言模型通过基于梯度的更新的积累来学习和不断学习，但是各个新信息如何影响现有知识，导致有益的概括和有问题的幻觉，仍然对此知之甚少。我们证明，在学习新信息时，LLM会表现出“启动”效果：学习新事实可能会导致模型不适当地将知识应用于无关的环境中。为了系统地研究这一现象，我们介绍了一个经过精心策划的数据集的“ Overlandish”，该数据集是1320种不同的文本样本，旨在探究新知识如何通过LLM ...

0 0 0 2025/04/21 arXiv:2504.09522v1 takkeri

A Comprehensive Review of Spiking Neural Networks: Interpretation, Optimization, Efficiency, and Best Practices

生物神经网络继续激发神经网络性能的突破。然而，神经计算的关键领域在生物学上是合理的，节能的尖峰神经网络，其潜力对低功率，移动或其他硬件约束的设置特别有吸引力。我们介绍了尖峰神经网络的解释，优化，效率和准确性方面的最新发展文献综述 ...

0 0 0 2025/04/21 arXiv:2303.10780v2 打笨蛋

Balancing Continuous Pre-Training and Instruction Fine-Tuning: Optimizing Instruction-Following in LLMs

大型语言模型（LLMS）供公共使用，需要持续的预培训才能与最新数据保持最新。这些模型还需要通过特定的说明进行微调，以保持其准确遵循指示的能力。通常，LLMS分为两个版本：基本LLM，预先培训在不同的数据上，以及通过指令精制的LLM进行了培训，并接受了特定指令的培训，以提供更好的说明 ...

0 0 0 2025/04/21 arXiv:2410.10739v1 beiya

Universal NER: A Gold-Standard Multilingual Named Entity Recognition Benchmark

我们介绍了一个开放的社区驱动项目Universal Ner（Universe Ner）（Universe Ner），旨在以多种语言开发金标准的NER基准。 UNER的总体目标是提供高质量的交叉一致注释，以促进和标准化多语言NER研究。 UNER V1包含18个数据集，该数据集在12种不同语言的跨语言一致架构中使用命名实体 ...

0 0 0 2025/04/21 arXiv:2311.09122v3 cella

A Survey of Confidence Estimation and Calibration in Large Language Models

大型语言模型（LLM）在各个领域的各种任务中都表现出了出色的功能。尽管表现令人印象深刻，但由于几代人的事实错误，它们可能不可靠。评估他们的信心并在不同的任务中校准它们可以帮助减轻风险，并使LLM能够产生更好的世代 ...

0 0 0 2025/04/21 arXiv:2311.08298v2 cella

Knowledge Hierarchy Guided Biological-Medical Dataset Distillation for Domain LLM Training

大型语言模型（LLM）在生物医学应用中的快速发展突显了其潜力与有限规模的差距，并且通常较低的可用开源注释的文本数据集质量较低。此外，生物医学知识层次结构的固有复杂性极大地阻碍了这一HTTP URL LLM本身在克服这一限制方面起着关键作用？在这个问题的推动下，我们在目前调查了这一挑战，该HTTP URL提出了一个框架，该框架可自动化从广泛的科学文献中蒸馏出高质量的文本培训数据。我们的方法是自我评估 ...

0 0 0 2025/04/21 arXiv:2501.15108v1 algc

来一起翻译吧！

为了您和其他读者获得更好的阅读体验，请您勇敢地改进翻译，特别是一些显而易见的机器翻译错误。

虽然我们追求卓越，但我们并不要求翻译十全十美，因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译，您不必担心会因为您的失误导致无法挽回的破坏。（改编自维基百科）