一译 —— 文档和论文翻译、对照阅读、讨论和社区

DataStates-LLM: Lazy Asynchronous Checkpointing for Large Language Models

LLM在所有领域都迅速采用。他们需要在高端高性能计算（HPC）基础架构上进行培训，并摄入大量的输入数据。毫不奇怪，在如此大规模的意外事件中（e ...

0 0 0 2025/02/12 arXiv:2406.10707v1 henryhz

Discovering Language Model Behaviors with Model-Written Evaluations

随着语言模型（LMS）的规模，他们发展了许多新颖的行为，好与坏，加剧了评估其行为方式的需求。先前的工作会通过人群（耗时且昂贵）或现有数据源（并非总是可用的）进行评估。在这里，我们会自动使用LMS生成评估 ...

0 0 0 2025/02/12 arXiv:2212.09251v1 ck

The False Promise of Imitating Proprietary LLMs

廉价改善语言模型的一种新兴方法是将其列出来自更强大模型的输出，例如诸如Chatgpt（例如羊驼，自我教育等）等专有系统 ...

0 0 0 2025/02/12 arXiv:2305.15717v1 ck

Learning to Trust Your Feelings: Leveraging Self-awareness in LLMs for Hallucination Mitigation

llm）辨别和表达其内部知识状态的能力，llm可靠应用的关键因素。我们观察到llm对内部知识状态有很强的自我意识，知识探索的准确率超过85％就证明了这一点。然而，llm在生成过程中往往无法表达他们的内部知识，导致事实幻觉... ...

0 0 0 2025/02/12 arXiv:2401.15449v1 richardson

Frontier AI systems have surpassed the self-replicating red line

在没有人类援助的情况下，成功的自我复制是AI超越人类的重要步骤，并且是流氓AIS的早期信号。这就是为什么自我复制被广泛认为是边境AI系统的少数红线风险之一的原因。如今，领先的AI公司OpenAi和Google评估了他们的旗舰大语模型GPT-O1和Gemini Pro 1 ...

0 0 0 2025/02/12 arXiv:2412.12140v1 读个论文看看吧

On two-elementary K3 surfaces with finite automorphism group

我们研究了有限自动形态组的PICARD的复杂代数K3表面11、12和13，该组接受了雅各布省椭圆纤维，并具有一部分。我们证明，K3表面允许射射射击高度表面的同构同构，并以几何形式构建所有受支持的雅各布椭圆纤维的框架。我们确定了这些K3表面，偏振异常的所有平滑理性曲线的双图，以及每个帧中还原纤维的嵌入到相应的二元图中 ...

0 0 0 2025/02/12 arXiv:2206.00269v4 ck

Fine-tuning is Not Fine: Mitigating Backdoor Attacks in GNNs with Limited Clean Data

图形神经网络（GNN）通过其消息传播机制实现了出色的性能。但是，最近的研究强调了GNN对后门攻击的脆弱性，这可能导致该模型将图形错误分类为目标类别。最近有前途的防御技术（例如微调或蒸馏）的有效性在很大程度上取决于对足够的培训数据集的全面了解 ...

0 0 0 2025/02/12 arXiv:2501.05835v1 nininininin666

WaferLLM: A Wafer-Scale LLM Inference System

新兴的AI加速器越来越多地采用晶圆尺度的制造技术，将成千上万的AI内核整合到基于网格的架构中，具有较大的分布芯片内存（总GB）和超高的芯片记忆带宽（数十个（数十个） pb/s）。但是，针对GPU等共享内存体系结构进行了优化的当前LLM推理系统，无法完全利用这些加速器。我们介绍Waferllm，这是第一个晶圆级LLM推理系统 ...

0 0 0 2025/02/12 arXiv:2502.04563v1 jane88

来一起翻译吧！

为了您和其他读者获得更好的阅读体验，请您勇敢地改进翻译，特别是一些显而易见的机器翻译错误。

虽然我们追求卓越，但我们并不要求翻译十全十美，因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译，您不必担心会因为您的失误导致无法挽回的破坏。（改编自维基百科）