一译 —— 文档和论文翻译、对照阅读、讨论和社区

Towards Optimizing with Large Language Models

在这项工作中，我们评估了LLM在各种任务和数据大小上的优化功能。这些任务中的每一个都对应于唯一的优化域，而LLMS必须通过交互式提示执行这些任务。也就是说，在每个优化步骤中，LLM都会从过去生成的解决方案中生成新的解决方案，然后在下一个优化步骤中评估和考虑新的解决方案 ...

0 0 0 2025/04/22 arXiv:2310.05204v3 GiveYouAFIst

UUKG: Unified Urban Knowledge Graph Dataset for Urban Spatiotemporal Prediction

准确的城市时空预测（USTP）对于智能城市的发展和运营非常重要。作为一个新兴的构建块，多源的城市数据通常被整合为城市知识图（URBANKGS），以为城市时空预测模型提供关键知识。但是，现有的Urbankgs通常是针对特定的下游预测任务量身定制的，并且不公开可用，这限制了潜在的进步 ...

0 0 0 2025/04/22 arXiv:2306.11443v2 绿毛龟

DCT-like Transform for Image Compression Requires 14 Additions Only

引入了低复杂性8点正交近似DCT。提出的转换不需要乘法或位移动操作。派生的快速算法仅需要14个添加，小于任何现有的DCT近似 ...

0 0 0 2025/04/22 arXiv:1702.00817v1 lcaiwen

A Short Survey on Small Reasoning Models: Training, Inference, Applications and Research Directions

最近，大型推理模型（LRMS）（例如DeepSeek-R1）的推理能力通过缓慢的思考过程看到了显着的进步。尽管取得了这些成就，但LRM的大量计算需求带来了巨大的挑战。相反，与LRMS相比，通常从较大的推理模型（SRMS）（SRMS）提供了更高的效率，并且可以表现出独特的功能和认知轨迹 ...

0 0 0 2025/04/22 arXiv:2504.09100v1 zhuangxialie

A Survey of Motion Planning and Control Techniques for Self-driving Urban Vehicles

Self-driving vehicles are a maturing technology with the potential to reshape mobility by enhancing the safety, accessibility, efficiency, and convenience of automotive transportation. Safety-critical ...

0 0 0 2025/04/22 arXiv:1604.07446v1 lcaiwen

READoc: A Unified Benchmark for Realistic Document Structured Extraction

文档结构化提取（DSE）旨在从原始文档中提取结构化内容。尽管出现了许多DSE系统，但他们的统一评估仍然不足，这极大地阻碍了该领域的进步。这个问题主要归因于现有的基准范式，这些基准范式表现出碎片和局部特征 ...

0 0 0 2025/04/22 arXiv:2409.05137v2 mulanshine1

Sketch-Guided Constrained Decoding for Boosting Blackbox Large Language Models without Logit Access

受限的解码，一种用于在语言模型输出上强制约束的技术，提供了一种控制文本生成的方法，而无需重新训练或建筑修改。但是，它的应用程序通常仅限于使用户访问下一言发行的模型（通常是通过SoftMax Logits），这对Blackbox大语言模型（LLMS）构成了限制。本文介绍了素描引导的约束解码（SGCD），这是一种针对BlackBox LLM的约束解码的新方法，该方法无需访问BlackBox LLM的逻 ...

0 0 0 2025/04/22 arXiv:2401.09967v4 yux

SageAttention: Accurate 8-Bit Attention for Plug-and-play Inference Acceleration

 Transformer 架构在各种模型中占主导地位。作为 Transformer 的核心，注意力的计算复杂度为 O(N^2)，而线性变换的计算复杂度为 O(N)。当处理大序列长度时，注意力成为主要耗时的组成部分 ...

0 0 0 2025/04/22 arXiv:2410.02367v5 daoxian

来一起翻译吧！

为了您和其他读者获得更好的阅读体验，请您勇敢地改进翻译，特别是一些显而易见的机器翻译错误。

虽然我们追求卓越，但我们并不要求翻译十全十美，因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译，您不必担心会因为您的失误导致无法挽回的破坏。（改编自维基百科）