在这项工作中,我们评估了LLM在各种任务和数据大小上的优化功能。这些任务中的每一个都对应于唯一的优化域,而LLMS必须通过交互式提示执行这些任务。也就是说,在每个优化步骤中,LLM都会从过去生成的解决方案中生成新的解决方案,然后在下一个优化步骤中评估和考虑新的解决方案 ...
0 0 0 2025/04/22 arXiv:2310.05204v3 GiveYouAFIst
准确的城市时空预测(USTP)对于智能城市的发展和运营非常重要。作为一个新兴的构建块,多源的城市数据通常被整合为城市知识图(URBANKGS),以为城市时空预测模型提供关键知识。但是,现有的Urbankgs通常是针对特定的下游预测任务量身定制的,并且不公开可用,这限制了潜在的进步 ...
0 0 0 2025/04/22 arXiv:2306.11443v2 绿毛龟
引入了低复杂性8点正交近似DCT。提出的转换不需要乘法或位移动操作。派生的快速算法仅需要14个添加,小于任何现有的DCT近似 ...
0 0 0 2025/04/22 arXiv:1702.00817v1 lcaiwen
最近,大型推理模型(LRMS)(例如DeepSeek-R1)的推理能力通过缓慢的思考过程看到了显着的进步。尽管取得了这些成就,但LRM的大量计算需求带来了巨大的挑战。相反,与LRMS相比,通常从较大的推理模型(SRMS)(SRMS)提供了更高的效率,并且可以表现出独特的功能和认知轨迹 ...
0 0 0 2025/04/22 arXiv:2504.09100v1 zhuangxialie
Self-driving vehicles are a maturing technology with the potential to reshape mobility by enhancing the safety, accessibility, efficiency, and convenience of automotive transportation. Safety-critical ...
0 0 0 2025/04/22 arXiv:1604.07446v1 lcaiwen
文档结构化提取(DSE)旨在从原始文档中提取结构化内容。尽管出现了许多DSE系统,但他们的统一评估仍然不足,这极大地阻碍了该领域的进步。这个问题主要归因于现有的基准范式,这些基准范式表现出碎片和局部特征 ...
0 0 0 2025/04/22 arXiv:2409.05137v2 mulanshine1
受限的解码,一种用于在语言模型输出上强制约束的技术,提供了一种控制文本生成的方法,而无需重新训练或建筑修改。但是,它的应用程序通常仅限于使用户访问下一言发行的模型(通常是通过SoftMax Logits),这对Blackbox大语言模型(LLMS)构成了限制。本文介绍了素描引导的约束解码(SGCD),这是一种针对BlackBox LLM的约束解码的新方法,该方法无需访问BlackBox LLM的逻 ...
0 0 0 2025/04/22 arXiv:2401.09967v4 yux
 Transformer 架构在各种模型中占主导地位。作为 Transformer 的核心,注意力的计算复杂度为 O(N^2),而线性变换的计算复杂度为 O(N)。当处理大序列长度时,注意力成为主要耗时的组成部分 ...
0 0 0 2025/04/22 arXiv:2410.02367v5 daoxian

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您勇敢地改进翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)