一译 —— 文档和论文翻译、对照阅读、讨论和社区

REFOL: Resource-Efficient Federated Online Learning for Traffic Flow Forecasting

提出了多种联合学习（FL）方法，以避免因集中式方法中披露原始数据而引起的重型交易和隐私诱发问题。但是，这些FL方法采用离线学习，当概念漂移发生时，即可能会产生低于标准的表现，即 ...

0 0 0 2025/05/19 arXiv:2411.14046v1 ifzz

AI Agents vs. Agentic AI: A Conceptual Taxonomy, Applications and Challenge

这项研究对AI代理和代理AI进行了严格的区分，提供了结构化的概念分类法，应用映射和挑战分析，以阐明其不同的设计理念和能力。我们首先概述搜索策略和基础定义，将AI代理描述为由大语言模型（LLMS）和大型图像模型（LIM）驱动的模块化系统，用于狭窄，特定于任务的自动化。生成的AI被定位为前体，AI代理通过工具集成，及时的工程和推理增强来推进 ...

0 0 5 2025/05/19 arXiv:2505.10468v1 hwrabbit

Maintaining Structural Integrity in Parameter Spaces for Parameter Efficient Fine-tuning

在人工智能中，适应各种下游任务的预先训练的基础模型已经普遍存在。由于大量任务和高成本，调整所有参数变得不可行。为了减轻这种情况，已经开发了几种微调技术来以更高的资源有效的方式更新预训练的模型权重，例如通过低级调整 ...

0 0 0 2025/05/19 arXiv:2405.14739v2 尼斯湖

PRIMA.CPP: Speeding Up 70B-Scale LLM Inference on Low-Resource Everyday Home Clusters

DeepSeek R1和QWQ 32B的紧急情况因在家用设备上运行Frontier大语言模型（LLM）的性能障碍而破坏了。尽管消费者硬件越来越强，并且模型量化正在改善，但现有的终端解决方案仍然需要GPU群集，大型RAM/VRAM和高带宽，远远超出了常见的家庭群集可以处理的。本文介绍了此HTTP URL，这是一种分布式推理系统，使用CPU/GPU，Low RAM/VRAM，WI-FI和跨平台支持的混 ...

0 0 0 2025/05/19 arXiv:2504.08791v1 yli

Online Learning under Haphazard Input Conditions: A Comprehensive Review and Analysis

在线学习的领域由于其在现实生活中的盛行而经历了多方面的扩展。尽管如此，该进程仍在流媒体数据的输入特征空间保持恒定的假设下进行。在本调查文件中，我们在随意输入的背景下讨论了在线学习的主题，并明确说明了这样的假设 ...

0 0 0 2025/05/19 arXiv:2404.04903v1 ifzz

Optimizing LLM Inference: Fluid-Guided Online Scheduling with Memory Constraints

大型语言模型（LLMS）在当今的应用中是必不可少的，但是它们的推理过程 - 通过在细分市场中处理文本以及使用内存繁重的键值（KV）缓存来产生响应 - 需要大量的计算资源，尤其是在内存约束下。本文将LLM推论优化作为多阶段的在线调度问题，其中顺序提示到达和KV高速缓存增长使传统的调度无效。我们开发出流体动力学近似，以提供可拖动的基准测试，以指导算法设计 ...

0 0 0 2025/05/19 arXiv:2504.11320v1 yli

Full Stack Optimization of Transformer Inference: a Survey

最新的DNN体系结构设计的最新进展一直在朝着 Transformer 模型发展。这些模型在广泛的应用中具有卓越的精度。自从最初引入 Transformer 模型以来，在过去的几年中，这种趋势一直保持一致 ...

0 0 0 2025/05/19 arXiv:2302.14017v1 hellogdc

Hardware Acceleration of LLMs: A comprehensive survey and comparison

大型语言模型（LLM）已成为自然语言处理任务的强大工具，并以其理解和产生类似人类的文本的能力彻底改变了领域。在本文中，我们对使用硬件加速器的大型语言模型的 Transformer 网络加速进行了多项研究工作进行了全面的调查。该调查介绍了已提出的框架，然后对技术，处理平台（FPGA，ASIC，内存，GPU），加速，能源效率，性能（GOPS）和能源效率（GOPS）和能源效率（GOPS/W）进行定性和定 ...

0 0 0 2025/05/19 arXiv:2409.03384v1 hellogdc

来一起翻译吧！

为了您和其他读者获得更好的阅读体验，请您勇敢地改进翻译，特别是一些显而易见的机器翻译错误。

虽然我们追求卓越，但我们并不要求翻译十全十美，因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译，您不必担心会因为您的失误导致无法挽回的破坏。（改编自维基百科）