端到端的自主驾驶通过将感知,预测和计划整合到一个完全可区分的框架中,取得了显着的进步。但是,为了充分发挥其潜力,有效的在线轨迹评估是必不可少的,以确保安全。通过预测给定轨迹的未来结果,轨迹评估变得更加有效 ...
0 0 0 2025/09/18 arXiv:2504.01941v2 313563
大型语言模型(LLM)工作负载具有不同的预填充和解码阶段,具有不同的计算和内存要求,理想情况下应在集群中的不同LLM实例上安排输入查询时。但是,现有的调度算法将LLM的工作负载视为整体工作,而无需考虑每个工作负载中两个阶段的独特特征。这导致了次优的调度和增加的响应延迟 ...
0 0 0 2025/09/18 arXiv:2408.13510v2 Buladuo
我们提出了SpiralMLP,这是一种新型的架构,它引入了螺旋FC层,以替代常规 Token 混合方法。与几种主要强调轴的现有基于MLP的模型不同,我们的螺旋FC层被设计为具有螺旋状偏移的可变形卷积层。我们进一步将螺旋FC调整为两个变体:自动型FC和交叉刺激FC,它们可以无缝进行本地和全局特征集成,从而消除了对其他处理步骤的需求 ...
0 0 0 2025/09/18 arXiv:2404.00648v2 SGN001
我们提出RESMLP,这是一种完全基于用于图像分类的多层感知器。这是一个简单的残差网络,交替(i)一个线性层,其中图像贴片在跨通道上独立且相同的相同相互作用,以及(ii)两层馈电网络,其中通道每个贴片独立相互作用。当使用重大数据启发并选择蒸馏的现代培训策略培训时,它在ImageNet上取得了令人惊讶的良好精度/复杂性权衡 ...
0 0 0 2025/09/18 arXiv:2105.03404v2 SGN001
 Token 交互操作是基于MLP的模型中的核心模块之一,用于在不同的空间位置之间交换和汇总信息。但是,在空间维度上的 Token 相互作用的功能高度取决于特征图的空间分辨率,这限制了模型的表现能力,尤其是在将特征下采样至小空间尺寸的深层中。为了解决这个问题,我们提出了一种称为\ textbf {strip-mlp}的新颖方法,以三种方式丰富 Token 交互功率 ...
0 0 0 2025/09/18 arXiv:2307.11458v1 SGN001
我们介绍了自制的扩散模型(HDM),这是一种高效但功能强大的文本对图像扩散模型,可针对消费级硬件进行训练(和推断)。 HDM可实现竞争激烈的1024x1024发电质量,同时使用四种RTX5090 GPU保持较低的培训成本为535-620美元,与传统方法相比,计算需求的显着降低。我们的主要贡献包括:(1)新型的U形 Transformer ,跨u-transformer(XUT),使用跨注意来进行跳 ...
0 0 0 2025/09/18 arXiv:2509.06068v1 CJY1018
在空间智能中取得了重大进展,涵盖了空间重建和世界探索。但是,当前模型的可伸缩性和现实忠诚度仍然受到大规模高质量培训数据的稀缺性的严重限制。虽然几个数据集提供相机姿势信息,但它们的规模,多样性和注释丰富度通常受到限制,尤其是对于现实世界中的动态场景,地面真相相机运动 ...
0 0 0 2025/09/18 arXiv:2509.09676v1 KingXHJ
时间序列分析(TSA)的基础模型引起了极大的关注。但是,诸如数据稀缺和数据失衡之类的挑战继续阻碍他们的发展。为了解决这个问题,我们考虑通过用作时间序列的语义描述符的符号表达式对复杂系统进行建模 ...
0 0 0 2025/09/18 arXiv:2502.15466v1 HeiHuZi

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您勇敢地改进翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)