深入加强学习(DRL)已成为流量信号控制(TSC)的流行方法,因为它能够从复杂的交通环境中学习自适应策略。在基于DRL的TSC方法中,两个主要控制范式是``选择阶段''和``switch''策略。尽管选择阶段范式中的代理会自适应地选择下一个活动相,但该范式可能会导致驾驶员的意外相位序列,从而破坏他们的预期并可能损害交叉点的安全性 ...
大型语言模型(LLM)的出现对各个领域产生了重大影响,从自然语言处理到医学和金融等领域。然而,尽管 LLM 迅速普及,但其在电信领域的应用仍然有限,通常依赖于缺乏特定领域专业化的通用模型。这种专业化的缺乏导致表现不佳,特别是在处理电信特定技术术语及其相关数学表示时 ...
计算机中的SRAM体系结构为在一系列数据密集型应用程序中实现更高的性能和能源效率提供了一种有希望的方法。但是,先前的评估很大程度上取决于模拟器或小型原型,从而限制了对其现实世界潜力的理解。在这项工作中,我们在现实的工作负载下介绍了商业计算机设备GSI APU的全面性能和能量表征 ...
Spotify的主页具有多种内容类型,包括音乐,播客和有声读物。但是,历史数据倾向于音乐,这使得提供平衡和个性化的内容组合变得具有挑战性。此外,用户对不同内容类型的偏好可能会有所不同,具体取决于一天中的时间,一周中的一天,甚至他们使用的设备 ...
随着多模式大语言模型(MLLM)的快速发展,它们越来越多地部署为能够完成复杂计算机任务的自动计算机使用代理。但是,出现了一个紧迫的问题:在对话方案中为一般MLLM设计和对齐的安全风险原则是否可以有效地转移到现实世界中的计算机使用方案中?现有关于评估基于MLLM的计算机使用代理的安全风险的研究遭受了几个局限性:它缺乏现实的交互式环境,或者狭义地关注一种或几种特定的风险类型。这些局限性忽略了现实环境的 ...
主题到视频(S2V)的一代旨在创建忠实地纳入参考内容的视频,从而在视频的制作中增强了灵活性。为了建立S2V生成的基础架构,我们提出了OpenS2V-Nexus,由(i)Opens2V-Eval,细粒基准和(ii)OpenS2V-5M,一个百万级数据集组成。与从VBENCH继承的现有S2V基准相反,该基准的重点是对产生的视频的全球和粗粒度评估,OpenS2V-Eval着重于该模型生成具有自然主题外观 ...
专家混合(MOE)模型的最新进展已显着提高了其参数量表和模型性能。已经提出了广泛的卸载技术来解决MOE推理的GPU内存限制。但是,由于I/O瓶颈和MOE型号的稀疏计算,现有的卸载技术仍然患有低硬件利用率 ...
现代搜索系统在促进信息获取方面起着至关重要的作用。传统的搜索引擎通常依靠级联的体系结构,在该体系结构中,通过召回,预先排名和排名阶段检索结果。设计和维护多个模块的复杂性使得难以实现整体性能提高 ...