早期退出是通过动态调整每个样本的执行层数量来提高预训练语言模型(PLM)推理效率的有效范式。但是,在大多数现有的作品中,每个分类器在培训过程中都均等地对待轻松而硬的样本,这忽略了测试时间的早期退出行为,从而导致训练和测试之间的不一致。尽管某些方法以固定的加速比率解决了这个问题,但是在保持训练和测试之间保持一致性的同时,挑战仍然不足 ...
通常根据反事实分布的手段研究因果效应,在许多情况下可能不足。鉴于一类已知以标准化常数为标准化的密度,我们建议通过以双重稳健的方式最大程度地减少内核Stein差异来对反事实分布进行建模。这使得在大量分布上估算反事实,同时利用所需的双重鲁棒性 ...
多跳工具使用的有效评估对于分析大型语言模型 (LLM) 的理解、推理和函数调用能力至关重要。然而,由于缺乏可靠的评估数据集,进展受到阻碍。为了解决这个问题,我们提出了 ToolHop,这是一个包含 995 个用户查询和 3,912 个相关工具的数据集,专门为严格评估多跳工具的使用而设计 ...
跨域建议(CDR)减轻了建议系统中的数据稀疏性和冷启动问题。虽然最近使用图形神经网络(GNN)捕获复杂的用户项目交互的CDR接近,但它们依赖于通常是次优且劳动力密集的手动设计的体系结构。此外,从源域中提取有价值的行为信息以改善目标域建议仍然具有挑战性 ...
本文提出了一个模型驱动的深度学习(MDDL)的基于宽带毫米波(MMWave)的大量混合多输入多输入(MIMO)系统的基于模型的通道估计和反馈方案,其中为了减少额外的头顶。首先,我们考虑时间划分双工系统的上行链路通道估计。为了减少上行链路飞行员的开销,以估算基站(BS)的有限射频(RF)链的高维通道,我们建议共同训练相移网络和通道估计器作为自动编码器 ...
图形神经网络(GNN)已成为欺诈检测,识别欺诈用户并发现恶意行为的有效工具。但是,对基于GNN的欺诈探测器及其风险的攻击很少受到研究,从而使潜在的威胁未受解决。最近的发现表明,欺诈行为越来越有组织成帮派或团体 ...
自从引入CHATGPT以来,大型语言模型(LLMS)在各种任务中都表现出了重要的效用,例如通过检索效果的一代回答问题。可以使用矢量化数据库来检索上下文,这是LLMS生成响应的基础。但是,响应中的幻觉会破坏LLM在实际应用中的可靠性,并且在没有地面真相的情况下,它们不容易被检测到,尤其是在问答情况下 ...
工业系统的远程无线控制是5G及以后系统的主要用例之一:在这些情况下,需要在无线介质上共享的大量感官信息甚至可能会超载高容量连接。因此,通过优化传输策略来丢弃无关的信息来解决有效的沟通问题可以提供重要的优势,但通常是一项非常复杂的任务。在这项工作中,我们考虑了一个原型系统,在该系统中,观察者必须将其感觉数据传达给控制任务的机器人(e ...
沟通需要在代理之间具有通用语言,即通用语言。该语言可能会通过共识过程出现,但可能需要许多代价的反复试验。另外,可以通过环境给出通用语言,在该环境中,代理人将其语言扎根于观察到的世界的代表 ...
新一代特定领域人工智能加速器的特点是对批量数据传输的需求迅速增加,而不是传统缓存一致性系统典型的小型、延迟关键的缓存线传输。在本文中,我们通过引入 FlooNoC 片上网络 (NoC) 来满足这一关键需求,该芯片具有非常宽、完全符合高级可扩展接口 (AXI4) 标准的链路,旨在满足高能效下的海量带宽需求。在传输级别,支持非阻塞事务以实现延迟容忍 ...