在这项工作中,我们旨在使用具有一组参数的单个加固学习代理来解决大量任务。一个关键的挑战是处理增加的数据和延长培训时间。我们已经开发了一种新的分布式代理Impala(重要的加权演员学习者体系结构),该架构不仅在单机器训练中更有效地使用资源,而且在不牺牲数据效率或资源利用率的情况下将其扩展到数千台机器 ...
0 0 0 2025/03/18 arXiv:1802.01561v3 chenlei
关系三重提取是信息提取领域的基本任务,而基于表填充的有希望的框架最近引起了人们的关注,这是实体关系提取的潜在基线。但是,诸如冗余信息和不完整的三重识别之类的固有缺点仍然存在问题。为了应对这些挑战,我们提出了基于扩散模型(IPED)的关系三重提取的隐性观点,这是一种用于提取关系三元组的创新方法 ...
0 0 0 2025/03/18 arXiv:2403.00808v1 张大宝
在这项工作中,我们探讨了新型神经网络体系结构的使用,Kolmogorov-Arnold网络(KANS)作为基于传感器的(特别是IMU)人类活动识别(HAR)的特征提取器。如果传统网络执行每个节点处的输入的参数加权总和,然后将结果馈入静态定义的非线性,则KANS在边缘上执行由B-Splines表示的非线性计算,导致每个节点,然后将输入总结在节点上。该系统没有学习权重,而是学习样条参数 ...
0 0 0 2025/03/18 arXiv:2406.11914v1 迟楷元
(llm)(llm)(llm)(ICL)能力,但与大多数有监督的微调re方法相比 ...
0 0 0 2025/03/18 arXiv:2404.17809v1 jeo_boys
尽管它们以物理启发,基于能量的和生成性质的吸引力,但鲍尔茨曼机器(BM)还是被认为是训练的棘手。这种信念导致了BMS的简化模型,并具有受限的内部连接或对深BMS的层次训练。域特异性硬件的最新发展 - 特别是具有概率位的概率计算机(P-Computer)(P-BITS(P-BIT))可能会改变Deep BMS障碍性的既定智慧 ...
0 0 0 2025/03/18 arXiv:2401.01996v1 odenkkk
很少有学习旨在通过利用从几个样本中学到的先验知识来识别新颖概念。但是,对于视觉密集的任务,例如少量的语义细分,像素级注释既费时又昂贵。因此,在本文中,我们利用了更具挑战性的图像级注释,并提出了一个自适应频率感知网络(AFANET),以降低了弱监督的少数弹性语义分割(WFSS) ...
0 1 0 2025/03/18 arXiv:2412.17601v2 长空
我们提出了量子信息张量适应性(Quanta),这是一种新颖,易于实现的微调方法,没有针对大型预训练的语言模型的推理开销。通过利用从量子电路结构得出的量子启发的方法,Quanta可以实现有效的高级微调,超过低级适应性(LORA)的局限性 - 复杂的下游任务可能会失败。从理论上讲,我们的方法得到了普遍性定理和等级表示的支持,以实现有效的高级适应 ...
0 0 0 2025/03/18 arXiv:2406.00132v3 edcyhn
使用Pythia8事件生成器研究了$ \ sqrt {s}〜= 〜7 $ tev在PP碰撞中的奇怪强子产生。匹配奇怪的哈登族与喷气区域和基础事件区域有望帮助我们解开在硬和软工艺中产生的奇怪颗粒。通过在Pythia8框架中实现的颜色重新连接和颜色绳索机制,研究了奇怪的黑龙的产量和相对产生 ...
0 0 0 2025/03/18 arXiv:2203.13416v1 pngyuo

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您勇敢地改进翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)