我们提出了图形耦合振荡器网络(GraphCon),这是一个新颖的图形学习框架。它基于普通微分方程(ODE)的二阶系统的离散化,该系统建模了非线性受控和阻尼振荡器网络,并通过基础图的邻接结构结合。我们框架的灵活性允许任何基本的GNN层(e ...
生成推荐自动加入对项目标识符的生成,以推荐潜在的项目。现有方法通常采用一对一的映射策略,其中每个项目由单个标识符表示。但是,该方案提出了问题,例如低频项目的次优语义建模和 Token 序列数据的多样性有限 ...
大型语言模型(LLM)具有明显的高级情感分析,但是它们固有的不确定性和可变性构成了可靠和一致的结果的关键挑战。本文系统地探讨了基于LLM的情感分析中的模型变异性问题(MVP),其特征是不一致的情感分类,极化以及由随机推理机制,迅速灵敏度以及训练数据中的偏见引起的不确定性。我们分析了MVP的核心原因,展示了说明性示例和案例研究以突出其影响 ...
大型语言模型(LLM)展示了跨各个领域的复杂任务中出色的功能,这是由于基本的问题解答(QA),如今它们被用作不熟悉内容的决策助理或解释者。但是,由于特定领域的数据稀疏性或模型的幻觉问题,它们并不总是正确的。鉴于此,我们应该相信LLM的回答多少?本文提出了一种新颖的方法,可以通过构建构成概率的方向图来评估捕获方向不稳定的不确定性,并且鉴于我们对构造的有向图的不对称特性进行了创新的随机行走拉普拉斯主义 ...
估计大语言模型〜(LLM)响应的不确定性仍然是一个至关重要的挑战。虽然最近的贝叶斯方法在通过低级别的重量更新来量化不确定性方面表现出有效性,但它们通常需要复杂的微调或训练后程序。在本文中,我们提出了无培训的贝叶斯化〜(TFB),这是一个新颖的框架,将现有的现有训练有素的洛拉适配器转变为贝叶斯的适配器,而无需额外的培训 ...
通过对微调模型所学到,遗忘以及如何信任其预测的一般了解,调整大型语言模型可以改善特定任务的性能。我们使用计算有效的低级适应集合来得出具有后近似的微调LLM的原则不确定性定量。我们使用基于Mistral-7b的低级适应合奏分析了三个常见的多项选择数据集,并在微调过程中和之后对不同目标域的感知复杂性和模型疗效得出定量和定性结论 ...
我们介绍了Ming-Lite-Uni,这是一个开源的多模式框架,该框架具有新设计的统一视觉生成器和一款适合统一视觉和语言的本机多模式自动回归模型。具体而言,该项目提供了集成的元震源和M2-OMNI框架的开源实现,同时介绍了新颖的多尺度可学习 Token 和多尺度表示策略。通过利用固定的MLLM和可学习的扩散模型,Ming-Lite-Uni使本机多模式AR模型可以同时执行基于文本图像生成和基于教学的 ...
现有的人类运动捕获(MOCAP)方法主要集中于视觉相似性,同时忽略了物理合理性。结果,诸如在3D场景中驾驶虚拟人类的下游任务或现实世界中的人形机器人遭受了时序漂移和抖动,诸如滑动和穿透等空间问题以及全球轨迹准确性不佳的问题。在本文中,我们通过探索压力的作用来从人体与物理世界之间的相互作用的角度重新审视人类MOCAP ...