多模式的大型语言模型(MLLM)在自然图像,文本丰富的文档和图形设计中已经实现了出色的视觉推理能力。但是,他们解释音乐表的能力仍然没有得到充实的态度。为了弥合这一差距,我们介绍了Musixqa,这是第一个用于评估和推进音乐表理解中MLLM的综合数据集 ...
图形神经网络(GNN)是图形结构数据上强大的机器学习预测模型。但是,GNN缺乏严格的不确定性估计,限制了其在错误成本很大的设置中的可靠部署。我们提出了保融的GNN(CF-GNN),将共形预测(CP)扩展到基于图的模型,以保证不确定性估计 ...
在本文中,我们介绍了Kag-Thinker,这是一种基于参数轻型语言模型(LLM)的新型人类般的推理框架。我们的方法增强了在LLMS中特定于领域的知识基础(KBS)上提问的思维过程(Q \&A)任务的逻辑连贯性和上下文一致性。该框架通过建立结构化思维过程来模拟人类的认知机制来处理复杂问题 ...
我们提出了基于扩散的新一代商业规模的大语言模型(LLM)。这些模型通过 Transformer 体系结构进行了参数化,并经过训练以并联预测多个 Token 。在本报告中,我们详细介绍了水星编码器,这是我们为编码应用程序设计的第一组扩散LLM ...
提升建模对于通过选择可能对特定营销活动做出积极反应的个人来优化营销策略至关重要。这种重要性在多处处理营销活动中升级,可以使用多种处理,我们可能希望将客户分配给可以带来最大影响的治疗。尽管有其他方便框架等现有方法,例如Causalml,但仍有潜在的空间来增强在多处理案例中隆起建模的效果 ...
我们提出了来自单眼RGB视频的动态3D头部重建的单眼神经参数头模型(mononphm)。为此,我们提出了一个潜在的外观空间,该空间在神经参数模型的顶部参数化纹理场。我们限制了预测的颜色值与基础几何形状相关,以使RGB的梯度有效地影响反向渲染过程中的潜在几何代码 ...
随机实验已被用于在许多领域提供决策。他们帮助人们选择具有一定统计保证的测试人群的最佳治疗方法。但是,受试者可以在治疗中显示出明显的异质性 ...
倾向评分是估计观测数据中二元治疗的因果效应的常见工具。在这种情况下,对倾向评分的匹配,亚分类,插补或反比概率加权可以减少治疗组和对照组之间的初始协变量偏差。但是,有了两个以上的治疗选择,对因果效应的估计需要其他假设和技术,其实施的实施在各个学科之间有所不同 ...