我们开发了一个STATA命令BootrankTest,用于在线性仪器变量回归模型中实现Chen and Fang(2019)的矩阵等级测试。现有的等级测试采用可能太小的关键值,因此甚至可能无法控制I型错误,甚至可能没有一阶有效。通过吸引引导程序,他们设计了一项测试,以克服现有测试的不足 ...
现在,大型语言模型(LLM)令人印象深刻的能力现在已经建立了良好的建立,但是它们的有效部署需要仔细的超参数优化。通过涉及各种配置的网格搜索的广泛实证研究,我们发现了控制这些超参数的普遍缩放法律:最佳学习率遵循模型参数和数据大小的幂律关系,而最佳批量大小则主要具有数据尺寸。我们的分析揭示了在固定模型和数据尺寸条件下的超参数的凸优化景观 ...
推荐系统广泛应用于各种现实应用中,但它们经常遇到用户冷启动问题的持续挑战。跨域推荐(CDR)利用一个域的用户交互来提高另一个域的预测性能,已成为一种有前景的解决方案。然而,在源域中具有相似偏好的用户可能在目标域中表现出不同的兴趣 ...
大型语言模型(LLM)的出现从根本上改变了自然语言处理,使其在从对话系统到科学探索的范围内必不可少。但是,他们的预训练的架构通常揭示了在专业环境中的局限性,包括限制的推理能力,道德不确定性和次优的领域特定性能。这些挑战需要先进的培训后语言模型(POLMS)来解决这些缺点,例如OpenAI-O1/O3和DeepSeek-R1(统称为大型推理模型或LRMS) ...
本文探讨了理解基于LLM的代理商的社会行为的开放研究问题。使用Avalon作为测试台,我们采用系统提示来指导游戏玩法中的LLM代理。虽然先前的研究已经与LLM代理商进行了游戏玩法,但缺乏对其社交行为的研究 ...
本文介绍了PCDREAMER,这是一种用于点云完成的新方法。传统方法通常从部分点云中提取特征以预测缺失区域,但是较大的解决方案空间通常会导致结果不令人满意。最新的方法已经开始使用图像作为额外的指导,有效地提高了性能,但是在实践中获得图像和部分点云的配对数据和部分点云是具有挑战性的 ...
我们引入了几何重新定位(Geort),这是一种超快和原则上的神经手部重新定位算法,用于远程处理,这是我们最近的敏捷代行(DEXGEN)系统的一部分。 Geort将人的手指键盘转换为1KHz的机器人手键盘,以更少的超参数达到最先进的速度和准确性。这种高速功能可以实现灵活的后处理,例如利用基础控制器进行诸如Dexgen之类的动作校正 ...
基于预训练的语言模型的对话(ERC)方法(ERC)方法中的当前多模式情感分析(MSA)和情绪识别表现出两个主要局限性:1)一旦接受过MSA和ERC任务的培训,这些预训练的语言模型将失去其原始的广义能力。 2)他们需要大量的计算资源。随着预训练的语言模型的规模不断增长,使用以前的方法培训更大的多模式分析模型可能会导致不必要的计算成本 ...