大型语言模型(LLM)通常在公共基准上表现出色,但是这些高分可能掩盖了对数据集特定的表面提示的过度依赖,而不是真实的语言理解。我们介绍了变色龙基准过度检测器(C-BOD),这是一个元评估框架,通过参数转换系统地扭曲了基准提示,并检测LLMS的过度拟合。通过在保留其语义内容和标签的同时,C-BOD揭示了模型的性能是否由记忆模式驱动 ...
代码生成旨在根据自然语言描述自动生成特定编程语言的代码段。深度学习的持续进步,尤其是预培训的模型,赋予了代码生成任务,以实现出色的性能。代码生成的预训练模型的一个主要挑战是自然语言要求和源代码之间的语义差距 ...
多个无线边缘设备之间的协作推断有可能显着增强人工智能(AI)应用程序,尤其是用于传感和计算机视觉。这种方法通常涉及一个三阶段的过程:a)通过传感,b)提取功能和c)传输的功能编码。但是,传输提取的功能会带来显着的隐私风险,因为在此过程中可以暴露敏感的个人数据 ...
我们构建了一个系统,可以通过自己的手展示动作来控制机器人手和手臂。机器人通过单个RGB摄像机观察人类操作员,并实时模仿他们的动作。人的手和机器人的手在形状,大小和关节结构上有所不同,并且从单个未校准的相机中进行这种翻译是一个高度不受约束的问题 ...
代码预训练模型的兴起已显着增强了各种编码任务,例如代码完成以及诸如GitHub Copilot之类的工具。但是,这些模型(尤其是大型模型)的实质性尺寸在对特定的下游任务进行微调时构成了重大挑战。作为另一种方法,基于检索的方法已成为一种有前途的解决方案,增强了模型预测而无需进行微调 ...
倒角距离(CD)被广泛用作量化两个点云之间差异的度量。在云完成过程中,倒角距离(CD)通常用作深度学习框架中的损失函数。但是,通常在该领域中承认倒角距离(CD)容易受到异常值的影响,因此,这可能导致次优模型的收敛性 ...
Point Transformers(Pointr)最近在Point Cloud完成中显示出巨大的潜力。然而,提高对目标域的可传递性的有效域适应性仍未得到探索。在本文中,我们深入研究了这个主题,并从经验上发现,Point Transformer的CNN骨架上的直接特征对齐仅带来有限的改进,因为它不能保证 Transformer 中的序列域不变特征 ...
姿势回归网络可以预测查询图像相对于已知环境的相机姿势。在这种方法家族中,绝对姿势回归(APR)最近显示出有望的精度,在几厘米的位置误差的范围内。 APR网络在其权重中隐含地编码场景几何形状 ...