人形机器人在人工智能中提出了重大挑战,需要精确的协调和控制高度自由系统的系统。为该领域中的深入增强学习(DRL)设计有效的奖励功能仍然是一个关键的瓶颈,要求大量的手动努力,域专业知识和迭代精致。为了克服这些挑战,我们引入了大步,这是一个建立在代理工程上的新颖框架,以自动化奖励设计,DRL培训和针对人形机器人机器人运动任务的反馈优化 ...
在这项工作中,通过重新审查异常检测的“匹配”性质(AD),我们提出了一个新的广告框架,同时享受广告准确性的新记录,并且跑步速度很高。在此框架中,通过级联贴片检索程序解决了异常检测问题,该过程以粗到精细的方式检索每个测试图像贴片的最接近的邻居。在给定测试样本的情况下,首先基于强大的直方图匹配过程首先选择了最相似的训练图像 ...
无监督的图像异常检测(UAD)已成为工业和医疗应用中的关键过程,但是由于对数据隐私的担忧日益关注,它面临着越来越多的挑战。一级分类任务固有的有限类多样性,再加上由客户内部和客户内部产品的变化引起的分配偏见,对通过Federated UAD保存数据隐私提出了重大挑战。因此,本文提出了一种有效的联合学习方法,具有动态记忆和记忆 - 无监督图像异常检测,称为FedDymem ...
由于近年来大型语言模型(LLM)取得了重大成功,因此幻觉问题仍然是一个挑战,因此提出了许多基准来检测幻觉。然而,其中一些基准不是由LLM自然产生的,而是故意诱导的。同样,许多人仅关注事实幻觉,同时忽略忠实的幻觉 ...
提高大型语言模型(LLM)在复杂问答(QA)场景中的性能一直是研究重点。最近的研究试图通过将逐步规划与外部检索相结合来提高 LLM 的表现。同时对于 GPT-3 等高级模型有效 ...
大型语言模型(LLM)的快速发展导致其能力的显着提高,同时也增加了人们对人类价值观和意图的一致性的关注。当前的一致性策略,包括自适应训练和推理时间方法,在这一领域表现出了潜力。但是,这些方法仍然很难平衡各种任务和困难的部署复杂性和能力 ...
随着基础模型的出现,迅速的调整已将自己定位为指导模型行为和引起所需响应的重要技术。提示调查为输入中的选择适当的关键字选择,从而在不调整或微调模型参数的情况下适应下游任务。从直接利用从模型的反向传播的梯度信号到采用黑盒优化的方法,例如加固学习(RL)方法的方法,迅速调整的工作范围很广 ...
下一个项目和下一个篮子建议的传统方法通常会根据其过去的交互和相关的静态上下文信息(例如用户ID或项目类别)提取用户的兴趣 ...