我们提出了一个新颖的数据集,旨在通过解决量化视频内容中的危险的挑战并确定类似人类的大语言模型(LLM)评估者的挑战,旨在推进危险分析和评估。这是通过汇编100个YouTube视频的集合来实现的,其中包含各种活动。每个视频都由人类参与者注释,他们提供了从0(对人类无危险)到10(威胁生命)的危险评级,并具有精确的时间戳,表明危险越高 ...
0 0 0 2025/04/25 arXiv:2410.00477v1 casljl
在这项工作中,我们提出了一个基于LLM的BT生成框架,以利用两者的优势来进行顺序的操纵计划。为了实现人类机器人的协作任务计划并通过非Xperts增强直觉机器人编程,该框架采用人类指示来启动动作序列和人类反馈的产生,以优化运行时BT的生成。框架中的所有介绍方法均在真实的机器人装配示例上进行测试,该示例使用了西门子机器人装配挑战中的齿轮集模型 ...
0 0 0 2025/04/25 arXiv:2409.09435v1 mencius
越来越多的机器人系统越来越期望为新任务或不可预测的环境配置易于配置,同时保持人类可读和可验证的透明策略。我们建议使用大语言模型(BETR-XP-LLM)的方法行为树扩展,以动态,自动扩展并配置行为树作为机器人控制的策略。该方法利用LLM在计划和执行过程中解决任务计划者功能之外的错误 ...
0 0 0 2025/04/25 arXiv:2409.13356v1 mencius
工具在增强大语言模型中的集成提出了一种新的方法,以提高这些模型处理特定,复杂任务的效率和准确性。本文研究了教授LLMS使用外部工具领域中的方法,挑战和发展,从而将其能力的界限推广到了先前存在的知识库之外。我们引入了一个标准化的范例,用于以一系列功能为指导的工具集成,该功能将用户指示映射到可操作的计划及其执行,并强调理解用户意图,工具选择和动态计划调整的重要性 ...
0 0 0 2025/04/25 arXiv:2409.18807v1 hhhhh
图像增强是一种广泛使用的技术,用于提高卷积神经网络(CNN)的性能。在共同的图像转移,裁剪,翻转,剪切和旋转中,用于增强。但是,还有更高级的技术,例如切口和样品绘制 ...
0 0 0 2025/04/25 arXiv:1909.00390v2 晓峰
排名是推荐系统的核心任务,旨在向用户提供有序的项目列表。通常,从标记数据集中学习排名函数以优化全局性能,从而为每个单独的项目生成排名分数。然而,它可能不是最优的,因为评分函数单独应用于每个项目 ...
0 0 2 2025/04/25 arXiv:1904.06813v3 vtao
在本文中,我们介绍了SLAM3R,这是一种新型有效的单眼RGB SLAM系统,用于实时和高质量的密集3D重建。 SLAM3R通过无缝整合局部3D重建和全局坐标来通过前馈神经网络来提供端到端解决方案。给定输入视频,系统首先使用滑动窗口机制将其转换为重叠的剪辑 ...
0 0 0 2025/04/25 arXiv:2412.09401v3 KingXHJ
合成数据集是训练立体声匹配网络的关键要素,但是什么使立体声数据集有效的问题仍然在很大程度上没有探索。我们通过改变过程数据集发电机的参数来研究合成数据集的设计空间,并使用标准基准报告对零摄像的立体声匹配性能的影响。我们收集最佳设置来生产Infinigen-STEREO,这是一种专门针对零击立体声数据集优化的程序发电机 ...
0 0 0 2025/04/25 arXiv:2504.16930v1 KingXHJ

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您勇敢地改进翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)