GUI 长期以来一直是人机交互的核心,提供了一种直观且视觉驱动的方式来访问数字系统并与之交互。 LLM ,特别是多模式模型的出现,开创了 GUI 自动化的新时代。他们在自然语言理解、代码生成和视觉处理方面表现出了卓越的能力 ...
0 0 0 2025/02/23 arXiv:2411.18279v9 niuzai
大型语言模型(LLM)表现出一系列推理能力,但面临诸如错误传播和幻觉之类的挑战,尤其是在金融领域(例如数据是异质性的专业领域),而精度至关重要。我们使用外部工具来探索语言模型增强的潜力,以减轻这些限制并将某些推理步骤卸载到更适合任务的外部工具上,而不是仅仅取决于LLM的固有能力。更具体地说,使用金融领域提问数据集,我们在Llama-2 13B聊天模型上应用受监督的微调来充当“任务路由器”和“任务求 ...
0 0 0 2025/02/23 arXiv:2401.15328v2 18485528524
交互环境中的现有语言基准要么缺乏现实世界的语言元素,要么由于人类大量参与数据或反馈信号的收集而难以扩展。为了弥补这一差距,我们开发了,网店 - 其中包含价值1.18美元的真实世界产品和价值12,087美元的众包文本说明... ...
0 0 0 2025/02/23 arXiv:2207.01206v4 YEFEI
这项研究调查了大型语言模型(LLM)的应用,特别是GPT-3.5和GPT-4,尽管(COT)(COT)在对科学评估的学生写入的反应自动评分中。我们专注于克服可访问性,技术复杂性和缺乏解释性的挑战,这些挑战以前限制了研究人员和教育工作者中基于人工智能的自动评分工具的使用 ...
0 0 1 2025/02/23 arXiv:2312.03748v2 Monicka
对在多样化和动态环境中运行的多功能机器人系统的需求不断增长,强调了通才政策的重要性,该政策利用大型跨实体数据语料库来促进广泛的适应性和高级推理。然而,通才会因低效的推理和昂贵的培训而苦苦挣扎。相反,专家策略是针对特定领域数据制定的,并且在任务级精度和效率方面表现出色 ...
0 0 0 2025/02/23 arXiv:2410.08001v3 果丹皮
随着生成模型的快速发展,辨别AI生成的内容引起了行业和学术界的越来越多的关注。在本文中,我们对“是否已解决了AI生成的图像检测任务”进行理智检查。首先,我们介绍了变色龙数据集,其中包括对人类感知确实具有挑战性的辅种图像 ...
0 0 0 2025/02/23 arXiv:2406.19435v3 zhushiyun
使机器人能够在各种环境中执行各种任务是机器人学习的核心挑战。虽然视觉语言动作(VLA)模型已经显示出对可推广机器人技能的希望,但实现其全部潜力需要解决行动表示和有效培训中的局限性。当前的VLA模型通常专注于扩展视觉模型(VLM)组件,而动作空间表示仍然是关键的瓶颈 ...
0 0 0 2025/02/23 arXiv:2502.05855v1 果丹皮
运动学Sunyaev-Zel'dovich(KSZ)效应 - 宇宙微波背景的多普勒增强(CMB)光子散射的光子以非零的视线速度散射,是对BARYONS在Baryons中的极好探测宇宙。在本文中,我们测量了由于从\ emph {unwise}目录中的红外选择的星系所追踪的电离气体引起的KSZ效应。我们采用“投影场” KSZ估计器,它不需要光谱星系红移 ...
0 0 0 2025/02/23 arXiv:2102.01068v2 wsy__

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您勇敢地改进翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)