卫星上的深度学习模型可以实时解释遥感图像,减少向地面传输数据的需要并节省通信资源。随着卫星数量和观测频率的增加,对星载实时图像判读的需求不断增长,凸显了该技术的重要性和发展不断扩大。然而,由于无线卫星通信中上行链路带宽的限制,更新卫星上部署的星载物体检测模型的广泛参数具有挑战性... ...
0 0 0 2025/03/28 arXiv:2406.02385v1 18804024672
语音翻译(S2ST)是一项变革性的技术,它弥合了全球交流差距,从而实现了外交,旅游业和国际贸易的实时多语言互动。我们的评论检查了S2ST的演变,比较了依赖于自动语音识别(ASR),机器翻译(MT)和文本(TTS)组件的传统级联模型,这些组件具有较新的端到端语音翻译(DST)模型,这些模型绕过了中间文本表示。尽管级联模型提供模块化和优化的组件,但它们会遭受错误传播,延迟增加和韵律损失的困扰 ...
0 0 0 2025/03/28 arXiv:2503.04799v1 小肥柴
最近的DeepSeek-R1通过加强学习(RL)和基于规则的奖励展示了LLMS推理能力的出现。在这个想法的基础上,我们是第一个探索基于规则的RL如何增强图形用户界面(GUI)操作预测任务的多模式大语言模型(MLLM)的推理功能。为此,我们策划了136个具有挑战性的任务的小型但高质量的数据集,其中包括移动设备上的五种常见动作类型 ...
0 0 0 2025/03/28 arXiv:2503.21620v1 liuweitang
空中机器人可以通过自主处理检查和映射任务来提高施工现场的生产率。但是,确保在人工工人附近的安全导航仍然具有挑战性。尽管对静态环境中的导航进行了充分的研究,但由于感知和计划的挑战,导航动态环境仍然开放 ...
0 0 0 2025/03/28 arXiv:2409.15633v2 xyyandhtl
大型语言模型(LLM)通过计划和与知识图进行互动,在知识图答案(KGQA)任务上取得了出色的性能。但是,现有方法通常将工具利用与知识推理混淆,损害模型输出的可读性并引起幻觉工具调用,这阻碍了KGQA的进步。为了解决此问题,我们建议使用LLM-Built查询内存中的基于LLM的知识图(MEMQ)的内存调查重建(MEMQ)从工具调用任务中解除LLM ...
0 0 0 2025/03/28 arXiv:2503.05193v1 hanyu
搜索建议系统中的两个主要任务是搜索相关性匹配和点击率(CTR)预测 - 前者专注于寻找用户查询的相关项目,而后者的预测可以更好地匹配用户兴趣。先前的研究通常开发两个模型来预测CTR并分别搜索相关性,然后根据两个输出的融合对候选项目进行排名。但是,这种分裂和诱导范式在不同模型之间造成了不一致 ...
0 0 0 2025/03/28 arXiv:2503.18395v2 weiweitools
自动问题生成(QG)模型的发展有可能通过减少与创建教育内容相关的教师工作量来显着改善教育实践。本文介绍了一种新型的教育问题生成方法,该方法控制了问题的主题重点。提出的主题控制问题生成(T-CQG)方法增强了为教育目的而生成的内容的相关性和有效性 ...
0 0 0 2025/03/28 arXiv:2501.05220v1 瓶子
本文研究了一项开放的研究挑战,即从图像中重建高质量的大型3D开放场景。观察到现有方法具有各种局限性,例如需要精确的相机姿势以进行输入和密集的观点以进行监督。为了执行有效而有效的3D场景重建,我们提出了一个新颖的图形引导3D场景重建框架,Graphgs ...
0 0 0 2025/03/28 arXiv:2502.17377v1 gaoming1

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您勇敢地改进翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)