arxiv的文档

arxiv 南京

个性签名 ...

ZeroGUI: Automating Online GUI Learning at Zero Human Cost

大型视觉模型（VLM）的快速发展推动了基于纯的GUI代理的开发，该代理能够感知和操作图形用户界面（GUI）以自主满足用户指令。但是，现有方法通常采用离线学习框架，该框架面临两个核心局限性：（1）对元素接地和动作监督的高质量手动注释的严重依赖，以及（2）对动态和互动环境的适应性有限。为了解决这些限制，我们提出了Zerogui，这是一个可扩展的在线学习框架，用于以零成本自动化GUI代理培训 ...

0 0 0 0 2025/06/25 arXiv:2505.23762v1 dqyzhwk

InterrogateLLM: Zero-Resource Hallucination Detection in LLM-Generated Answers

尽管大型语言模型 (LLM) 取得了许多进步，并且发展速度前所未有，但由于各种原因，它们对我们日常生活各个方面的影响和融入仍然有限。阻碍其广泛采用的一个关键因素是幻觉的出现， LLM 发明的答案听起来很现实，但却偏离了事实真相。在本文中，我们提出了一种在大型语言模型中检测幻觉的新方法，该方法解决了在各种现实场景中采用这些模型的关键问题 ...

0 1 1 4 2025/06/25 arXiv:2403.02889v3 mjwei

A Preliminary Analysis of Automatic Word and Syllable Prominence Detection in Non-Native Speech With Text-to-Speech Prosody Embeddings

自动检测单词和音节级别的突出性对于构建计算机辅助语言学习系统至关重要。已经表明，由当前最新的（SOTA）文本到语音（TTS）系统学到的韵律嵌入系统可以在综合语音中产生单词和音节级别的突出性，就像本地语音一样自然。为了了解在非本地环境下TTS中韵律嵌入以突出检测的有效性，考虑到与突出相关的嵌入：持续时间，能量和俯仰，从天然和非本地语音中提取的嵌入中进行了比较分析：sota tts naty Fastspeech2 ...

0 1 0 0 2025/06/25 arXiv:2412.08283v1 Du

ZeroGUI: Automating Online GUI Learning at Zero Human Cost

InterrogateLLM: Zero-Resource Hallucination Detection in LLM-Generated Answers

A Preliminary Analysis of Automatic Word and Syllable Prominence Detection in Non-Native Speech With Text-to-Speech Prosody Embeddings

ProsodyFM: Unsupervised Phrasing and Intonation Control for Intelligible Speech Synthesis

Open Continual Feature Selection via Granular-Ball Knowledge Transfer

MASTER: Enhancing Large Language Model via Multi-Agent Simulated Teaching

Multi-Treatment Multi-Task Uplift Modeling for Enhancing User Growth

Optimizing Retrieval Augmented Generation for Object Constraint Language

Kimi-VL Technical Report

A Model and Survey of Distributed Data-Intensive Systems

来一起翻译吧！

为了您和其他读者获得更好的阅读体验，请您在阅读时勇敢地改正翻译，特别是一些显而易见的机器翻译错误。

虽然我们追求卓越，但我们并不要求翻译十全十美，因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译，您不必担心会因为您的失误导致无法挽回的破坏。（改编自维基百科）