文本到图像扩散模型在从文本提示中生成图像方面表现出色,但通常缺乏与内容语义,美学和人类偏好的最佳对齐。为了解决这些问题,在本研究中,我们介绍了一个新颖的框架,间接及时梯度优化(IPGO),以及时进行微调。 IPGO通过在提示嵌入的开始和结尾处注入连续可区分的 Token 来增强提示嵌入,同时利用旋转的低级别优势和灵活性 ...
0 0 0 2025/04/14 arXiv:2503.21812v1 哎呀大地瓜呀
统一的科学数据序列和结构(例如材料,分子,蛋白质)是一项关键任务 ...
0 0 0 2025/04/14 arXiv:2503.06687v1 tuxiaolv
可控的语音生成方法通常依赖于单个或固定的提示,阻碍创造力和灵活性。这些限制使得在某些情况下很难满足特定的用户需求,例如在保留选定扬声器的音色的同时调整样式,或选择样式并生成与角色视觉外观相匹配的声音。为了克服这些挑战,我们建议\ textit {flespeech},这是一个新颖的多阶段语音生成框架,可以通过整合各种形式的控制形式来更灵活地对语音属性进行更灵活的操纵 ...
0 0 0 2025/04/14 arXiv:2501.04644v1 哎呀大地瓜呀
语言模型方法最近已集成到二进制分析任务中,例如功能相似性检测和功能签名恢复。这些模型通常采用两个阶段的培训过程:通过蒙版语言建模(MLM)进行预训练,并在机器代码上进行微调。尽管MLM有助于理解二进制代码结构,但它忽略了基本代码特征,包括控制和数据流,这对模型的概括产生了负面影响 ...
0 0 0 2025/04/14 arXiv:2412.11177v2 15966829631
创建具有任意拓扑的高保真3D网格,包括开放表面和复杂的内饰,仍然是一个重大挑战。现有的隐式现场方法通常需要昂贵且细节降级的水密转换,而其他方法则在高分辨率方面挣扎。本文介绍了SparseFlex,这是一种新型的稀疏结构等值面表示,可直接从渲染损失中直接从最高$ 1024^3 $的分辨率下进行可区分的网格重建 ...
0 0 0 2025/04/14 arXiv:2503.21732v1 happy
文档级别的关系提取(DOCRE)涉及识别文档中多个句子之间的实体之间的关系。证据句子,对于精确的实体对关系识别至关重要,增强了对基本文本细分的关注,从而提高了DOCRE的性能。但是,现有的证据检索系统通常会忽略同一文档中语义相似的实体对之间的协作性质,从而阻碍了证据检索任务的有效性 ...
0 0 0 2025/04/14 arXiv:2504.06529v1 DUNK_911
小儿中枢神经系统肿瘤是儿童与癌症相关死亡的主要原因。儿童高级神经胶质瘤的五年存活率小于20%。新治疗的发展取决于需要可重现和准确的集中响应评估的多机构协作临床试验 ...
0 0 0 2025/04/14 arXiv:2407.08855v2 aaaa1
过去提取的过去工作主要集中在单个句子内实体对之间的二进制关系。最近,NLP社区对跨越多个句子的实体对中的关系提取引起了兴趣。在本文中,我们为此任务提出了一种新的架构:基于索引依赖关系的神经网络(IDEPNN) ...
0 0 0 2025/04/14 arXiv:1810.05102v2 DUNK_911

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您勇敢地改进翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)