在线金融新闻的多种来源会影响市场的变动和交易者的决策。这强调了对准确的情感分析的需求,除了拥有适当的算法交易技术以达成更好的交易决策。标准词典的情感方法已经证明了他们在协助财务决策方面的权力 ...
0 0 0 2025/07/17 arXiv:2403.12285v1 yang1young
大型语言模型越来越多地用于处理文档并促进对其进行提问。在我们的论文中,我们针对这种现实世界的语言建模任务提取机械电路:用于提取问题的上下文提问(QA)任务的上下文启动语言建模,并了解电路对下游应用程序的潜在好处,例如数据归因于上下文信息。我们提取电路作为内部模型组件的函数(e ...
0 0 0 2025/07/17 arXiv:2502.08059v1 zjwbr
视觉 Token 在多模式大型模型中是关键的,充当连续输入和离散 Token 之间的桥梁。然而,训练高压缩率VQ-VAE在计算上仍然需要计算,通常需要数千个GPU小时。这项工作表明,通过控制VAE公差阈值中的量化噪声,可以有效地将预训练的VAE有效地转化为VQ-VAE ...
0 0 0 2025/07/17 arXiv:2507.10547v1 Lydia1317
自动竞标具有强大的功能,可以在动态和竞争性的在线环境中优化竞标决策,已成为广告平台的关键策略。现有方法通常采用基于规则的策略或加强学习(RL)技术。但是,基于规则的策略缺乏适应时间变化的市场状况的灵活性,基于RL的方法难以捕获马尔可夫决策过程(MDP)框架内基本的历史依赖和观察结果 ...
0 0 0 2025/07/17 arXiv:2504.14587v2 wenzheng
将大型语言模型(LLMS)配备为潜在空间内存,引起了人们越来越多的关注,因为它们可以扩展现有语言模型的上下文窗口。但是,从遥远的过去中保留信息仍然是一个挑战。例如,memoryllm(王等人 ...
0 0 0 2025/07/17 arXiv:2502.00592v2 hwrabbit
大型语言模型(LLMS)在实现人工智能的现实世界决策任务中表现出了巨大的希望,尤其是当微调以利用其固有的常识和推理能力时,同时量身定制了特定应用程序时。但是,这个微调过程引入了相当大的安全性和安全性漏洞,尤其是在安全至关重要的网络物理系统中。在这项工作中,我们提出了第一个综合框架,用于在体现的AI中针对基于LLM的决策系统(BALD)的后门攻击,系统地探索攻击表面和触发机制 ...
0 0 0 2025/07/17 arXiv:2405.20774v3 0x211
大型语言模型(LLMS)通常具有数十亿个参数,因此在其操作中通常很难解释。在这项工作中,我们证明可以通过模型的最终投影层直接将神经元权重解码为 Token 概率(LM-head)。这在骆驼3中说明了这一点 ...
0 0 0 2025/07/17 arXiv:2501.02688v2 kkkk
大型语言模型封装知识,并在各种自然语言处理任务上表现出了卓越的表现。最近的研究将这些知识定位于特定模型参数,例如中间层中的MLP权重。这项研究通过知识编辑研究了实体和关系知识之间的差异 ...
0 0 0 2025/07/17 arXiv:2409.00617v1 kkkk

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您勇敢地改进翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)