在神经解码研究中,最有趣的主题之一是基于fMRI信号的自然图像的重建。先前的研究成功地重新创建了视觉效果的各个方面,例如低级属性(形状,纹理,布局)或高级特征(对象类别,场景的描述性语义),但通常未能将这些属性一起重建这些属性以获得复杂场景图像。 Generative AI最近通过能够产生高复杂性图像的潜扩散模型进行了飞跃 ...
传统上,神经时间序列分析一直集中在时间域中的数据建模,通常采用某些方法将等效的傅立叶域表示作为辅助光谱特征。在这项工作中,我们将主要焦点转移到频率表示,将时间序列数据完全和直接在傅立叶域中建模。我们引入了神经傅立叶建模(NFM),这是一种紧凑而强大的时间序列分析解决方案 ...
虽然端到端的视频到原告的生成大大改善,但产生了高保真的音频,从而真正捕捉视觉内容的细微差别仍然具有挑战性。像创意行业的专业人士一样,这一代人需要关于视觉动态,声学环境和时间关系等项目的复杂推理。我们介绍了思想,这是一个新颖的框架,利用了经过思考链(COT)推理来启用逐步,交互式音频的生成和视频编辑 ...
如果被恶意用户利用,大语言模型(LLM)的普遍性和强大能力会带来明显的安全性和道德风险。为了防止LLM的潜在欺骗性使用,最近的作品提出了算法来检测LLM生成的文本并保护LLM。在本文中,我们研究了这些LLM检测器在对抗攻击下的鲁棒性和可靠性 ...
大型语言模型(LLMS)在各种应用中表现出色。但是,在窃,产生假新闻和垃圾邮件中滥用这些模型的潜力引起了人们对其负责使用的关注。因此,对AI生成的文本的可靠检测已成为研究的关键领域 ...
近年来,深度卷积神经网络在人脸识别方面取得了突破。每年在fr领域发表数十篇论文。其中一些应用在工业界,在人类生活中发挥了重要作用,如设备解锁、移动支付等 ... ...
在本文中,我们论证了值分布的根本重要性:强化学习代理收到的随机回报的分布。这与强化学习的常见方法形成对比,强化学习对这种回报或价值的期望进行建模。尽管有大量研究价值分布的文献,但到目前为止,它始终用于特定目的,例如实施风险意识行为... ...
在图像和语言领域中,蒙面自动编码在自我监督的学习方面取得了巨大的成功。但是,基于面具的预仔尚未显示出对点云理解的好处,这可能是由于PointNet(PointNet)无法正确处理训练的标准骨干,而不是测试在训练过程中引入的测试分配不匹配。在本文中,我们通过提出一个歧视性掩蔽式 Transformer 框架,maskPoint}来弥合这一差距 ...