我们介绍了过去的一种新型的端到端框架,该框架与信号重建一起共同对语音信息进行建模,从而消除了对外部预审预周化模型的需求。与以前依靠预算的自我监督模型的方法不同,过去使用监督的语音数据,通过辅助任务将域知识直接整合到 Token 化过程中。此外,我们介绍了过去的流媒体,因果变体,从而实现了实时语音应用程序 ...
我们尽快提出了一个用于检测和接地多模式介质操纵的新框架(DGM4)。UPON彻底检查,我们观察到,图像和文本之间准确的细粒细粒跨模式的语义比对对于准确操纵检测和接地至关重要。虽然现有的DGM4方法罕见地关注跨模式对齐,从而阻碍了操纵检测到进一步的准确性 ...
生成推荐(GR)是一种新兴范式,将用户操作将其示为离散 Token 模式,并作为预测产生自动加压。但是,现有的GR模型将每个操作都独立地化,将相同的固定 Token 分配给所有序列中相同的动作,而无需考虑上下文关系。缺乏上下文意识可能会导致次优的性能,因为相同的动作可能会根据其周围环境而具有不同的含义 ...
这项工作着重于本地可回收的代码(SLRC),该代码是一个特殊的本地维修代码系列,能够纠正多个代码符号擦除,这些代码符号擦除通常用于分布式存储系统。首先,我们使用具有新颖的可回收擦除$ t $和最小维修替代性$ a $的代码产品来构建一个扩展的$ q $ y-q $ y非二进制单元家族。其次,我们研究MDS和BCH代码如何用于构建$ Q $ -ARY SLRCS ...
基于学习的概率模型可以与熵编码器结合使用,以进行数据压缩。但是,由于基于学习的模型的复杂性很高,因此在很大程度上忽略了它们作为文本压缩机的实际应用。为了解决这个问题,我们的工作着重于低复杂性设计,同时保持压缩性能 ...
穿越稀疏立足的危险地形对腿部机器人面临重大挑战,需要在安全区域进行精确的脚部放置。为了获取全面的外部感受信息,先前的研究采用了运动捕获系统或映射技术来为运动策略生成高度图。但是,这些方法需要专门的管道,并且经常引入额外的噪音 ...
Web代理使用户能够通过自然语言互动在Web浏览器上执行任务。评估Web代理轨迹是一个重要的问题,因为它可以帮助我们确定代理是否成功完成任务。基于规则的方法被广泛用于此目的,但是它们具有挑战性地扩展到新任务,并且可能并不总是识别成功的轨迹 ...
我们考虑基于统计数据建模,然后是基于预测的编码的无损压缩,其中输入数据的准确统计模型可实质性改善压缩。我们提出了DZIP,这是一种通用压缩机,用于顺序数据,该数据利用了神经网络(NNS)的众所周知的建模能力进行预测,然后进行算术编码。 DZIP使用基于自适应和半自适应训练的新型混合体系结构 ...