学习有效的联合表示是多模式情绪分析的核心任务。以前解决此任务的工作重点是探索复杂的融合技术以提高性能。但是,不同方式的固有异质性仍然是一个核心问题,在代表性层面和信息级别融合和协调多模式信号方面带来了挑战,这阻碍了对多模式信息的全面利用 ...
视觉 Transformer (VIT)在计算机视野领域取得了显着步骤。但是,随着模型的深度和输入图像的分辨率的增加,与培训和运行的VIT模型相关的计算成本飙升了这份HTTP URL论文提出了一个基于CNN和Vision Transformer的混合模型,名为CI2P-VIT。该模型结合了一个称为CI2P的模块,该模块利用Compressai编码来压缩图像,然后通过一系列卷积来生成一系列贴片 .. ...
有效的城市交通管理对于可持续的城市发展至关重要,依靠机器学习任务(例如交通流量预测和旅行时间估算)的智能系统。传统方法通常集中在静态道路网络和轨迹表示学习上,并忽略交通状态和轨迹的动态性质,这对于下游任务至关重要。为了解决这一差距,我们提出了轨道,这是一个新颖的框架,以弥合流量状态和轨迹数据,以进行动态道路网络和轨迹表示学习 ...
由于人工智能(AI)的发展,科学研究范式正在经历深刻的转变。最近的工作表明,各种AI辅助研究方法可以通过改善数据分析,加速计算和促进新颖的想法产生来在很大程度上提高研究效率。进一步朝着最终目标迈进(i ...
大型语言模型(LLMS)在各种领域都表现出了出色的表现。尽管如此,通才LLM在需要专业知识的推理任务中仍然缺乏。对专门针对特定领域培训的专业LLM的事先研究,这需要在域数据采集和模型参数微调方面进行大量努力 ...
由缩放定律驱动的现代大型语言模型(LLM),以大型模型大小实现情报紧急情况。最近,人们对云成本,潜伏期和隐私的越来越关注使得它是开发紧凑型边缘语言模型的紧急要求。这项工作与缩放定律界定的直接训练区分开了,提出了预处理预处理,重点是保留更大的优化模型的性能 ...
随着chatgpt,gpt-4等大型语言模型的迅速普及,其安全问题越来越受到人们的关注。这些模型可能会产生侮辱性和歧视性的内容,反映不正确的社会价值观,并可能被用llm)的广泛应用尤为重要... ...
我们展示了材料,这是一个完全自动化的统一扩散框架,旨在生成3D对象的物理材料。与依赖复杂管道或特定案例优化的现有方法不同,材料的任何东西都提供了适合各种照明条件下对象的强大的端到端解决方案。我们的方法利用了预先训练的图像扩散模型,通过三头体系结构增强并造成损失,以提高稳定性和材料质量 ...