在本文中,我们提出了一种新颖的方法,可以通过大型语言模型(LLM)模型来提高软件质量和效率,旨在审查代码并确定潜在问题。我们提出的基于LLM的AI代理模型对大型代码存储库进行了培训。该培训包括代码审查,错误报告和最佳实践文档 ...
具有文本对图像扩散模型的个性化图像生成基于参考图像内容生成了看不见的图像。零射器适配器方法(例如IP-ADAPTER和OMINICONTROL)特别有趣,因为它们不需要测试时间进行微调。但是,他们努力平衡保存个性化的内容和遵守文本提示 ...
探索是扩大用户体验超出其既定偏好的行为,这是由于反馈循环和用户探索模式的信号有限而在大规模推荐系统中挑战。大型语言模型(LLM)通过利用其世界知识推荐这些循环以外的新内容来发挥潜力。一个关键的挑战是将LLM与用户偏好保持一致,同时保留其知识和推理 ...
数据驱动的自动驾驶运动生成任务经常受到数据集大小的限制和数据集之间的域差距的影响,这阻碍了它们在现实场景中的广泛应用。为了解决这个问题,我们引入了 SMART,一种新颖的自动驾驶运动生成范例,它将矢量化地图和代理轨迹数据建模为离散序列标记。然后,这些 Token 通过仅解码器的转换器架构进行处理,以训练跨时空序列的下一个 Token 预测任务 ...
具有低/零歧义区(LAZ/ZAZ)属性的序列可用于在移动环境中运行的现代通信和雷达系统。本文首先提出了一个新的Zaz序列系列,该家族是由``调制''零相关区(ZCZ)序列启发的,Popovic和Mauritz首先提出。然后,我们引入了第二个带有梳状光谱的Zaz序列集的家族,从而通过频率域中的固有光谱无效来保证局部多普勒的弹性 ...
事实证明,加强微调(RFT)对于增强LLM的推理能力非常有价值。研究人员已经开始将RFT应用于MLLM,希望它也将增强视觉理解的能力。但是,这些作品处于很早的阶段,并且没有检查RFT实际上对视觉任务的合适程度 ...
音频语言模型的最新进步强调了音频 Token 化的关键作用,该音频 Token 将音频信号转换为离散 Token ,从而促进了语言模型体系结构在音频域上的应用。在这项研究中,我们介绍了Almtokenizer,这是一种新型的低焦甲酸盐和语义丰富的音频编解码器,用于音频语言模型。先前的方法(例如Encodec)通常将单个音频帧编码为离散 Token ,而无需考虑跨帧的上下文信息 ...
未知复杂环境下的自主导航仍然是一个难题,无人机),而言。本文提出了一种基于神经网络的反应控制器,用于四旋翼飞行器在未知的室外环境中自主飞行。导航控制器仅使用当前传感器数据来生成控制信号,无需任何优化或配置空间搜索,这减少了内存和计算需求... ...