大型语言模型(LLM)在各种自然语言任务中都表现出色,但经常在需要结构化推理的长马计划问题上挣扎。这种限制引起了人们对将神经符号方法整合到自动化计划(AP)和自然语言处理(NLP)社区中的兴趣。但是,识别最佳AP部署框架可能令人生畏 ...
以下指令(如果)能力来衡量多模式的大语言模型(MLLM)准确地理解用户在告诉他们什么以及他们是否正确地做到这一点。培训数据之后的现有多模式指令稀缺,基准测试很简单,具有原子指令,并且评估策略对于要求精确输出约束的任务不精确。为了解决这个问题,我们提出了MM-IFENGINE,这是一种有效的管道,以生成高质量的图像指导对 ...
大型语言模型(LLMS)的快速进步已大大提高了其推理能力,这是由多种策略(例如多代理协作)驱动的。但是,与通过缩放数据和模型大小实现的良好的性能改进不同,LLMS中推理的缩放更为复杂,甚至可能对推理性能产生负面影响,从而在模型对齐和稳健性中引入了新的挑战。在这项调查中,我们对LLM推理中的缩放量表进行了全面的检查,将其分为多个维度,并分析了如何以及在何种程度上不同的缩放策略有助于提高推理能力 .. ...
我们介绍语言模型(LLMS)的压缩法。尽管最近的缩放定律试图了解LLM在模型大小,预训练数据和计算资源方面的规模,但我们专注于了解模型压缩如何影响下游任务预先训练的LLM的性能。我们通过经验研究结构化模型压缩对LLM的影响,通过$ 1000 $的实验,尺寸为$ 0 ...
近年来,在设计和游戏应用中对动态3D资产的需求不断增长,这引起了能够综合高质量4D对象的强大生成管道。以前的方法通常依赖于评分蒸馏采样(SDS)算法来推断4D对象的观点和运动,从而导致不满意的结果,而过度饱和和Janus问题等缺陷。因此,受视频扩散模型的最新进展的启发,我们建议通过从一个输入图像中明确生成多视图视频来优化4D表示 ...
灵活的制造业导致了复杂的调度问题,例如灵活的车间调度问题(FJSP)。在FJSP中,可以在多台机器上处理操作,从而导致操作与机器之间的复杂关系。最近的作品采用了深入的强化学习(DRL)来学习解决FJSP的优先派遣规则(PDR) ...
作业车间调度问题(JSSP)是一个组合优化问题,其中需要在机器上调度任务,以最大限度地减少完工时间或延迟等标准。为了解决更现实的场景,我们将概率分布与每个任务的持续时间相关联。我们的目标是制定一个稳健的时间表,即... ...
变形金刚在计算机视觉上取得了巨大的成功,而如何在图像中拆分补丁仍然是一个问题。现有方法通常使用固定尺寸的补丁嵌入,可能会破坏对象的语义。为了解决此问题,我们提出了一个新的可变形补丁(DEPATCH)模块,该模块学会以数据驱动的方式将图像自适应地将图像分为不同的位置和尺度,而不是使用预定义的固定补丁 ...