我们提出Cosql,这是一种用于构建跨域,通用数据库(DB)查询对话系统的语料库。它由30k+转弯加上10K+注释的SQL查询组成,该查询是从3K对话的Wizard-Of-Of(WOZ)集合中获得的,查询200个跨越138个域的复杂DBS。每次对话都模拟了一个现实世界的数据库查询场景,与人群工人一起探索数据库和SQL专家,用SQL检索答案,澄清模棱两可的问题,或者以其他方式告知无法回答的问题 .. ...
近年来,用于语义解析的事实上的标准解码方法是使用自上而下的深度优先遍历自动逐渐解析目标程序的抽象语法树。 In this work, we propose an alternative approach: a Semi-autoregressive Bottom-up Parser (SmBoP) that constructs at decoding step $t$ the top-$K$ s ...
尽管最近的语义细分方面取得了进步,但很难细分的哪些像素仍然在很大程度上没有探索。现有的研究仅将图像分离为简单而艰难的区域,并从经验上观察到后者与对象边界有关。在本文中,我们对硬像素错误进行了全面分析,将它们分为三种类型:错误响应,合并错误和位移 ...
扩散模型因其产生不仅具有视觉吸引力而且具有高艺术质量的图像的能力而被认可。结果,已经提出了布局到图像(L2i)生成,以利用特定区域的位置和描述,以使其更加精确,可控制。但是,以前的方法主要集中于基于UNET的模型(e ...
随着大语言模型的兴起,在多个领域中采用了大量参数的训练基础模型的范式,以取得巨大的成功。时间序列基础模型代表了该范式的显着扩展,表明表达能力,概括和跨域转移性。但是,这产生了基本的悖论:时间序列数据反映了不同的动态系统,使跨域转移具有直觉上的不可信,但这与模型的经验成功相矛盾 ...
这项研究检查了大型语言模型(llm)中的gptq等4位量化方法,强调了gptq在零样本任务中的过度拟合和有限的增强。虽然之前的工作仅关注零样本测量,但我们将任务范围扩展到更具生成性的类别,例如代码生成和抽象摘要,其中我们发现 ...
双方机器人由于其拟人化设计,在各种应用中提供了巨大的潜力,但其结构的复杂性阻碍了它们的控制。当前,大多数研究都集中在基于本体感受的方法上,这些方法缺乏克服复杂地形的能力。尽管视觉感知对于以人为中心的环境运行至关重要,但其整合使控制进一步复杂化 ...
持续学习(CL)旨在从顺序数据和任务流中积累知识。在利用其强大的概括和灵活性,预先训练的视力语言嵌入模型(例如剪辑(对比性语言图像预训练))已在CL中广泛采用和验证。除了学习新知识外,我们还研究了CL中是否可以保留甚至增强剪辑中的预训练知识,同时将数据流的新知识纳入了数据流 ...