大型语言模型(LLM)具有解决具有挑战性和看不见的推理问题的卓越能力,在表格学习方面拥有巨大的潜力,这对于许多现实世界的应用程序至关重要。在本文中,我们提出了一种新颖的上下文学习框架 FeatLLM,该框架采用 LLM 作为特征工程师来生成最适合表格预测的输入数据集。生成的特征用于通过简单的下游机器学习模型(例如线性回归)推断类别可能性,并产生高性能的小样本学习 ...
0 0 0 2025/03/27 arXiv:2404.09491v2 zjcanjux
适当的损失(例如跨凝性激励分类器)产生的类概率在训练数据上得到了很好的校准。由于概括差距,这些分类器倾向于在测试数据上过度自信,强制校准方法(例如温度缩放)。焦点损失不合适,但是已经证明对其进行训练通常会导致分类器在测试数据上可以更好地校准 ...
0 0 0 2025/03/27 arXiv:2408.11598v1 zhong180
大型语言模型(LLM),例如OpenAI发布的ChatGpt,由于其展示的能力为各种任务生成高质量的内容,因此引起了行业和学术界的极大关注。尽管LLM具有令人印象深刻的能力,但人们对它们在新闻,教育和软件工程等各个领域的潜在风险越来越担心。最近,已经提出了一些商业和开源LLM生成的内容探测器,但是,该探测器主要用于检测自然语言内容而无需考虑程序代码的具体特征 ...
0 0 0 2025/03/27 arXiv:2411.04704v1 15966829631
大型语言模型(LLM)在代码生成方面取得了显着进度。现在,确定代码是否为AI生成并确定所使用的特定模型至关重要,尤其是为了保护行业中的知识产权(IP),并防止在编程练习中作弊。为此,已经进行了几次尝试将水印插入机器生成的代码中 ...
0 0 0 2025/03/27 arXiv:2404.15639v3 15966829631
这项工作提出了一种无培训的方法来检测LLMS生成的代码,从而减轻与其不加区分使用的风险。据我们所知,我们的研究是第一个研究零射击检测技术应用于Chatgpt等高级Black-Box LLM生成的代码的零射击技术。首先,我们发现现有的基于培训或零照片的文本检测器在检测代码方面无效,这可能是由于代码结构中发现的独特统计属性所致 ...
0 0 0 2025/03/27 arXiv:2310.05103v1 15966829631
基于一组可解释的变体特征集,用复杂的遗传基础来预测表型仍然是一项艰巨的任务。通常,数据驱动的方法用于此任务,但是基因型数据的高维质使分析和预测变得困难。由预先训练的LLM中编码的广泛知识及其在处理复杂的生物医学概念方面的成功,我们开始研究LLM在功能选择和工程中用于表格基因型数据的能力,并具有新颖的知识驱动框架 ...
0 0 0 2025/03/27 arXiv:2410.01795v1 zjcanjux
对视觉细节的高分辨率感知对于日常任务至关重要。但是,当前的视力预训练仍然仅限于低分辨率(例如 ...
0 0 0 2025/03/27 arXiv:2503.19903v1 haoyi199815
基于 Transformer 体系结构的越来越多的端到端文本斑点方法表现出了卓越的性能。这些方法利用匹配算法的二分图来执行预测对象和实际对象之间的一对一最佳匹配。但是,两分图匹配的不稳定性会导致不一致的优化目标,从而影响模型的训练性能 ...
0 0 0 2025/03/27 arXiv:2408.00355v3 15800552430

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您勇敢地改进翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)