15966829631的文档

15966829631

个性签名 ...

ROCODE: Integrating Backtracking Mechanism and Program Analysis in Large Language Models for Code Generation

大型语言模型（LLM）最近在代码生成方面取得了令人印象深刻的性能，为程序员在软件开发方面提供了革命性的帮助。然而，由于 LLM 的自回归性质，它们很容易在代码生成过程中受到错误累积的影响。一旦产生错误， LLM 只能继续生成以此为条件的后续代码，因为他们无法调整先前的输出 ...

0 0 0 0 2024/11/21 arXiv:2411.07112v1 15966829631

A Pair Programming Framework for Code Generation via Multi-Plan Exploration and Feedback-Driven Refinement

大型语言模型（LLM）在代码生成方面取得了令人印象深刻的性能。尽管之前的研究通过提示技术和代码细化增强了 LLM ，但由于严格的解决方案计划，他们仍然难以解决复杂的编程问题。在本文中，我们利用结对编程实践提出了 PairCoder，一种基于 LLM 的新型代码生成框架 ...

0 0 0 0 2024/11/20 arXiv:2409.05001v1 15966829631

ContractTinker: LLM-Empowered Vulnerability Repair for Real-World Smart Contracts

智能合约很容易被攻击者利用，尤其是在面临现实世界的漏洞时。为了减轻这种风险，开发人员通常依靠第三方审计服务在项目部署之前识别潜在的漏洞。然而，修复已识别的漏洞仍然是复杂且劳动密集型的，特别是对于缺乏安全专业知识的开发人员而言 ...

0 0 0 0 2024/11/20 arXiv:2409.09661v1 15966829631

MALSIGHT: Exploring Malicious Source Code and Benign Pseudocode for Iterative Binary Malware Summarization

二进制恶意软件摘要旨在从可执行文件自动生成人类可读的恶意软件行为描述，从而促进恶意软件破解和检测等任务。先前基于大型语言模型 (LLM) 的方法已显示出巨大的前景。然而，它们仍然面临重大问题，包括可用性差、解释不准确和摘要不完整，这主要是由于模糊的伪代码结构和缺乏恶意软件训练摘要 ...

0 0 0 0 2024/11/20 arXiv:2406.18379v2 15966829631

Source Code Summarization in the Era of Large Language Models

为了支持软件开发人员理解和维护程序，已经提出了各种自动（源）代码摘要技术来为给定的代码片段生成简洁的自然语言摘要（即注释） ...

0 0 0 0 2024/11/20 arXiv:2407.07959v1 15966829631

Neural Machine Translation for Low-Resource Languages: A Survey

神经机器翻译（NMT）在不到十年的时间里得到了巨大的发展，并已进入成熟阶段。虽然被认为是最广泛使用的机器翻译解决方案，但由于大型并行语料库的不可用，与高资源语言对相比，其在低资源语言对上的性能仍然不是最佳的。因此，针对低资源语言对的 NMT 技术的实现在最近的 NMT 研究领域受到了关注，从而导致了大量关于该主题的研究报道 ...

0 0 0 0 2024/11/20 arXiv:2106.15115v1 15966829631

LayoutFlow: Flow Matching for Layout Generation

寻找合适的布局对于图形设计中的各种应用来说是一项至关重要的任务。在更简单、更平滑的采样轨迹的推动下，我们探索使用流匹配作为当前基于扩散的布局生成模型的替代方案。具体来说，我们提出了 LayoutFlow，一种基于流的高效模型，能够生成高质量的布局 ...

0 0 1 1 2024/11/14 arXiv:2403.18187v2 15966829631

LecPrompt: A Prompt-based Approach for Logical Error Correction with CodeBERT

编程中的逻辑错误不会引发编译器警报，因此很难检测到。这些无声错误可能会破坏程序的功能或导致运行时问题。他们的纠正需要深入了解程序的逻辑，强调自动检测和修复的重要性 ...

0 0 0 0 2024/11/14 arXiv:2410.08241v1 15966829631

A test-free semantic mistakes localization framework in Neural Code Translation

在代码翻译任务中，基于神经网络的模型已被证明经常产生偏离源代码原始逻辑的语义错误代码。即使对于先进的大型模型，这个问题仍然存在。尽管最近提出了使用测试用例来识别这些语义错误的方法，但它严重依赖于测试用例的质量，并且不适用于现实场景中没有测试用例的代码片段 ...

0 0 0 0 2024/11/12 arXiv:2410.22818v1 15966829631

Less is More: DocString Compression in Code Generation

大型语言模型 (LLM) 在软件工程中的广泛使用加剧了对改进模型和资源效率的需求。特别是，对于神经代码生成，LLM 用于将函数/方法签名和 DocString 转换为可执行代码。捕获用户对代码的要求并用作 LLM 提示的 DocStrings 通常包含冗余信息 ...

0 0 0 0 2024/11/11 arXiv:2410.22793v2 15966829631