大型语言模型(LLM)在自然语言理解和产生方面表现出了令人印象深刻的能力,但是医疗和临床应用的质量栏很高。如今,试图评估模型的临床知识通常依赖于有限基准的自动评估。没有标准可以评估模型的预测和推理 ...
0 0 0 2025/05/06 arXiv:2212.13138v1 lulu
在机器学习研究文献中,人们对自动症状检测(ASD)和自动诊断(AD)系统的兴趣迅速增强,旨在帮助医生进行远程医疗服务。这些系统旨在与患者相互作用,收集有关其症状和相关前因的证据,并可能对潜在疾病做出预测。医生将审查互动,包括证据和预测,如有必要,请在确定下一步之前从患者那里收集其他信息 ...
0 0 0 2025/05/06 arXiv:2205.09148v3 lulu
OpenAI的GPT4O模型的最新突破表现出了令人惊讶的良好能力在图像生成和编辑中,从而引起了社区的极大兴奋。该技术报告介绍了第一观评估基准(命名为GPT-Imgeval),在三个关键维度上进行了定量和质量地诊断GPT-4O的性能:(1)生成质量,(2)编辑能力和(3)世界知识知识的语义合成。在这三个任务中,GPT-4O表现出强劲的性能,在图像生成控制和输出质量中都显着超过了现有方法,同时还展示了 ...
0 0 0 2025/05/06 arXiv:2504.02782v3 boxuan
尽管当前的方法在估算单眼视频的3D人体运动方面表现出了有希望的进展,但它们的运动估计通常在物理上是不现实的,因为它们主要考虑运动学。在本文中,我们介绍了物理意识验证的 Transformer (Physpt),该 Transformer (Physpt)改善了基于运动学的运动估计并渗透运动力。 Physpt利用了 Transformer 编码器解码器主链,以自我监督的方式有效地学习人类动力学 .. ...
0 0 0 2025/05/06 arXiv:2404.04430v1 serein
本文介绍了使用神经网络来估计观察数据的治疗效应。通常,估计分为两个阶段进行。首先,我们为每个单元的预期结果和治疗概率(倾向评分)拟合模型 ...
0 0 16 2025/05/06 arXiv:1906.02120v2 jacob
大型语言模型(LLMS)具有急剧高级的机器学习研究,包括自然语言处理,计算机视觉,数据挖掘等,但它们仍然在推理,事实一致性和解释性方面表现出关键的局限性。在本文中,我们介绍了一种新颖的学习范式 - 模块化机器学习(MML),作为新一代LLM的重要方法 ...
0 0 0 2025/05/06 arXiv:2504.20020v1 kkkk
视听学习的最新进展显示了跨模式的学习表征的有希望的结果。但是,大多数方法都依赖于无法捕获视觉帧的细粒时间对应的全局音频表示。此外,当试图共同学习重建和跨模式对齐时,现有方法通常会与相互矛盾的优化目标困难 ...
0 0 0 2025/05/06 arXiv:2505.01237v1 瞢闇
我们提出MedConceptsqa,这是一个专门的开源基准,用于医疗概念问题。基准包括跨不同词汇的各种医学概念的问题:诊断,程序和药物。这些问题分为三个级别的难度:简单,中和硬 ...
0 0 0 2025/05/06 arXiv:2405.07348v2 lulu

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您勇敢地改进翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)