由于不稳定的图像质量,小物体尺寸,复杂的背景和环境阻塞,无人驾驶飞机(UAV)遥感图像中的对象检测提出了重大挑战。尤其是小物体占据了一小部分图像,使其准确的检测非常困难。现有的多尺度特征融合方法通过汇总不同分辨率的特征在某种程度上解决了这些挑战 ...
0 0 0 2025/02/14 arXiv:2501.17983v2 Lin0925
多光谱的行人检测对于全天候应用,例如监视和自动驾驶至关重要 ...
0 0 0 2025/02/14 arXiv:1611.02644v1 Lin0925
在本文中,我们解决了现有的文本到图像扩散模型的局限性在给出与人类相关的描述时产生人口统计学上的结果。这些模型通常难以将目标语言环境与社会文化偏见相关,从而导致图像产生。为了克服这一挑战,我们提出了公平映射,一种灵活的,模型的不可静力和轻巧的方法,该方法通过控制提示来实现公平的图像生成来修改预训练的文本对图像扩散模型 ...
0 0 0 2025/02/14 arXiv:2311.17695v2 attention2
文本到图像扩散模型是一种流行的范式,它通过提供文本提示和随机的高斯噪声来综合个性化图像。尽管人们观察到某些声音是``金色的噪音'',它比其他人可以实现更好的文本图像一致性和更高的人类偏好,但我们仍然缺乏机器学习框架来获得这些金色的声音。为了学习扩散抽样的黄金声音,我们在本文中主要做出了三项贡献 ...
0 0 0 2025/02/14 arXiv:2411.09502v4 jesson
在推荐系统中对用户行为序列进行建模对于了解随着时间的推移的用户偏好至关重要,从而实现了个性化和准确的建议,以改善用户保留并提高业务价值。尽管具有重要意义,但对于当前的顺序建模方法仍有两个挑战。从空间维度来看,很难相互感知使用类似的用户的利益,以了解广义意图。从时间维度来看,由于固定长度的输入序列,当前方法通常容易忘记长期利益 ...
0 0 0 2025/02/14 arXiv:2502.05558v2 hzlyiyibooks
高斯泼溅已成为从不同领域的图像构建 3D 表示的重要模型。然而,3D 高斯喷射渲染管道的效率依赖于多种简化。值得注意的是,使用单个视图空间深度将高斯图减少为 2D splats 会在视图旋转期间引入弹出和混合伪影 ...
0 0 0 2025/02/14 arXiv:2402.00525v3 wonglliam
这项工作提出了一个神经网络模型,该模型能够识别无人机收集的热图像中的小和微小物体。我们的模型由三个部分组成:骨干,脖子和预测头。主链是根据Yolov5的结构与结合使用 Transformer 编码器在末端开发的 ...
0 0 0 2025/02/14 arXiv:2402.08251v1 Lin0925
结构性健康监测(SHM)通过实现及时的损害检测来确保基础设施的安全性和寿命。基于视觉的裂纹检测与无人机结合在一起,解决了基于传统传感器的SHM方法的局限性,但需要在资源约束设备上部署有效的深度学习模型。这项研究评估了两个轻型卷积神经网络模型MobilenetV1x0 ...
0 0 0 2025/02/14 arXiv:2502.02269v1 Lin0925

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您勇敢地改进翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)