无人机视觉挑战赛| VisDrone - 过去、现在和未来-白红宇

强烈建议你试试无所不能的chatGPT，快点击我

无人机视觉挑战赛| VisDrone - 过去、现在和未来

阅读量：2055 次

发布时间：2019-04-28

本文共 932 字，大约阅读时间需要 3 分钟。

在无人机捕获的视觉数据中，有一组物体被严重遮挡(见自行车的橙色边框)。如果我们使用非最大抑制(NMS)来抑制检测器中的重复检测，将不可避免地删除大多数真正的正对象。在一些实际应用中，对人群中的单个目标进行定位是不必要且不切实际的。因此，使用一个带计数的较大边界框来表示同一类别的一组物体更为合理(见自行车的白色边界框)。

同时，如果我们使用新的标注补救，我们需要重新设计度量来评价检测算法，即在评价时既要考虑定位精度又要考虑计数精度。

当前的对象检测方法使用包围盒来表示对象实例，即4元组(x;y;w;h)，其中x、y为边界框左上角的坐标，w、h为边界框的宽、高。

时间相干性。利用时间相干性的一个可行方法是使用对象跟踪器，例如ECO[98]和SiamRPN++[99]，引入检测算法。具体来说，我们可以为每一帧中检测到的对象实例分配一个跟踪器来指导连续帧中的检测，有效地抑制检测中的假阴性。

同时，集成再识别模块是另一种有前途的方式，利用时间一致性，以更好的性能，正如在D&T中所描述的[105]。

功能聚合。在连续帧中聚合特征也是提高性能的有效方法。正如FGFA[95]中所述，沿运动路径聚合附近的特征以利用时间一致性显著提高检测精度。因此，我们可以将几个连续的帧作为输入，将它们输入到深度神经网络中，利用三维卷积运算或光流算法提取时间显著性特征。

在数据关联问题中，不同检测帧之间的相似度计算是提高跟踪性能的关键。

相似度的计算需要考虑图像和运动信息。

例如，在ImageNet VID数据集[3]上离线训练的Siamese网络可以用于开发对象的时间区分特征。

在跟踪过程中可以对Siamese网络进行微调，以进一步提高跟踪精度。

同时，一些低层和中层的运动特征对MOT算法也是有效和有用的，如KLT和光流

场景的理解。

是提高MOT性能的另一有效途径。

例如，基于场景理解模块，我们可以推断出场景中的进入或退出端口。

在跟踪器中，输入和输出端口的信息具有很强的先验性，可以区分目标的遮挡、终止或再现。

同时，跟踪器还能够基于一般知识和场景理解抑制假轨迹，例如车辆只在道路上行驶，而不是在建筑物上行驶。

综上所述，这一领域值得进一步研究，以提高MOT的性能。

转载地址：http://vjdlf.baihongyu.com/

你可能感兴趣的文章

程序员的数学（四）—— 数学归纳法，如何征服无穷数列

不是技术人员也能看懂云计算、大数据、人工智能

图解HTTP（三）—— HTTP报文内的HTTP信息

图解HTTP（四）—— 返回结果的HTTP状态码

JavaWeb高级编程（五）—— 使用会话来维持HTTP状态

Intellij IDEA使用（十五）—— 如何在IDEA中一个Tomcat启动多个项目和多个Tomcat启动多个项目

图解HTTP（五）—— 与HTTP协作的Web服务器

程序员的数学（五）—— 排列组合，解决计数问题的方法

前后端分离实践（四）—— 使用vue-cli搭建前端展示层并用mock模拟测试数据

前后端分离实践（六）—— 前端与后端在生产环境中的分离部署

启航 —— 记 —— 第二次自考的反思：自考与自我改造的困境

数据结构与算法（三）——线性表

Java8学习笔记（一）—— 函数式编程的四个基本接口

Java8学习笔记（二）—— Lambda表达式

Java8学习笔记（三）—— Optional类的使用

Java8学习笔记（四） —— Stream流式编程

Java8学习笔记（五）—— 方法引用(::双冒号操作符)

数据结构与算法（四）—— 栈与队列

数据结构与算法（五）—— 广义表

微服务简介

喝酒易醉，品茶养心，人生如梦，品茶悟道，何以解忧？唯有杜康！-- 愿君每日到此一游！

当前时间: 2024-05-15 20:10:16 当前IP: 3.145.161.228 联系邮箱:javaeecc@qq.com Copyright © 2020 - 2022 baihongyu.com 京ICP备2021015314号-2

强烈建议你试试无所不能的CHAT-GPT，快点击我

强烈建议你试试无所不能的CHAT-GPT，快点击我