Research Focus
视觉感知基础模型旨在解决物体识别和定位的视觉感知基础问题,研究视觉主干网络、物体检测模型等,为通用视觉感知提供基座模型。
代表工作:
高精度、高效率的物体检测基础模型
R-FCN: Object Detection via Region-based Fully Convolutional Networks
【NIPS 2016年最具影响力论文第3名】
【入选Pytorch视觉算子库】
以可形变卷积为核心的视觉主干网络,大规模视觉通用基座模型
InternImage: Exploring Large-Scale Vision Foundation Models with Deformable Convolutions
【CVPR 2023 highlight paper】