Использовать API обнаружения объектов Tensorflow для обнаружения небольших объектов в изображениях
Я хотел бы использовать Tensorflow Object Detection API для идентификации объектов в серии изображений веб-камеры. Быстрые модели RCNN, прошедшие предварительную подготовку по набору данных COCO, кажутся подходящими, поскольку они содержат все категории объектов, которые мне нужны.
Однако я хотел бы улучшить производительность модели при определении довольно маленьких объектов в каждом изображении. Если я правильно понял, мне нужно отредактировать параметр anchor scales
в файле конфигурации , чтобы модель использовала меньшие ограничивающие поля.
Мои вопросы:
- Нужно ли мне повторно моделировать модель во всем наборе данных COCO после того, как я настрою этот параметр? Или есть способ изменить модель только для вывода и избежать любой переподготовки?
- Есть ли какие-либо другие советы/приемы для успешной идентификации небольших объектов, без обрезки изображения на разделы и выполнения вывода по каждому из них отдельно?
Фоновая информация
В настоящее время я кормлю 1280x720 изображений модели. При примерно 200x150 пикселях мне сложно обнаружить объекты.
Ответы
Ответ 1
-
Вам нужно будет переучиться полностью, к сожалению, поскольку весы зависят от формы якоря.
-
Наличие карты функций с более высоким разрешением должно помочь (но замедлить процесс), поэтому изменение экстрактора функций для получения меньшего размера (максимальное количество пулов с шагом > 1 обычно уменьшает размер пространства ) или немного масштабировать изображение в исходном изображении.