Ответ 1
Как уже упоминалось, проблема жесткая очень и часто также называется реконструкция нескольких объектов, К нему обычно обращаются, решая проблему восстановления стереоресурса для каждой пары последовательных изображений.
Для выполнения стереовосстановления требуется, чтобы были сделаны пары изображений, которые имеют достаточное количество видимых перекрытий физических точек. Вам нужно найти соответствующие точки, чтобы затем можно было использовать триангуляцию для поиска трехмерных координат точек.
Эпиполярная геометрия
Стереовосстановление обычно выполняется, сначала калибруя настройку вашей камеры, чтобы вы могли исправить свои изображения, используя теорию эпиполярную геометрию. Это упрощает поиск соответствующих точек, а также окончательные вычисления триангуляции.
Если у вас есть:
- внутренние параметры камеры (требуется калибровка камеры),
- положение и вращение камеры (внешние параметры) и
- 8 или более физических точек с совпадением известных позиций на двух фотографиях (при использовании восьмиточечный алгоритм)
вы можете вычислить fundamental и основные матрицы используя только теорию матриц и используем их для исправления ваших изображений. Для этого требуется некоторая теория о координировать прогнозы с однородными координатами, а также знание > модели камеры-обскуры и камера матрица.
Если вам нужен метод, который не нуждается в параметрах камеры и работает для неизвестных настроек камеры, вы должны, вероятно, изучить методы некалиброванная стереореконструкция.
Задача о переписке
Поиск соответствующих точек - это сложная часть, которая требует от вас поискать точки одной и той же яркости или цвета или использовать текстурные шаблоны или некоторые другие функции для идентификации тех же точек в парах изображений. Методы для этого либо работают локально, ища наилучшее соответствие в небольшой области вокруг каждой точки, либо во всем мире, рассматривая изображение в целом.
Если у вас уже есть фундаментальная матрица она позволит вам исправить изображения, чтобы соответствующие точки на двух изображениях были ограничены (теоретически). Это поможет вам использовать более быстрые локальные методы.
В настоящее время до сих пор не существует идеальной методики решения проблемы соответствия, но в этих категориях могут входить следующие подходы:
- Ручной выбор: выберите подходящие точки поиска человека.
- Пользовательские маркеры: размещайте маркеры или используйте определенные шаблоны/цвета, которые вы можете легко идентифицировать.
- Сумма квадратов различий: возьмите область вокруг точки и найдите ближайшую целостную область соответствия на другом изображении.
- График: глобальный метод оптимизации, основанный на оптимизации с использованием теории графов.
Для конкретных реализаций вы можете использовать Google Scholar для поиска по текущей литературе. Вот один высоко цитируемый документ, в котором сравниваются различные методы: Таксономия и оценка плотных двухкамерных стереокорреспонденционных алгоритмов.
Многооконная реконструкция
После того, как у вас есть соответствующие точки, вы можете использовать теорию эпиполярной геометрии для расчетов триангуляции, чтобы найти 3D-координаты точек.
Вся эта стереореконструкция была бы повторена для каждой пары последовательных изображений (подразумевая, что вам нужен заказ изображениям или, по крайней мере, знание того, какие изображения имеют много перекрывающихся точек). Для каждой пары вы вычисляете другую фундаментальную матрицу.
Конечно, из-за шума или неточностей на каждом из этих шагов вы можете подумать, как решить проблему более глобально. Например, если у вас есть серия изображений, которые берутся вокруг объекта и образуют цикл, это обеспечивает дополнительные ограничения, которые могут быть использованы для повышения точности ранних шагов, используя что-то вроде настройка комплекта.
Как вы можете видеть, как стерео, так и многорежимная реконструкция далеки от решения проблем и до сих пор активно исследуются. Чем меньше вы хотите сделать автоматизированным образом, тем более четко определена проблема, но даже в этих случаях для начала требуется совсем немного теории.
Альтернативы
Если это связано с ограничениями того, что вы хотите сделать, я бы рекомендовал рассмотреть специализированные аппаратные датчики (например, XBox Kinect) вместо только с использованием обычных камер. Эти датчики используют структурированный свет, время пролета или какой-либо другой метод визуализации диапазона для создания изображения глубины, которое они также могут комбинировать с данными о цвете от своих собственных камер. Они практически решают проблему восстановления одного вида для вас и часто включают библиотеки и инструменты для сшивания/объединения нескольких видов.
Ссылки на эпиполярную геометрию
Мои знания на самом деле довольно тонкие в большинстве теорий, поэтому я могу лучше всего предоставить вам некоторые ссылки, которые, надеюсь, будут полезны (в порядке релевантности):
- Я нашел главу PDF в Многомерную геометрию просмотра, которая содержит большую часть критической теории. На самом деле учебник Multiple View Geometry в Computer Vision также должен быть весьма полезен (примеры разделов доступны здесь).
- Здесь представлена страница, описывающая проект некалиброванная стереореконструкция, которая, как представляется, содержит некоторый исходный код, который может быть полезен. Они находят совпадающие точки в автоматическом режиме, используя одну из многих методов обнаружения признаков. Если вы хотите, чтобы эта часть процесса также была автоматизирована, то обнаружение функции SIFT обычно считается отличным не в режиме реального времени техника (поскольку она довольно медленная).
- Статья о Реконструкция сцены из нескольких некалиброванных видов.
- Слайд-шоу на Способы 3D-восстановления из нескольких изображений (у него есть еще несколько ссылок ниже слайдов в конце).
- Здесь можно найти документ, сравнивающий различные алгоритмы многорежимной стереовосстановления здесь. Он ограничивается алгоритмами, которые "восстанавливают модели плотных объектов из откалиброванных представлений".
- Здесь приведена статья, в которой подробно описывается случай, когда у вас есть стереокамеры, которые принимают несколько изображений: На пути к надежной метрической реконструкции с помощью динамической некалиброванной стереофонической головки. Затем они находят способы самокалибровки камер.
Я не уверен, насколько это полезно, но, надеюсь, он содержит достаточно полезную терминологию и ссылки для поиска дополнительных ресурсов.