Я пытаюсь оценить позицию своего устройства, связанную с QR-кодом в пространстве. Я использую ARKit и концепцию Vision, представленные в iOS11, но ответ на этот вопрос, вероятно, не зависит от них.

С концепцией Vision я могу получить прямоугольник, который ограничивает QR-код в кадре камеры. Я хотел бы сопоставить этот прямоугольник с переводом и вращением устройства, необходимым для преобразования QR-кода из стандартного положения.

while, если бы я был на расстоянии 1 м от QR-кода, сосредоточился на нем, и если бы QR-код имел сторону 10 см, я бы увидел:

что изменилось для моего устройства между этими двумя кадрами? Я понимаю, что точный результат может быть невозможен, потому что, возможно, наблюдаемый QR-код немного не плоский, и мы пытаемся оценить аффинное преобразование на то, что не совсем прекрасно.

Я думаю, что sceneView.pointOfView?.camera?.projectionTransform более полезен, чем sceneView.pointOfView?.camera?.projectionTransform?.camera.projectionMatrix, поскольку в дальнейшем уже учитывается преобразование, выводимое из ARKit, которое меня не интересует для этой проблемы.

После нескольких попыток, я закончил работу с оценкой поцелуя камеры, используя проекцию openCV и перспективный решатель, solvePnP Это дает мне поворот и перевод, который должен представлять собой представление камеры в ссылочном коде QR. Однако при использовании этих значений и размещении объектов, соответствующих обратному преобразованию, где QR-код должен находиться в пространстве камеры, я получаю неточные сдвинутые значения, и я не могу заставить вращение работать:

где A, B, C, D - углы QR-кода в том порядке, в котором они переданы программе.

Прогнозируемое происхождение остается на месте, когда телефон вращается, но он сдвинулся с места, где он должен быть. Удивительно, но если я сдвигу значения наблюдений, я могу исправить это:

и теперь предсказанное происхождение остается устойчивым. Однако я не понимаю, откуда взялись значения сдвига.

Наконец, я попытался получить ориентацию, фиксированную относительно ссылочного кода QR:

Ориентация прекрасна, когда я смотрю на QR-код прямо, но затем он сдвигается на что-то похожее на поворот телефона:

Если это полезно, вот несколько числовых значений:

Я заметил, что вращение отлично работает, когда телефон остается горизонтально параллельным QR-коду (т.е. матрица вращения [[a, 0, b], [0, 1, 0], [c, 0, d]]), независимо от фактической ориентации QR-кода:

Ответы

Ответ 1

Math (Trig.):

Примечания: нижняя часть l (длина кода QR), левый угол k, а верхний угол i (камера)

Ответ 2

Я полагаю, проблема не в матрице. Это в размещении вершин. Для отслеживания 2D-изображений вам необходимо разместить вершины ABCD против часовой стрелки (отправная точка - вершина, расположенная в воображаемом начале координат x:0, y:0). Я думаю, что документация Apple по классу VNRectangleObservation (информация о проецируемых прямоугольных областях, обнаруженных запросом анализа изображения) является расплывчатой. Вы разместили свои вершины в том же порядке, что и в официальной документации:

var bottomLeft: CGPoint
var bottomRight: CGPoint
var topLeft: CGPoint
var topRight: CGPoint

Но их нужно размещать так же, как положительное направление вращения (вокруг оси Z) в декартовой системе координат:

Мировое координатное пространство в ARKit (а также в SceneKit и Vision) всегда следует right-handed convention (положительная ось Y указывает вверх, положительная ось Z указывает на зрителя, а положительная ось X указывает на зрителя справа), но ориентирован на основе вашей конфигурации сеанса. Камера работает в локальном координатном пространстве.

Направление вращения вокруг любой оси положительное (против часовой стрелки) и отрицательное (по часовой стрелке). Для отслеживания в ARKit и Vision это критически важно.

Порядок вращения также имеет смысл. Аркыт, а также SceneKit, применяется вращение относительно имущества узлы поворота в обратном порядке компонентов: первый roll (около Z оси), то yaw (около Y оси), то pitch (относительно X оси). Таким образом, порядок вращения ZYX.

Также есть полезный пост про Matrix Operations на Nukepedia.

IOS отказывает проекцию камеры

Ответы

Ответ 1

Math (Trig.):

Ответ 2