OpenCV warpperspective
По какой-то причине, когда я использую функцию OpenPV warpPerspective(), окончательное искаженное изображение не содержит всего в исходном изображении. Левая часть изображения кажется отрезанной. Я думаю, причина в том, что это происходит потому, что искаженное изображение создается в крайнем левом положении холста для warpPerspective(). Есть ли способ исправить это? Благодаря
Ответы
Ответ 1
Проблема возникает из-за того, что гомография отображает часть изображения в отрицательные значения x, y, которые находятся за пределами области изображения, поэтому не может быть построена.
то, что мы хотим сделать, - это компенсировать искаженный вывод некоторым количеством пикселей, чтобы "шунтировать" все искаженное изображение в положительные координаты (и, следовательно, внутри области изображения).
Гомографии можно комбинировать с использованием матричного умножения (поэтому они настолько сильны). Если A и B являются гомологиями, то AB представляет собой гомографию, которая сначала применяет B, а затем A.
Из-за этого все, что нам нужно сделать, чтобы компенсировать вывод, это создать матрицу гомографии для перевода с помощью некоторого смещения, а затем предварительно умножить это на нашу исходную матрицу гомологии
Двумерная матрица гомографии выглядит следующим образом:
[R11,R12,T1]
[R21,R22,T2]
[ P , P , 1]
где R представляет собой матрицу вращения, T представляет собой трансляцию, а P представляет собой перспективную основу.
Итак, чисто трансляционная гомография выглядит так:
[ 1 , 0 , x_offset]
[ 0 , 1 , y_offset]
[ 0 , 0 , 1 ]
Итак, просто предварите свою гомографию матрицей, аналогичной приведенной выше, и ваше выходное изображение будет смещено.
(Убедитесь, что вы используете умножение матрицы, а не умножение элемента)!
Ответ 2
Секрет состоит из двух частей: матрицы преобразования (гомографии) и результирующего размера изображения.
-
вычислить правильное преобразование с помощью метода getPerspectiveTransform(). Возьмите 4 точки от исходного изображения, вычислите их правильную позицию в пункте назначения, поместите их в два вектора в том же порядке и используйте их для вычисления матрицы преобразования перспективы.
-
Убедитесь, что размер целевого изображения (третий параметр для warpPerspective()) - именно то, что вы хотите. Определите его как Size (myWidth, myHeight).
Ответ 3
Я сделал один метод...
Он работает.
perspectiveTransform(obj_corners,scene_corners,H);
int maxCols(0),maxRows(0);
for(int i=0;i<scene_corners.size();i++)
{
if(maxRows < scene_corners.at(i).y)
maxRows = scene_corners.at(i).y;
if(maxCols < scene_corners.at(i).x)
maxCols = scene_corners.at(i).x;
}
Я просто нахожу максимум x-точек и y-точек соответственно и накладываю их на
warpPerspective( tmp, transformedImage, homography, Size( maxCols, maxRows ) );
Ответ 4
Попробуйте ниже homography_warp
.
void homography_warp(const cv::Mat& src, const cv::Mat& H, cv::Mat& dst);
src
является исходным изображением.
H
- ваша гомография.
dst
- искаженное изображение.
homography_warp
отредактируйте свою гомографию, как описано https://stackoverflow.com/users/1060066/matt-freeman в своем ответе fooobar.com/questions/368350/...
// Convert a vector of non-homogeneous 2D points to a vector of homogenehous 2D points.
void to_homogeneous(const std::vector< cv::Point2f >& non_homogeneous, std::vector< cv::Point3f >& homogeneous)
{
homogeneous.resize(non_homogeneous.size());
for (size_t i = 0; i < non_homogeneous.size(); i++) {
homogeneous[i].x = non_homogeneous[i].x;
homogeneous[i].y = non_homogeneous[i].y;
homogeneous[i].z = 1.0;
}
}
// Convert a vector of homogeneous 2D points to a vector of non-homogenehous 2D points.
void from_homogeneous(const std::vector< cv::Point3f >& homogeneous, std::vector< cv::Point2f >& non_homogeneous)
{
non_homogeneous.resize(homogeneous.size());
for (size_t i = 0; i < non_homogeneous.size(); i++) {
non_homogeneous[i].x = homogeneous[i].x / homogeneous[i].z;
non_homogeneous[i].y = homogeneous[i].y / homogeneous[i].z;
}
}
// Transform a vector of 2D non-homogeneous points via an homography.
std::vector<cv::Point2f> transform_via_homography(const std::vector<cv::Point2f>& points, const cv::Matx33f& homography)
{
std::vector<cv::Point3f> ph;
to_homogeneous(points, ph);
for (size_t i = 0; i < ph.size(); i++) {
ph[i] = homography*ph[i];
}
std::vector<cv::Point2f> r;
from_homogeneous(ph, r);
return r;
}
// Find the bounding box of a vector of 2D non-homogeneous points.
cv::Rect_<float> bounding_box(const std::vector<cv::Point2f>& p)
{
cv::Rect_<float> r;
float x_min = std::min_element(p.begin(), p.end(), [](const cv::Point2f& lhs, const cv::Point2f& rhs) {return lhs.x < rhs.x; })->x;
float x_max = std::max_element(p.begin(), p.end(), [](const cv::Point2f& lhs, const cv::Point2f& rhs) {return lhs.x < rhs.x; })->x;
float y_min = std::min_element(p.begin(), p.end(), [](const cv::Point2f& lhs, const cv::Point2f& rhs) {return lhs.y < rhs.y; })->y;
float y_max = std::max_element(p.begin(), p.end(), [](const cv::Point2f& lhs, const cv::Point2f& rhs) {return lhs.y < rhs.y; })->y;
return cv::Rect_<float>(x_min, y_min, x_max - x_min, y_max - y_min);
}
// Warp the image src into the image dst through the homography H.
// The resulting dst image contains the entire warped image, this
// behaviour is the same of Octave imperspectivewarp (in the 'image'
// package) behaviour when the argument bbox is equal to 'loose'.
// See http://octave.sourceforge.net/image/function/imperspectivewarp.html
void homography_warp(const cv::Mat& src, const cv::Mat& H, cv::Mat& dst)
{
std::vector< cv::Point2f > corners;
corners.push_back(cv::Point2f(0, 0));
corners.push_back(cv::Point2f(src.cols, 0));
corners.push_back(cv::Point2f(0, src.rows));
corners.push_back(cv::Point2f(src.cols, src.rows));
std::vector< cv::Point2f > projected = transform_via_homography(corners, H);
cv::Rect_<float> bb = bounding_box(projected);
cv::Mat_<double> translation = (cv::Mat_<double>(3, 3) << 1, 0, -bb.tl().x, 0, 1, -bb.tl().y, 0, 0, 1);
cv::warpPerspective(src, dst, translation*H, bb.size());
}
Ответ 5
warpPerspective() работает нормально. Не нужно переписывать его.
Вероятно, вы используете его неправильно.
Помните следующие советы:
- (0,0) пикселей не в центре, а в левом верхнем углу. Поэтому, если вы увеличиваете изображение x2, вы потеряете нижнюю и правую части, а не границу (например, в Matlab).
- Если вы дважды создаете изображение, лучше размножать преобразования и активировать функцию один раз.
- Я думаю, что это работает только на char/int матрицах, а не на float/double.
- Когда у вас есть трансформация, применяются первый масштаб/перекос/поворот/перспектива и, наконец, перевод. Поэтому, если часть изображения отсутствует, просто измените транскрипцию (две верхние строки последнего столбца) в матрице.
Ответ 6
это мое решение
поскольку третий параметр в "warpPerspective()" является матрицей преобразования,
мы можем сделать матрицу преобразования,
который сначала перемещает изображение назад, затем поворачивает изображение, в конце перемещает изображение вперед.
В моем случае у меня есть изображение с высотой 160 пикселей и шириной 160 пикселей.
Я хочу повернуть изображение вокруг [80,80], а не вокруг [0,0]
сначала перемещает изображение назад (это означает T1)
затем поворачивает изображение (это означает R)
наконец, перемещает изображение вперед (это означает T2)
void rotateImage(Mat &src_img,int degree)
{
float radian=(degree/180.0)*M_PI;
Mat R(3,3,CV_32FC1,Scalar(0));
R.at<float>(0,0)=cos(radian);R.at<float>(0,1)=-sin(radian);
R.at<float>(1,0)=sin(radian);R.at<float>(1,1)=cos(radian);
R.at<float>(2,2)=1;
Mat T1(3,3,CV_32FC1,Scalar(0));
T1.at<float>(0,2)=-80;
T1.at<float>(1,2)=-80;
T1.at<float>(0,0)=1;
T1.at<float>(1,1)=1;
T1.at<float>(2,2)=1;
Mat T2(3,3,CV_32FC1,Scalar(0));
T2.at<float>(0,2)=80;
T2.at<float>(1,2)=80;
T2.at<float>(0,0)=1;
T2.at<float>(1,1)=1;
T2.at<float>(2,2)=1;
std::cerr<<T1<<std::endl;
std::cerr<<R<<std::endl;
std::cerr<<T2<<std::endl;
std::cerr<<T2*R*T1<<"\n"<<std::endl;
cv::warpPerspective(src_img, src_img, T2*R*T1, src_img.size(), cv::INTER_LINEAR);
}
Ответ 7
Ответ мэтта - хорошее начало, и он прав, говоря, что вам нужно умножить свою гомографию на
[ 1 , 0 , x_offset]
[ 0 , 1 , y_offset]
[ 0 , 0 , 1 ]
Но он не указывает, что такое x_offset и y_offset. В других ответах говорилось только о трансформации перспективы, но это неверно. Вы хотите использовать перспективное преобразование INVERSE.
То, что точка 0,0 преобразуется, скажем, в -10, -10, не означает, что смещение изображения на 10,10 приведет к получению не обрезанного изображения. Это потому, что точка 10,10 не обязательно отображается на 0,0.
Что вы хотите сделать, так это выяснить, какая точка будет отображаться в 0,0, и сместить изображение на столько. Для этого вы берете обратное (cv2.invert) омографии и применяете перспективу Transform.
не подразумевает:
![enter image description here]()
Вам нужно применить обратное преобразование, чтобы найти правильные точки.
![enter image description here]()
Это даст правильные значения x_offset и y_offset для выравнивания вашей верхней левой точки. Оттуда, чтобы найти правильную ограничивающую рамку и идеально вписать все изображение, вам нужно выяснить перекос (насколько наклонится изображение влево или вверх после обычного, неинверсионного преобразования) и добавить это количество к вашим x_offset и y_offset как хорошо.
ОБНОВЛЕНИЕ: Это все теория. Изображения в моих тестах отключены на несколько пикселей, я не знаю почему.
Ответ 8
Вот решение opencv-python для вашей проблемы, я поместил его на github: https://github.com/Sanster/notes/blob/master/opencv/warpPerspective.md
Ключевой момент, как сказал user3094631, получить две матрицы перевода (T1, T2) и применить к матрице поворота (M) T2*M*T1
В коде, который я даю, T1 от центральной точки исходного изображения, а T2 от левой верхней точки преобразованного ограничивающего прямоangularьника. Преобразованный boundingBox исходит из исходных angular точек:
height = img.shape[0]
width = img.shape[1]
#..get T1
#..get M
pnts = np.asarray([
[0, 0],
[width, 0],
[width, height],
[0, height]
], dtype=np.float32)
pnts = np.array([pnts])
dst_pnts = cv2.perspectiveTransform(pnts, M * T1)[0]
dst_pnts = np.asarray(dst_pnts, dtype=np.float32)
bbox = cv2.boundingRect(dst_pnts)
T2 = np.matrix([[1., 0., 0 - bbox[0]],
[0., 1., 0 - bbox[1]],
[0., 0., 1.]])