Правильный способ построения климатических данных на нерегулярной сетке

Я работаю со спутниковыми данными, организованными на нерегулярной двумерной сетке, размеры которой являются сканированием (по размеру трека, то есть по оси Y) и по наземному пикселю (по размеру дорожки, то есть по оси X). Информация о широте и долготе для каждого центрального пикселя хранится в вспомогательных переменных координат, а также в четырех координатных координатах угла (координаты широты и долготы указаны на эталонном эллипсоиде WGS84).

Позвольте построить набор данных игрушек, состоящий из потенциально нерегулярной сетки 12x10 и связанных с ней измерений температуры поверхности.

Данные lon и lat содержат координаты центрального пикселя, как указано в исходном продукте, с которым я работаю, хранятся в виде двумерной матрицы, оси которой являются ground_pixel (ось X) и scanline (ось Y), Матрица data - те же размеры - содержит мои измерения. Затем я выравниваю три матрицы и сохраняю их в кадре данных.

Я хотел бы построить пиксели земли (как четырехугольники) на карте, заполненные соответственно измерением температуры.

Но это не то, что я хочу. Я мог бы играть с width и height, чтобы плитки "касались друг друга", но, конечно, это даже не приблизилось бы к моей желаемой цели, которая заключается в построении фактических проецируемых пикселов земли на карте. < ш > Python xarray может, например, автоматически выводить границы пикселей с учетом координат центра пикселей:

Вопрос

Есть ли способ достичь тех же результатов в R, то есть: автоматически ли границы пикселов выводятся из центров пикселей и нарисовать пиксели в виде заполненных полигонов на карте? Может быть, с помощью пакета sf?

Я вижу это в ответ на этот question, но ответ, который относится к использованию sf, для меня немного неясен, так как он с различными проекциями и потенциально регулярными сетками, тогда как в моем случае я полагаю, что мне не нужно повторно проектировать мои данные, и, кроме того, мои данные не находятся на регулярной сетке.

Если это невозможно, я полагаю, что я могу прибегнуть к использованию информации о границах пикселей в своих продуктах, но, возможно, что тема для другого вопроса должна оказаться нелегкой для решения этой проблемы.

Ответы

Ответ 1

Вот один из способов сделать это. Там может быть что-то попроще, но это работает.

Сначала я собираюсь использовать растровый пакет для управления координатами. Растры, которые я создаю здесь, являются "нетрадиционными" в том смысле, что содержащиеся в них значения являются данными о местоположении. Но использование растров, а не матриц для этого дает доступ к нескольким полезным функциям, таким как extend и, что наиболее полезно, resample с ее функцией билинейной интерполяции, которую я буду использовать для поиска вершин.

library(raster)
latr = raster(lat)
lonr = raster(lon)

find.vertices = function(m){
  r = raster(m)
  vertices = raster(matrix(nrow = dim(r)[1]+1, ncol = dim(r)[2]+1))
  x = extend(r, c(1,1))
  x[1,] = 2*x[2,] - x[3,]
  x[dim(x)[1],] = 2*x[dim(x)[1]-1,] - x[dim(x)[1]-2,]
  x[,1] = 2*x[,2] - x[,3]
  x[,dim(x)[2]] = 2*x[,dim(x)[2]-1] - x[,dim(x)[2]-2,]
  extent(vertices) = extent(r) + res(r)
  vertices = resample(x, vertices)
}

latv = find.vertices(lat)
lonv = find.vertices(lon)
df2 = data.frame(xc = lonv[], yc = latv[])

Позвольте построить эти вершины, чтобы проверить, что мы находимся на правильном пути:

ggplot(df, aes(y=lat, x=lon, fill=temp)) + 
  geom_tile(width=2, height=2) +
  geom_point(size=.1) +
  geom_point(aes(xc, yc), data=df2, inherit.aes =F) +
  borders('world', colour='gray50', size=.2) + 
  coord_quickmap(xlim=range(lon), ylim=range(lat)) +
  scale_fill_distiller(palette='Spectral') +
  theme_minimal()

Теперь мы создадим Polygon из этих вершин.

nx = NCOL(latv)
ny = NROW(lonv)
polys = list()
for (i in 1:length(data)) {
  x = col(data)[i]
  y = row(data)[i]
  polys[[i]] = Polygon(cbind(
      lonv[c((x-1)*ny + y, (x-1)*ny + y + 1, x*ny + y + 1, x*ny + y, (x-1)*ny + y)], 
      latv[c((x-1)*ny + y, (x-1)*ny + y + 1, x*ny + y + 1, x*ny + y, (x-1)*ny + y)]
    ))
}

Преобразуйте список Polygon в SpatialPolygonsDataFrame

Polys = sapply(1:length(polys), function(i) Polygons(polys[i], i))
SPolys = sapply(1:length(polys), function(i) SpatialPolygons(Polys[i], i))
SPolys = do.call(bind, SPolys)
SPolysdf = SpatialPolygonsDataFrame(SPolys, data.frame(data=as.vector(data)))

Чтобы отобразить этот объект в ggplot, нам нужно преобразовать его в обычный data.frame. Традиционно большинство людей использовали fortify для этого. Но документация ggplot предупреждает, что это может быть устаревшим, и рекомендует вместо этого использовать пакет метлы. Я не слишком знаком с метлой, но я решил последовать этому совету так:

library(broom)
ggSPolysdf = tidy(SPolysdf)
ggSPolysdf = cbind(ggSPolysdf, data = rep(as.vector(data), each=5))

И, наконец, мы можем построить:

ggplot(df, aes(y=lat, x=lon, fill=temp)) + 
  geom_polygon(aes(long,lat,fill=data, group = id), data=ggSPolysdf) +
  borders('world', colour='gray50', size=.2) + 
  coord_quickmap(xlim=range(lon), ylim=range(lat)) +
  scale_fill_distiller(palette='Spectral') +
  theme_minimal()

Ответ 2

Приведенное ниже решение по существу использует ответ от @dww и вносит некоторые изменения, которые необходимы для получения цифр (по крайней мере, на моей платформе). Эти изменения относятся, во-первых, к определению полигонов, определяющих "перекос пикселей" из последней фигуры; и, во-вторых, к вопросу о том, как сжать многоугольники во фрейм данных. Для второго вопроса используется пакет sf, предложенный @SymbolixAU.

library(raster)
latr = raster(lat)
lonr = raster(lon)

find.vertices = function(m){
 r = raster(m)
 vertices = raster(matrix(nrow = dim(r)[1]+1, ncol = dim(r)[2]+1))
 x = extend(r, c(1,1))
 x[1,] = 2*x[2,] - x[3,]
 x[dim(x)[1],] = 2*x[dim(x)[1]-1,] - x[dim(x)[1]-2,]
 x[,1] = 2*x[,2] - x[,3]
 x[,dim(x)[2]] = 2*x[,dim(x)[2]-1] - x[,dim(x)[2]-2,]
 extent(vertices) = extent(r) + res(r)
 vertices = resample(x, vertices)
}

latv = find.vertices(lat)
lonv = find.vertices(lon)
df2 = data.frame(xc = lonv[], yc = latv[])

Позвольте построить эти вершины, чтобы проверить, что мы находимся на пути:

ggplot(df, aes(y=lat, x=lon, fill=temp)) + 
  geom_tile(width=2, height=2) +
  geom_point(size=.1) +
  geom_point(aes(xc, yc), data=df2, inherit.aes=F) +
  borders('world', colour='gray50', size=.2) + 
  coord_quickmap(xlim=range(lon), ylim=range(lat)) +
  scale_fill_distiller(palette='Spectral') +
  theme_minimal()

Теперь мы создаем полигоны из этих вершин:

nx = NCOL(latv)

polys = list()
for (i in 1:length(data)) {
  x = col(data)[i]
  y = row(data)[i]

  polys[[i]] = Polygon(cbind(
      lonv[c((y-1)*nx + x, (y-1)*nx + x + 1, y*nx + x + 1, y*nx + x, (y-1)*nx + x)], 
      latv[c((y-1)*nx + x, (y-1)*nx + x + 1, y*nx + x + 1, y*nx + x, (y-1)*nx + x)]
    ))
}

Преобразуйте список полигонов в элемент SpatialPolygonsDataFrame:

Polys = sapply(1:length(polys), function(i) Polygons(polys[i], i))
SPolys = sapply(1:length(polys), function(i) SpatialPolygons(Polys[i], i))
SPolys = do.call(bind, SPolys)
SPolysdf = SpatialPolygonsDataFrame(SPolys, data.frame(data=as.vector(data)))

Использование fortify для преобразования во фрейм данных будет осуществляться следующими двумя строками: (Предостережение: как отмечено @dww, это решение не рекомендуется в документации ggplot2.)

ggSPolysdf_0 = fortify(SPolysdf)
ggSPolysdf = cbind(ggSPolysdf_0, data = rep(as.vector(data), each=5))

Альтернативой является использование пакета sf. В следующем коде, команда st_coordinates играет роль fortify в ggplot2. Обратите внимание, что в настоящем методе имена переменных теряются при преобразовании и должны быть восстановлены вручную:

library(sf)
sfSPolys = st_as_sf(SPolysdf)
coord_xy_SPolys = st_coordinates(sfSPolys)
coord_xyz_SPolys = cbind(coord_xy_SPolys, data = rep(as.vector(data), each=5))
ggSPolysdf = as.data.frame(coord_xyz_SPolys)
colnames(ggSPolysdf) <- c("long", "lat", "piece", "id", "data")

И, наконец, мы можем построить:

ggplot(df, aes(y=lat, x=lon, fill=temp)) + 
  geom_polygon(mapping=aes(long,lat,fill=data, group=id), data=ggSPolysdf) +
  borders('world', colour='gray50', size=.2) + 
  coord_quickmap(xlim=range(lon), ylim=range(lat)) +
  scale_fill_distiller(palette='Spectral') +
  theme_minimal()