Нахождение индекса максимального значения в R
У меня есть следующий фрейм данных, называемый surge
:
MeshID StormID Rate Surge Wind
1 1412 1.0000E-01 0.01 0.0
2 1412 1.0000E-01 0.03 0.0
3 1412 1.0000E-01 0.09 0.0
4 1412 1.0000E-01 0.12 0.0
5 1412 1.0000E-01 0.02 0.0
6 1412 1.0000E-01 0.02 0.0
7 1412 1.0000E-01 0.07 0.0
1 1413 1.0000E-01 0.06 0.0
2 1413 1.0000E-01 0.02 0.0
3 1413 1.0000E-01 0.05 0.0
Я использовал следующий код, чтобы найти максимальное значение всплеска на шторм:
MaxSurge <- data.frame(tapply(surge[,4], surge[,2], max))
Он возвращает:
1412 0.12
1413 0.06
Это здорово, если не считать того, что он должен включать значение MeshID
в точке, где максимальный всплеск. Я знаю, что могу использовать which.max
, но я не могу понять, как это сделать. Я ОЧЕНЬ новичок в программировании R.
Ответы
Ответ 1
Если у вас есть 2 data.points в максимуме, which.max
будет относиться только к первому. Более полное решение включало бы rank
:
# data with a tie for max
surge <- data.frame(MeshID=c(1:7,1:4),StormID=c(rep(1412,7),
rep(1413,4)),Surge=c(0.01,0.03,0.09,0.12,0.02,0.02,0.07,0.06,0.02,0.05,0.06))
# compute ranks
surge$rank <- ave(-surge$Surge,surge$StormID,FUN=function(x) rank(x,ties.method="min"))
# subset on the rank
subset(surge,rank==1)
MeshID StormID Surge rank
4 4 1412 0.12 1
8 1 1413 0.06 1
11 4 1413 0.06 1
Ответ 2
И data.table
решение для элегантности кодирования
library(data.table)
surge <- as.data.table(surge)
surge[, .SD[which.max(surge)], by = StormID]
Ответ 3
вот еще одно решение data.table, но не полагаясь на .SD(таким образом, на 10 раз быстрее)
surge[,grp.ranks:=rank(-1*surge,ties.method='min'),by=StormID]
surge[grp.ranks==1,]
Ответ 4
Здесь plyr решение, только потому, что кто-то скажет это, если я не...
R> ddply(surge, "StormID", function(x) x[which.max(x$Surge),])
MeshID StormID Rate Surge Wind
1 4 1412 0.1 0.12 0
2 1 1413 0.1 0.06 0