Построение функции в R
У меня есть несколько datapoints (x и y), которые, похоже, имеют логарифмическое соотношение.
> mydata
x y
1 0 123
2 2 116
3 4 113
4 15 100
5 48 87
6 75 84
7 122 77
> qplot(x, y, data=mydata, geom="line")
![plot]()
Теперь я хотел бы найти базовую функцию, которая соответствует графику и позволяет мне выводить другие точки данных (т.е. 3
или 82
). Я читал о lm
и nls
, но я ничего не понимаю.
Сначала я создал функцию, из которой я думал, что она больше похожа на сюжет:
f <- function(x, a, b) {
a * exp(b *-x)
}
x <- seq(0:100)
y <- f(seq(0:100), 1,1)
qplot(x,y, geom="line")
![plot2]()
Затем я попытался создать подходящую модель с помощью nls
:
> fit <- nls(y ~ f(x, a, b), data=mydata, start=list(a=1, b=1))
Error in numericDeriv(form[[3]], names(ind), env) :
Missing value or an Infinity produced when evaluating the model
Может ли кто-нибудь указать мне в правильном направлении, что делать дальше?
Последующие действия
После прочтения ваших комментариев и поиска по всему миру немного изменил начальные параметры для a
, b
и c
, а затем неожиданно модель сходилась.
fit <- nls(y~f(x,a,b,c), data=data.frame(mydata), start=list(a=1, b=30, c=-0.3))
x <- seq(0,120)
fitted.data <- data.frame(x=x, y=predict(fit, list(x=x))
ggplot(mydata, aes(x, y)) + geom_point(color="red", alpha=.5) + geom_line(alpha=.5) + geom_line(data=fitted.data)
![plot3]()
Ответы
Ответ 1
Возможно, использование кубической спецификации для вашей модели и оценка через lm
даст вам хорошую форму.
# Importing your data
dataset <- read.table(text='
x y
1 0 123
2 2 116
3 4 113
4 15 100
5 48 87
6 75 84
7 122 77', header=T)
# I think one possible specification would be a cubic linear model
y.hat <- predict(lm(y~x+I(x^2)+I(x^3), data=dataset)) # estimating the model and obtaining the fitted values from the model
qplot(x, y, data=dataset, geom="line") # your plot black lines
last_plot() + geom_line(aes(x=x, y=y.hat), col=2) # the fitted values red lines
# It fits good.
![enter image description here]()
Ответ 2
Попробуйте взять журнал переменной ответа и затем с помощью lm
установить линейную модель:
fit <- lm(log(y) ~ x, data=mydata)
Скорректированный R-квадрат равен 0,8486, что по номиналу не плохо. Вы можете посмотреть, как подойдет сюжет, например:
plot(fit, which=2)
Но, возможно, это не так хорошо подходит в конце концов:
last_plot() + geom_line(aes(x=x, y=exp(fit$fitted.values)))
Ответ 3
Отметьте этот документ: http://cran.r-project.org/doc/contrib/Ricci-distributions-en.pdf
Вкратце, сначала вам нужно выбрать модель, которая будет соответствовать вашим данным (например, экспоненциальным), а затем оценить ее параметры.
Вот некоторые широко используемые дистрибутивы:
http://www.itl.nist.gov/div898/handbook/eda/section3/eda366.htm