Как получить список встроенных наборов данных в R?

Может ли кто-нибудь помочь, как получить список встроенных наборов данных и их пакетов зависимостей?

Ответы

Ответ 1

Существует несколько способов поиска включенных наборов данных в R:

1: Использование data() даст вам список наборов данных всех загруженных пакетов (а не только пакетов из пакета datasets); набор данных упорядочивается пакетом

2: Используя data(package = .packages(all.available = TRUE)), вы получите список всех наборов данных в доступных пакетах на вашем компьютере (т.е. также не загруженные)

3: Использование data(package = "packagename") даст вам наборы данных этого конкретного пакета, поэтому data(package = "plyr") предоставит наборы данных в пакете plyr


Если вы хотите узнать, в каком пакете находится набор данных (например, набор данных acme), вы можете сделать:

dat <- as.data.frame(data(package = .packages(all.available = TRUE))$results)
dat[dat$Item=="acme", c(1,3,4)]

который дает:

    Package Item                  Title
107    boot acme Monthly Excess Returns

Ответ 2

Мне часто нужно знать, какая структура наборов данных доступна, поэтому я создал dataStr в своем misc package.

dataStr <- function(package="datasets", ...)
  {
  d <- data(package=package, envir=new.env(), ...)$results[,"Item"]
  d <- sapply(strsplit(d, split=" ", fixed=TRUE), "[", 1)
  d <- d[order(tolower(d))]
  for(x in d){ message(x, ":  ", class(get(x))); message(str(get(x)))}
  }
dataStr()

Обратите внимание, что вывод в консоли довольно длинный.

Это тип вывода:

[...]

warpbreaks:  data.frame
'data.frame':   54 obs. of  3 variables:
 $ breaks : num  26 30 54 25 70 52 51 26 67 18 ...
 $ wool   : Factor w/ 2 levels "A","B": 1 1 1 1 1 1 1 1 1 1 ...
 $ tension: Factor w/ 3 levels "L","M","H": 1 1 1 1 1 1 1 1 1 2 ...

WorldPhones:  matrix
 num [1:7, 1:7] 45939 60423 64721 68484 71799 ...
 - attr(*, "dimnames")=List of 2
  ..$ : chr [1:7] "1951" "1956" "1957" "1958" ...
  ..$ : chr [1:7] "N.Amer" "Europe" "Asia" "S.Amer" ...

WWWusage:  ts
 Time-Series [1:100] from 1 to 100: 88 84 85 85 84 85 83 85 88 89 ...

Изменить. Чтобы получить более информативный вывод и использовать его для выгруженных пакетов или всех пакетов на пути поиска, используйте пересмотренную онлайн-версию с помощью

source("https://raw.githubusercontent.com/brry/berryFunctions/master/R/dataStr.R")

Ответ 3

Бежать

help(package = "datasets")

в консоли R Studio, и вы получите все доступные наборы данных на удобной вкладке Справка справа.

Ответ 4

Вот полный список наборов данных пакетов R, который ведет проф. Винсент Арел-Бандок. https://vincentarelbundock.github.io/Rdatasets/

Rdatasets - это набор из более чем 1200 наборов данных, которые изначально были распространены вместе со статистической программной средой R и некоторыми ее дополнительными пакетами. Цель состоит в том, чтобы сделать эти данные более доступными для обучения и разработки статистического программного обеспечения.