Как получить CSV файл в R?
У меня есть этот CSV файл:
ID,GRADES,GPA,Teacher,State
3,"C",2,"Teacher3","MA"
1,"A",4,"Teacher1","California"
И то, что я хочу сделать, читается в файле с использованием статистического программного обеспечения R и читается в заголовке в какой-то список или массив (я новичок в R и искал, как это сделать, но так далеко не повезло).
Вот какой псевдокод того, что я хочу сделать:
inputfile=read.csv("C:/somedirectory")
for eachitem in row1:{
add eachitem to list
}
Затем я хочу иметь возможность использовать эти имена для вызова каждого вертикального столбца, чтобы выполнять вычисления.
Я пробовал по Google в течение часа, пытаясь выяснить, как это сделать, но там не так много работы с заголовками.
Спасибо за вашу помощь!
Ответы
Ответ 1
Вы упомянули, что вы будете вызывать каждый вертикальный столбец, чтобы выполнять вычисления. Я предполагаю, что вы просто хотите изучить каждую переменную. Это можно сделать следующим образом.
df <- read.csv("myRandomFile.csv", header=TRUE)
df$ID
df$GRADES
df$GPA
Может быть полезно просто назначить данные переменной.
var3 <- df$GPA
Ответ 2
Вам нужно read.csv("C:/somedirectory/some/file.csv")
, и вообще не повредит, чтобы на самом деле посмотреть страницу справки, включая ее примерный раздел внизу.
Ответ 3
Как сказал Дирк, функция, которую вы используете, - это "read.csv" или один из других вариантов read.table. Учитывая ваши данные выше, я думаю, вы захотите сделать что-то вроде этого:
setwd("c:/random/directory")
df <- read.csv("myRandomFile.csv", header=TRUE)
Все, что мы сделали в приведенном выше, было установлено в каталог, где находится ваш .csv файл, а затем прочитать .csv в dataframe с именем df. Вы можете проверить правильность загрузки данных, проверив структуру объекта с помощью:
str(df)
Предполагая, что данные загружены правильно, вы можете подумать о том, чтобы выполнить любое количество статистических методов с данными в вашем кадре данных. Я думаю, что summary(df)
будет хорошим местом для начала. Изучение того, как использовать помощь в R, будет очень полезно, и быстрое ознакомление с помощью CRAN поможет вам сэкономить много времени в будущем: http://cran.r-project.org/
Ответ 4
Вы можете использовать
df <- read.csv("filename.csv", header=TRUE)
# To loop each column
for (i in 1:ncol(df))
{
dosomething(df[,i])
}
# To loop each row
for (i in 1:nrow(df))
{
dosomething(df[i,])
}
Кроме того, вы можете захотеть взглянуть на функцию apply
(тип ?apply
или help(apply)
), если вы хотите использовать одну и ту же функцию для каждой строки/столбца
Ответ 5
Пожалуйста, проверьте это, если это поможет вам
DF < -read.csv( "F:/test.csv", заголовок = FALSE, Nrows = 1) Д.Ф. V1 V2 V3 V4 V5 1 ID GRADES GPA Преподавательское государство < -c (DF) а [1] $V1 [1] ID Уровни: ID
а [2] $V2 [1] ВЫСТАВКИ Уровни: GRADES
а [3] $V3 [1] ГПД Уровни: GPA
а [4] $V4 [1] Учитель Уровни: Учитель
а [5] $V5 [1] Государство Уровни: состояние
Ответ 6
Поскольку вы говорите, что хотите получить доступ по позиции после чтения данных, вы должны знать о функциях подмножества/индексирования R.
Самый простой
df[row,column]
#example
df[1:5,] #rows 1:5, all columns
df[,5] #all rows, column 5.
Другие методы здесь. Я лично использую пакет dplyr для интуитивного управления данными (не по положению).