Как получить CSV файл в R?

У меня есть этот CSV файл:

ID,GRADES,GPA,Teacher,State

3,"C",2,"Teacher3","MA"

1,"A",4,"Teacher1","California"

И то, что я хочу сделать, читается в файле с использованием статистического программного обеспечения R и читается в заголовке в какой-то список или массив (я новичок в R и искал, как это сделать, но так далеко не повезло).

Вот какой псевдокод того, что я хочу сделать:

inputfile=read.csv("C:/somedirectory")

for eachitem in row1:{

add eachitem to list
}

Затем я хочу иметь возможность использовать эти имена для вызова каждого вертикального столбца, чтобы выполнять вычисления.

Я пробовал по Google в течение часа, пытаясь выяснить, как это сделать, но там не так много работы с заголовками.

Спасибо за вашу помощь!

Ответы

Ответ 1

Вы упомянули, что вы будете вызывать каждый вертикальный столбец, чтобы выполнять вычисления. Я предполагаю, что вы просто хотите изучить каждую переменную. Это можно сделать следующим образом.

df <- read.csv("myRandomFile.csv", header=TRUE)

df$ID

df$GRADES

df$GPA

Может быть полезно просто назначить данные переменной.

var3 <- df$GPA

Ответ 2

Вам нужно read.csv("C:/somedirectory/some/file.csv"), и вообще не повредит, чтобы на самом деле посмотреть страницу справки, включая ее примерный раздел внизу.

Ответ 3

Как сказал Дирк, функция, которую вы используете, - это "read.csv" или один из других вариантов read.table. Учитывая ваши данные выше, я думаю, вы захотите сделать что-то вроде этого:

setwd("c:/random/directory")

df <- read.csv("myRandomFile.csv", header=TRUE)

Все, что мы сделали в приведенном выше, было установлено в каталог, где находится ваш .csv файл, а затем прочитать .csv в dataframe с именем df. Вы можете проверить правильность загрузки данных, проверив структуру объекта с помощью:

str(df)

Предполагая, что данные загружены правильно, вы можете подумать о том, чтобы выполнить любое количество статистических методов с данными в вашем кадре данных. Я думаю, что summary(df) будет хорошим местом для начала. Изучение того, как использовать помощь в R, будет очень полезно, и быстрое ознакомление с помощью CRAN поможет вам сэкономить много времени в будущем: http://cran.r-project.org/

Ответ 4

Вы можете использовать

df <- read.csv("filename.csv", header=TRUE)

# To loop each column
for (i in 1:ncol(df))
    {
    dosomething(df[,i])
    }
# To loop each row
for (i in 1:nrow(df))
    {
    dosomething(df[i,])
    }

Кроме того, вы можете захотеть взглянуть на функцию apply (тип ?apply или help(apply)), если вы хотите использовать одну и ту же функцию для каждой строки/столбца

Ответ 5

Пожалуйста, проверьте это, если это поможет вам

DF < -read.csv( "F:/test.csv", заголовок = FALSE, Nrows = 1) Д.Ф. V1 V2 V3 V4 V5 1 ID GRADES GPA Преподавательское государство < -c (DF) а [1] $V1 [1] ID Уровни: ID

а [2] $V2 [1] ВЫСТАВКИ Уровни: GRADES

а [3] $V3 [1] ГПД Уровни: GPA

а [4] $V4 [1] Учитель Уровни: Учитель

а [5] $V5 [1] Государство Уровни: состояние

Ответ 6

Поскольку вы говорите, что хотите получить доступ по позиции после чтения данных, вы должны знать о функциях подмножества/индексирования R.

Самый простой

df[row,column]
#example
df[1:5,] #rows 1:5, all columns
df[,5] #all rows, column 5.

Другие методы здесь. Я лично использую пакет dplyr для интуитивного управления данными (не по положению).