Ответ 1
Используйте пакет RODBC
:
library(RODBC)
wb <- "D:\\Data\\Masked Data.xlsb" # Give the file name
con2 <- odbcConnectExcel2007(wb)
data <- sqlFetch(con2, "Sheet1$") # Provide name of sheet
nrow(data)
Я пытаюсь открыть файл .xlsb в R и продолжать получать подобные ошибки.
Любые рекомендации по решению этой проблемы без необходимости загружать данные и сохранять их в другом формате?
read.xlsx(paste(OutputLocation,FileName, sep=""), sheetName = "Master Data")
Сообщения об ошибках: Ошибка в .jcall( "RJavaTools", "Ljava/lang/Object;", "invokeMethod", cl,: org.apache.poi.xssf.XLSBUnsupportedException:.XLSB Двоичные книги не поддерживаются
rigDataWB<-loadWorkbook(paste(OutputLocation,FileName, sep=""))
Сообщения об ошибках: Ошибка: XLSBUnsupportedException (Java):.XLSB Двоичные книги не поддерживаются
Обратите внимание:
Я не могу установить библиотеки Perl.
Я запускаю 64bit R.
Справка: http://www.milanor.net/blog/?p=779
Мои данные: http://phx.corporate-ir.net/phoenix.zhtml?c=79687&p=irol-reportsother
Используйте пакет RODBC
:
library(RODBC)
wb <- "D:\\Data\\Masked Data.xlsb" # Give the file name
con2 <- odbcConnectExcel2007(wb)
data <- sqlFetch(con2, "Sheet1$") # Provide name of sheet
nrow(data)
Одним из способов может быть использование ODBC:
require(RODBC)
if (any(grepl("*.xlsb", odbcDataSources(), fixed = TRUE))) {
download.file(url = "http://phx.corporate-ir.net/External.File?item=UGFyZW50SUQ9NTcwMjI1fENoaWxkSUQ9MjcxMjIxfFR5cGU9MQ==&t=1",
destfile = file.path(tempdir(), "test.xlsb"),
mode = "wb")
conn <- odbcConnectExcel2007( file.path(tempdir(), "test.xlsb"))
df <- sqlFetch(conn, sub("'(.*)\\$'", "\\1", sqlTables(conn)$TABLE_NAME)[4]) # read 4th sheet in the table name list
head(df, 10)
# F1 F2 F3 F4 F5 F6
# 1 <NA> <NA> <NA> <NA> <NA> NA
# 2 <NA> <NA> <NA> <NA> <NA> NA
# 3 <NA> <NA> <NA> <NA> <NA> NA
# 4 <NA> <NA> <NA> <NA> <NA> NA
# 5 Baker Hughes Gulf of Mexico Oil / Gas Split <NA> <NA> <NA> <NA> NA
# 6 <NA> <NA> <NA> <NA> <NA> NA
# 7 <NA> US Offshore Total\nGoM Gas\nGoM Oil \nGoM NA
# 8 1/7/00 127 123 116 7 NA
# 9 1/14/00 125 121 116 5 NA
# 10 1/21/00 125 121 116 5 NA
close(conn)
}
install.packages(RODBC) (RODBC) dataRead <- "Binary 2018-01-01.xlsb" ConnectionObj <-odbc (dataRead)
Вышеприведенный код не работает для меня без функции odbcConnectExcel2007 в пакете "RODBC" Error- {xml: code}
ConnectionObj <- odbcConnectExcel2007 (dataRead) Ошибка в odbcConnectExcel2007 (dataRead): не удалось найти функцию "odbcConnectExcel2007" {code}
Если вы получили следующую ошибку в R, пытаясь подключиться к .xlsb
:
[RODBC] ERROR: state IM002, code 0, message [Microsoft][ODBC Driver Manager] Data source name not found and no default driver specified
то, возможно, вам не хватает установить AccessDatabaseEngine_X64.exe
от Microsoft. У меня была эта проблема сегодня, и после установки этого файла у меня больше нет сообщений об ошибках.