čtení dat ze souborů aplikace Excel (xls,xlsx,csv) do R-Rychlý průvodce
čtení dat ze souborů aplikace Excel do R, takže mnoho lidí stále šetří svůj datový soubor v R, ale někdy přichází k analýze dat čelí mnoha obtížím, při načítání dat do R, můžeme využít sílu funkcí R.
v tomto tutoriálu budeme popisovat, jak číst data excel XLS nebo XLSX formáty souborů do R. To lze provést na základě použití readxl, xlsx, openxlsx nebo xlconnect balíček.
čtení dat ze souborů aplikace Excel do R
readxl package
Pokud nejste nainstalováni readxl package, můžete použít níže uvedený kód
opakovaná opatření ANOVA v r kompletní tutoriál “
install.packages("readxl")
načíst balíček readxl do R.
library("readxl")
čtení formátu xls a xlsx je uvedeno níže.
pro soubory xls
data<- read_excel("file.xls")
pro soubory xlsx
data <- read_excel("file.xlsx")
můžete vybrat soubor interaktivně na základě souboru.zvolte funkci (). To je časově náročné, takže se nedoporučuje.
data <- read_excel(file.choose())
Představte si, že pokud máte více listů, můžete použít argumentový list.
musíte zadat list podle jeho názvu
data <- read_excel("my_file.xlsx", sheet = "sheetname")
můžete zadat list podle jeho indexu
data <- read_excel("my_file.xlsx", sheet = 2)
někdy v listu aplikace excel obsahuje chybějící hodnoty, pokud čtete soubor v R, zobrazí se jako prázdná buňka, můžete se vyhnout těmto druhům problémů při nastavení argumentu na.
QQ-pozemky v R: Quantile-Quantile pozemky-Stručný návod “
data <- read_excel("file.xlsx", na = "---")
pokud chcete číst více souborů aplikace excel, pak,
library(readxl)file.list <- list.files(pattern='*.xlsx')df.list <- lapply(file.list, read_excel)
pokud chcete také zahrnout soubory do podadresářů, pak
file.list <- list.files(pattern='*.xlsx', recursive = TRUE)
Předpokládejme, že všechny listy mají stejný název sloupce, pak můžete použít bind_rows,
library(dplyr)df <- bind_rows(df.list, .id = "id")
xlsx balíček
jedním z dalších balíčků je xlsx, řešení založené na Javě, pro čtení, zápis a formátování souborů aplikace excel v r.
Pokud nejste nainstalováni, můžete balíček nainstalovat na základě níže uvedeného kódu.
install.packages("xlsx")
pojďme načíst balíček xlsx v r.
library("xlsx")
jak používat balíček xlsx?
KNN algoritmus strojového učení „klasifikace & regrese“
v xlsx pakage hlavně dvě funkce číst.xlsx () a číst.xlsx2 ()
Předpokládejme, že pokud máte větší soubory, přečtěte si je.funkce xlsx2 () se doporučuje, protože se načítá rychleji než čtení.xlsx.
Formát balíčku Xlsx je uveden níže.
read.xlsx(file, sheetIndex, header=TRUE)read.xlsx2(file, sheetIndex, header=TRUE)
soubor označující cestu k souboru
sheetIndex označuje index listu, který má být čten
záhlaví označuje logickou hodnotu. Pokud je záhlaví pravdivé, první řádek se považuje za názvy sloupců.
library("xlsx")data <- read.xlsx(file.choose(), 1) # read first sheetdata <- read.xlsx("file.xlsx", 1) # read first sheetdata <- read.xlsx("file.xlsx", sheetName="Sheet1") # read the data contains in Sheet1
dalším způsobem importu dat je kopírování z Excelu a import do R
pokud používáte systém windows,
eXtreme Gradient Boosting v r „Ultimate Guide“
data <- read.table(file = "clipboard", sep = "\t", header=TRUE)
MAC OSX system
data <- read.table(pipe("pbpaste"), sep="\t", header = TRUE)
to není lepší způsob importu dat do R
Openxlsx Package
openxlsx package je další alternativou k readxl package
library(openxlsx)read.xlsx(file_path)
nebo
read.xlsx(file_path, cols = 1:2, rows = 2:3)
xlconnect package
XLConnect je alternativou k XLSX package
install.packages("XLConnect")library(XLConnect)data <- readWorksheetFromFile(file_path, sheet = "list-column", startRow = 1, endRow = 10, startCol = 1, endCol = 3)
pokud si chcete přečíst několik listů, pak
čtení několika listů
load <- loadWorkbook(file_path)data <- readWorksheet(load, sheet = "list-column", startRow = 1, endRow = 10, startCol = 1, endCol = 3)data2 <- readWorksheet(load, sheet = "two-row-header", startRow = 1, endRow = 10, startCol = 1, endCol = 4)
v tomto balíčku můžete importovat pojmenovanou oblast jednou
data <- readNamedRegionFromFile(file, # File path name, # Region name ...) # Arguments of readNamedRegion()
čtení několika pojmenovaných oblastí
naivní Bayesova klasifikace v r „predikčním modelu“
load <- loadWorkbook(file_path)data <- readNamedRegion(load, name_Region_1, ...)data2 <- readNamedRegion(load, name_Region_2, ...)
pokud máte soubor csv, pak
data<-read.csv("file.csv",1)
někdy může dojít ke čtení souborů aplikace excel JAVA chyby, můžete se těmto problémům vyhnout, zatímco nastavení cesty java v r
vytiskne cestu JAVA Home v R
Sys.getenv("JAVA_HOME")
nastaví cestu JAVA
Sys.setenv(JAVA_HOME = "path_to_jre_java_folder")
jre složka obsahuje uvnitř složky Java vašeho počítače (Program Files)
výukový program? Nezapomeňte ukázat svou lásku, přihlaste se k odběru novinek a komentujte níže!
R Plot PCH symboly: různé tvary bodů v R “
příspěvek čtení dat ze souborů Excel (xls, xlsx, csv)do R-Rychlý průvodce se objevil jako první na finnstats.