citirea datelor din fișiere Excel (xls,xlsx,csv) în R-ghid rapid
citirea datelor din fișierele Excel în R, atât de mulți oameni încă își salvează setul de date în R, dar uneori vin la analiza datelor care se confruntă cu o mulțime de dificultăți, în timp ce încărcăm setul de date în R, putem folosi puterea funcțiilor R.
în acest tutorial vom descrie cum să citiți formatele de fișiere excel XLS sau XLSX în R. acest lucru se poate face pe baza utilizării pachetului readxl, xlsx, openxlsx sau xlconnect.
citirea datelor din fișierele Excel în R
pachetul readxl
dacă nu sunteți instalat pachetul readxl, atunci puteți utiliza codul de mai jos
măsuri repetate ale ANOVA în tutorialul complet R”
install.packages("readxl")
încărcați pachetul readxl în R.
library("readxl")
citirea formatului xls și XLSX este prezentată mai jos.
pentru fișierele xls
data<- read_excel("file.xls")
pentru fișierele xlsx
data <- read_excel("file.xlsx")
puteți alege un fișier interactiv bazat pe fișier.alege () funcție. Acest lucru este consumatoare de timp, deci nu este recomandat.
data <- read_excel(file.choose())
Imaginați-vă dacă aveți mai multe foi, atunci puteți face uz de foaie argument.
trebuie să specificați foaie de numele său
data <- read_excel("my_file.xlsx", sheet = "sheetname")
puteți specifica foaie de indicele său
data <- read_excel("my_file.xlsx", sheet = 2)
uneori, în excel foaie conține valorile lipsă, dacă citiți fișierul în R se va afișa ca o celulă goală, puteți evita aceste tipuri de probleme în timp ce setarea na argument.
QQ-parcele în R: Quantile-parcele Quantile – Ghid de pornire rapidă”
data <- read_excel("file.xlsx", na = "---")
dacă doriți să citiți mai multe fișiere excel, atunci,
library(readxl)file.list <- list.files(pattern='*.xlsx')df.list <- lapply(file.list, read_excel)
dacă doriți, de asemenea, să includă fișierele în subdirectoare, apoi
file.list <- list.files(pattern='*.xlsx', recursive = TRUE)
să presupunem că toate foile au același nume de coloană, atunci puteți face uz de bind_rows,
library(dplyr)df <- bind_rows(df.list, .id = "id")
Pachetul xlsx
unul dintre celelalte pachete este XLSX, soluție bazată pe java, pentru citirea, scrierea și formatarea fișierelor excel în R.
dacă nu sunteți instalat, puteți instala pachetul pe baza codului de mai jos.
install.packages("xlsx")
să încărcați pachetul xlsx în R.
library("xlsx")
cum să utilizați pachetul xlsx?
KNN algoritm Machine Learning „clasificare & regresie”
în XLSX pakage în principal două funcții citit.xlsx () și citit.xlsx2 ()
să presupunem că dacă aveți fișiere mai mari, atunci citiți.funcția xlsx2 () recomandată deoarece se încarcă mai repede decât citirea.XlX.
formatul pachetului Xlsx este prezentat mai jos.
read.xlsx(file, sheetIndex, header=TRUE)read.xlsx2(file, sheetIndex, header=TRUE)
fișier care indică calea fișierului
sheetIndex indică indexul foii de citit
antetul indică o valoare logică. Dacă antetul este adevărat, atunci primul rând este considerat ca nume de coloane.
library("xlsx")data <- read.xlsx(file.choose(), 1) # read first sheetdata <- read.xlsx("file.xlsx", 1) # read first sheetdata <- read.xlsx("file.xlsx", sheetName="Sheet1") # read the data contains in Sheet1
un alt mod de a importa date este copierea din Excel și importul în R
dacă utilizați sistemul windows,
Extreme Gradient creșterea în R „Ultimate Guide”
data <- read.table(file = "clipboard", sep = "\t", header=TRUE)
sistemul MAC OSX
data <- read.table(pipe("pbpaste"), sep="\t", header = TRUE)
aceasta nu este cea mai bună modalitate de a importa date în r
pachetul openxlsx
pachetul openxlsx este o altă alternativă la pachetul readxl
library(openxlsx)read.xlsx(file_path)
sau
read.xlsx(file_path, cols = 1:2, rows = 2:3)
pachetul XLConnect
xlconnect este o alternativă la pachetul xlsx
install.packages("XLConnect")library(XLConnect)data <- readWorksheetFromFile(file_path, sheet = "list-column", startRow = 1, endRow = 10, startCol = 1, endCol = 3)
dacă doriți să citiți mai multe foi, atunci
citirea mai multor foi
load <- loadWorkbook(file_path)data <- readWorksheet(load, sheet = "list-column", startRow = 1, endRow = 10, startCol = 1, endCol = 3)data2 <- readWorksheet(load, sheet = "two-row-header", startRow = 1, endRow = 10, startCol = 1, endCol = 4)
în acest pachet yu poate importa o regiune numită o dată
data <- readNamedRegionFromFile(file, # File path name, # Region name ...) # Arguments of readNamedRegion()
citirea mai multor regiuni numite
Clasificarea Bayes naivă în R „model de predicție”
load <- loadWorkbook(file_path)data <- readNamedRegion(load, name_Region_1, ...)data2 <- readNamedRegion(load, name_Region_2, ...)
dacă aveți fișier csv, atunci
data<-read.csv("file.csv",1)
uneori pot apărea erori de citire a fișierelor excel JAVA, puteți evita aceste probleme în timp ce setați calea java în R
imprimă calea JAVA Home în R
Sys.getenv("JAVA_HOME")
Setează calea JAVA
Sys.setenv(JAVA_HOME = "path_to_jre_java_folder")
folderul jre conține în folderul Java al computerului (Program Files)
mi-a plăcut asta tutorial? Nu uitați să vă arătați dragostea, vă rugăm să vă abonați la Newsletter și să comentați mai jos!
R Plot simboluri pch: diferite forme punctuale în R ”
datele post lectură din fișiere Excel (xls,XLSX,csv) în R-ghid rapid apărut pentru prima dată pe finnstats.