het lezen van gegevens uit Excel-bestanden (xls,xlsx,csv) in R-Quick Guide
het lezen van gegevens uit Excel-bestanden in R, zo veel mensen nog steeds hun dataset op te slaan in R, maar soms komen naar data-analyse geconfronteerd met veel problemen, terwijl het laden van data set in R, kunnen we gebruik maken van de kracht van R functies.
in deze tutorial gaan we beschrijven hoe je excel data xls of xlsx bestandsindelingen kunt lezen in R. Dit kan gedaan worden op basis van het readxl, xlsx, openxlsx of XLConnect pakket.
lezen van gegevens uit Excel-bestanden in R
readxl package
Als u niet geà nstalleerd bent readxl package dan kunt u onderstaande code
herhaalde metingen van ANOVA gebruiken in R Complete Tutorial ”
install.packages("readxl")
Laad readxl pakket in R.
library("readxl")
het lezen van xls en xlsx formaat wordt hieronder gegeven.
voor xls-bestanden
data<- read_excel("file.xls")
voor xlsx-bestanden
data <- read_excel("file.xlsx")
kunt u interactief een bestand kiezen op basis van een bestand.kies () functie. Dit is tijdrovend dus niet aan te raden.
data <- read_excel(file.choose())
stel je voor dat je meerdere bladen hebt dan kun je gebruik maken van het argumentblad.
u moet het blad opgeven met zijn naam
data <- read_excel("my_file.xlsx", sheet = "sheetname")
u kunt het blad opgeven met zijn index
data <- read_excel("my_file.xlsx", sheet = 2)
soms bevat het Excel-blad de ontbrekende waarden, als u het bestand in R leest, wordt het weergegeven als een lege cel, u kunt dit soort problemen vermijden tijdens het instellen van na-argument.
QQ-plots in R: Quantile-Quantile Percelen-Quick-Start-Guide ”
data <- read_excel("file.xlsx", na = "---")
Als u wilt lezen, meerdere excel-bestanden en klik,
library(readxl)file.list <- list.files(pattern='*.xlsx')df.list <- lapply(file.list, read_excel)
Als u ook wilt opnemen, de bestanden in mappen, en klik vervolgens op
file.list <- list.files(pattern='*.xlsx', recursive = TRUE)
Stel dat alle bladen hebben dezelfde kolom naam dan kunt u gebruik maken van bind_rows,
library(dplyr)df <- bind_rows(df.list, .id = "id")
xlsx-Pakket
Een van de andere pakketten is xlsx, java-gebaseerde oplossing voor het lezen, schrijven en de opmaak van excel-bestanden in R.
Als u niet geïnstalleerd, dan kunt u het pakket installeert op basis van onderstaande code.
install.packages("xlsx")
laten we het XLSX-pakket laden in R.
library("xlsx")
Hoe wordt het XLSX-pakket gebruikt?
KNN algoritme Machine Learning “classificatie & regressie”
in xlsx pakage worden hoofdzakelijk twee functies gelezen.xlsx () en lezen.Xlsx2 ()
stel dat als je grotere bestanden dan gelezen.xlsx2 () functie aanbevolen omdat het laden sneller dan gelezen.xlsx.
XLSX-pakketformaat wordt hieronder gegeven.
read.xlsx(file, sheetIndex, header=TRUE)read.xlsx2(file, sheetIndex, header=TRUE)
bestand dat het bestandspad aangeeft
bladindex geef de index van het te lezen blad aan
header geeft een logische waarde aan. Als de kop waar is, wordt de eerste rij beschouwd als kolomnamen.
library("xlsx")data <- read.xlsx(file.choose(), 1) # read first sheetdata <- read.xlsx("file.xlsx", 1) # read first sheetdata <- read.xlsx("file.xlsx", sheetName="Sheet1") # read the data contains in Sheet1
een Andere manier van het importeren van gegevens is het kopiëren van Excel en importeren in R
Als u windows systeem,
eXtreme Verloop Stimuleren in R “Ultimate Guide”
data <- read.table(file = "clipboard", sep = "\t", header=TRUE)
MAC os x systeem
data <- read.table(pipe("pbpaste"), sep="\t", header = TRUE)
dit is niet de betere manier van het importeren van gegevens in R
openxlsx Pakket
openxlsx pakket is een ander alternatief voor readxl pakket
library(openxlsx)read.xlsx(file_path)
of
read.xlsx(file_path, cols = 1:2, rows = 2:3)
XLConnect pakket
XLConnect is een alternatief voor het xlsx-pakket
install.packages("XLConnect")library(XLConnect)data <- readWorksheetFromFile(file_path, sheet = "list-column", startRow = 1, endRow = 10, startCol = 1, endCol = 3)
Als u wilt lezen van meerdere vellen vervolgens op
het lezen van meerdere bladen
load <- loadWorkbook(file_path)data <- readWorksheet(load, sheet = "list-column", startRow = 1, endRow = 10, startCol = 1, endCol = 3)data2 <- readWorksheet(load, sheet = "two-row-header", startRow = 1, endRow = 10, startCol = 1, endCol = 4)
in dit pakket yu kan één keer een benoemde regio importeren
data <- readNamedRegionFromFile(file, # File path name, # Region name ...) # Arguments of readNamedRegion()
het lezen van verscheidene benoemde regio ‘s
naïeve Bayes Classification in R “Prediction Model”
load <- loadWorkbook(file_path)data <- readNamedRegion(load, name_Region_1, ...)data2 <- readNamedRegion(load, name_Region_2, ...)
als u een csv-bestand hebt dan
data<-read.csv("file.csv",1)
soms kunnen excel-bestanden worden gelezen JAVA-fouten kunnen optreden, U kunt deze problemen vermijden tijdens het zetten van het java-pad in R
drukt het pad af van JAVA Home in R
Sys.getenv("JAVA_HOME")
stelt het pad in van JAVA
Sys.setenv(JAVA_HOME = "path_to_jre_java_folder")
jre-map bevat in de Java-map van uw computer (programmabestanden)
tutorial? Vergeet niet om je liefde te tonen, schrijf je in op de nieuwsbrief en reageer hieronder!
R Plot pch-symbolen: verschillende puntvormen in R ”
het bericht gegevens uit Excel-bestanden (xls,xlsx,csv) in R-Quick Guide lezen appeared first on finnstats.