Lesen von Daten aus Excel-Dateien (xls,xlsx,csv) in R-Quick Guide
Lesen von Daten aus Excel-Dateien in R, so viele Leute speichern immer noch ihren Datensatz in R, aber manchmal kommen Sie zur Datenanalyse Mit vielen Schwierigkeiten beim Laden von Datensätzen in R können wir die Leistungsfähigkeit von R-Funktionen nutzen.
In diesem Tutorial werden wir beschreiben, wie Excel-Daten xls- oder XLSX-Dateiformate in R zu lesen.
Lesen von Daten aus Excel-Dateien in R
readxl-Paket
Wenn Sie das readxl-Paket nicht installiert haben, können Sie den folgenden Code verwenden
Wiederholte Messungen der ANOVA in R Komplettes Tutorial “
install.packages("readxl")
Laden Sie das readxl-Paket in R.
library("readxl")
Das Lesen des xls- und xlsx-Formats ist unten angegeben.
Für xls-Dateien
data<- read_excel("file.xls")
Für xlsx-Dateien
data <- read_excel("file.xlsx")
Sie können eine Datei interaktiv basierend auf der Datei auswählen.wählen() Funktion. Dies ist zeitaufwendig, daher nicht zu empfehlen.
data <- read_excel(file.choose())
Stellen Sie sich vor, wenn Sie mehrere Blätter haben, können Sie dieses Blatt verwenden.
Sie müssen das Blatt anhand seines Namens angeben
data <- read_excel("my_file.xlsx", sheet = "sheetname")
Sie können das Blatt anhand seines Index angeben
data <- read_excel("my_file.xlsx", sheet = 2)
Manchmal enthält das Excel-Blatt die fehlenden Werte. Wenn Sie die Datei in R lesen, wird sie als leere Zelle angezeigt.
QQ-Diagramme in R: Quantil-Quantildiagramme-Kurzanleitung “
data <- read_excel("file.xlsx", na = "---")
Wenn Sie mehrere Excel-Dateien lesen möchten, dann,
library(readxl)file.list <- list.files(pattern='*.xlsx')df.list <- lapply(file.list, read_excel)
Wenn Sie die Dateien auch in Unterverzeichnisse aufnehmen möchten, dann
file.list <- list.files(pattern='*.xlsx', recursive = TRUE)
Angenommen, alle Blätter haben denselben Spaltennamen, dann können Sie bind_rows,
library(dplyr)df <- bind_rows(df.list, .id = "id")
xlsx-Paket
Eines der anderen Pakete ist xlsx, eine Java-basierte Lösung zum Lesen, Schreiben und Formatieren von Excel-Dateien in R.
Wenn Sie nicht installiert sind, können Sie das Paket basierend auf dem folgenden Code installieren.
install.packages("xlsx")
Laden wir das xlsx-Paket in R.
library("xlsx")
Wie verwende ich das xlsx-Paket?
KNN Algorithmus Maschine Lernen “ Klassifizierung & Regression “
In xlsx pakage vor allem zwei funktionen lesen.xlsx() und lesen.xlsx2()
Angenommen, wenn Sie größere Dateien haben, lesen Sie.die Funktion xlsx2 () wird empfohlen, da sie schneller geladen als gelesen wird.xlsx.
Das Xlsx-Paketformat ist unten angegeben.
read.xlsx(file, sheetIndex, header=TRUE)read.xlsx2(file, sheetIndex, header=TRUE)
Datei, die den Dateipfad angibt
sheetIndex Geben Sie den Index des zu lesenden Blattes an
Header gibt einen logischen Wert an. Wenn header TRUE ist, wird die erste Zeile als Spaltenname betrachtet.
library("xlsx")data <- read.xlsx(file.choose(), 1) # read first sheetdata <- read.xlsx("file.xlsx", 1) # read first sheetdata <- read.xlsx("file.xlsx", sheetName="Sheet1") # read the data contains in Sheet1
Eine andere Möglichkeit zum Importieren von Daten besteht darin, Daten aus Excel zu kopieren und in R zu importieren
Wenn Sie das Windows-System verwenden,
Extreme Gradient Boosting in R “ Ultimate Guide “
data <- read.table(file = "clipboard", sep = "\t", header=TRUE)
MAC OSX System
data <- read.table(pipe("pbpaste"), sep="\t", header = TRUE)
Dies ist nicht der bessere Weg, um Daten in R zu importieren
openxlsx Paket
openxlsx Paket ist eine weitere Alternative zu readxl Paket
library(openxlsx)read.xlsx(file_path)
oder
read.xlsx(file_path, cols = 1:2, rows = 2:3)
XLConnect Paket
XLConnect ist eine Alternative zum xlsx-Paket
install.packages("XLConnect")library(XLConnect)data <- readWorksheetFromFile(file_path, sheet = "list-column", startRow = 1, endRow = 10, startCol = 1, endCol = 3)
Wenn Sie mehrere Blätter lesen möchten, dann
Lesen mehrerer Blätter
load <- loadWorkbook(file_path)data <- readWorksheet(load, sheet = "list-column", startRow = 1, endRow = 10, startCol = 1, endCol = 3)data2 <- readWorksheet(load, sheet = "two-row-header", startRow = 1, endRow = 10, startCol = 1, endCol = 4)
In diesem Paket können Sie eine benannte Region einmal importieren
data <- readNamedRegionFromFile(file, # File path name, # Region name ...) # Arguments of readNamedRegion()
Lesen mehrerer benannter Regionen
Naive Bayes-Klassifikation in R „Vorhersagemodell “
load <- loadWorkbook(file_path)data <- readNamedRegion(load, name_Region_1, ...)data2 <- readNamedRegion(load, name_Region_2, ...)
Wenn Sie CSV-Datei haben, dann
data<-read.csv("file.csv",1)
Manchmal lesen Excel-Dateien JAVA-Fehler auftreten können, können Sie diese Probleme vermeiden, während Sie den Java-Pfad in R
Druckt den Pfad von JAVA Home in R
Sys.getenv("JAVA_HOME")
Setzt den Pfad von JAVA
Sys.setenv(JAVA_HOME = "path_to_jre_java_folder")
JRE-Ordner enthält im Java-Ordner Ihres Computers (Programme)
Genossen diese anleitung? Vergessen Sie nicht, Ihre Liebe zu zeigen, Bitte abonnieren Sie den Newsletter und KOMMENTIEREN Sie unten!
R Plot pch Symbole: Verschiedene Punktformen in R “
Der Beitrag Daten aus Excel-Dateien (xls,xlsx,csv) in R einlesen-Kurzanleitung erschien zuerst auf finnstats.