Lecture De Données À Partir De Fichiers Excel (xls, xlsx, csv) dans R-Quick Guide
Lire des données à partir de fichiers Excel dans R, tant de personnes sauvegardent encore leur jeu de données dans R mais arrivent parfois à l’analyse de données confrontées à de nombreuses difficultés, lors du chargement de l’ensemble de données dans R, nous pouvons utiliser la puissance des fonctions R.
Dans ce tutoriel, nous allons décrire comment lire les formats de fichiers Excel xls ou xlsx dans R. Cela peut être fait en utilisant le package readxl, xlsx, openxlsx ou XLConnect.
Lecture de données à partir de fichiers Excel dans R
package readxl
Si vous n’êtes pas installé package readxl, vous pouvez utiliser le code ci-dessous
Mesures répétées d’ANOVA dans R Tutoriel complet »
install.packages("readxl")
Chargez le paquet readxl dans R.
library("readxl")
La lecture des formats xls et xlsx est donnée ci-dessous.
Pour les fichiers xls
data<- read_excel("file.xls")
Pour les fichiers xlsx
data <- read_excel("file.xlsx")
Vous pouvez choisir un fichier de manière interactive en fonction du fichier.choisissez la fonction (). Cela prend du temps et n’est donc pas recommandé.
data <- read_excel(file.choose())
Imaginez que si vous avez plusieurs feuilles, vous pouvez utiliser la feuille d’arguments.
Vous devez spécifier la feuille par son nom
data <- read_excel("my_file.xlsx", sheet = "sheetname")
Vous pouvez spécifier la feuille par son index
data <- read_excel("my_file.xlsx", sheet = 2)
Parfois, dans une feuille Excel contient les valeurs manquantes, si vous lisez le fichier dans R, il s’affichera comme une cellule vide, Vous pouvez éviter ce genre de problèmes en définissant l’argument na.
QQ-tracés dans R: Quantile – Tracés Quantiles – Guide de démarrage rapide »
data <- read_excel("file.xlsx", na = "---")
Si vous souhaitez lire plusieurs fichiers Excel, alors,
library(readxl)file.list <- list.files(pattern='*.xlsx')df.list <- lapply(file.list, read_excel)
Si vous souhaitez également inclure les fichiers dans des sous-répertoires, alors
file.list <- list.files(pattern='*.xlsx', recursive = TRUE)
Supposons que toutes les feuilles ont le même nom de colonne, vous pouvez utiliser bind_rows,
library(dplyr)df <- bind_rows(df.list, .id = "id")
paquet xlsx
L’un des autres paquets est xlsx, solution basée sur Java, pour lire, écrire et formater des fichiers Excel dans R.
Si vous n’êtes pas installé, vous pouvez installer le paquet en fonction du code ci-dessous.
install.packages("xlsx")
Chargeons le package xlsx dans R.
library("xlsx")
Comment utiliser le package xlsx?
Apprentissage automatique de l’algorithme KNN « Classification & Régression »
Dans le pakage xlsx principalement deux fonctions lues.xlsx() et lire.xlsx2()
Supposons que si vous avez des fichiers plus volumineux, lisez-les.la fonction xlsx2() est recommandée car elle se charge plus rapidement que la lecture.xlsx.
Le format de paquet Xlsx est donné ci-dessous.
read.xlsx(file, sheetIndex, header=TRUE)read.xlsx2(file, sheetIndex, header=TRUE)
fichier indiquant le chemin du fichier
sheetIndex indique l’index de la feuille à lire
l’en-tête indique une valeur logique. Si l’en-tête est VRAI, la première ligne est considérée comme des noms de colonne.
library("xlsx")data <- read.xlsx(file.choose(), 1) # read first sheetdata <- read.xlsx("file.xlsx", 1) # read first sheetdata <- read.xlsx("file.xlsx", sheetName="Sheet1") # read the data contains in Sheet1
Une autre façon d’importer des données consiste à copier à partir d’Excel et à importer dans R
Si vous utilisez le système Windows,
Augmentation de gradient extrême dans R « Guide ultime »
data <- read.table(file = "clipboard", sep = "\t", header=TRUE)
Système MAC OSX
data <- read.table(pipe("pbpaste"), sep="\t", header = TRUE)
ce n’est pas la meilleure façon d’importer des données dans R
package openxlsx
le package openxlsx est une autre alternative au package readxl
library(openxlsx)read.xlsx(file_path)
ou
read.xlsx(file_path, cols = 1:2, rows = 2:3)
package XLConnect
XLConnect est une alternative au package xlsx
install.packages("XLConnect")library(XLConnect)data <- readWorksheetFromFile(file_path, sheet = "list-column", startRow = 1, endRow = 10, startCol = 1, endCol = 3)
Si vous souhaitez lire plusieurs feuilles, alors
Lecture de plusieurs feuilles
load <- loadWorkbook(file_path)data <- readWorksheet(load, sheet = "list-column", startRow = 1, endRow = 10, startCol = 1, endCol = 3)data2 <- readWorksheet(load, sheet = "two-row-header", startRow = 1, endRow = 10, startCol = 1, endCol = 4)
Dans ce paquet, vous pouvez Importer une région nommée une fois
data <- readNamedRegionFromFile(file, # File path name, # Region name ...) # Arguments of readNamedRegion()
Lecture de plusieurs régions nommées
Classification naïve de Bayes dans le modèle de prédiction R »
load <- loadWorkbook(file_path)data <- readNamedRegion(load, name_Region_1, ...)data2 <- readNamedRegion(load, name_Region_2, ...)
Si vous avez un fichier csv, alors
data<-read.csv("file.csv",1)
Parfois, des erreurs JAVA de lecture de fichiers Excel peuvent se produire, vous pouvez éviter ces problèmes tout en séchant le chemin java dans R
Imprime le chemin de la maison JAVA dans R
Sys.getenv("JAVA_HOME")
Définit le chemin de JAVA
Sys.setenv(JAVA_HOME = "path_to_jre_java_folder")
le dossier jre contient dans le dossier Java de votre ordinateur (Fichiers de programme)
Apprécié tutoriel? N’oubliez pas de montrer votre amour, Veuillez vous abonner à la Newsletter et COMMENTER ci-dessous!
R Tracer les symboles pch: Différentes formes de points dans R »
The post Lecture de données à partir de fichiers Excel (xls, xlsx, csv) dans R – Guide rapide est apparu en premier sur finnstats.