Lectura De Datos De Archivos De Excel (xls,xlsx,csv) en R-Quick Guide
Leyendo datos de archivos de Excel en R, muchas personas aún guardan su conjunto de datos en R, pero a veces llegan al análisis de datos enfrentándose a muchas dificultades, mientras cargan el conjunto de datos en R, podemos hacer uso de la potencia de las funciones de R.
En este tutorial vamos a describir cómo leer los formatos de archivo xls o xlsx de datos de excel en R. Esto se puede hacer en función del uso del paquete readxl, xlsx, openxlsx o XLConnect.
Lectura de datos De archivos De Excel en R
Paquete readxl
Si no está instalado el paquete readxl, puede usar el siguiente código
Medidas repetidas de ANOVA en R Tutorial completo»
install.packages("readxl")
Carga el paquete readxl en R.
library("readxl")
A continuación se muestra la lectura de los formatos xls y xlsx.
Para archivos xls
data<- read_excel("file.xls")
Para archivos xlsx
data <- read_excel("file.xlsx")
Puede elegir un archivo de forma interactiva basado en el archivo.función choose (). Esto consume mucho tiempo, así que no se recomienda.
data <- read_excel(file.choose())
Imagine que si tiene varias hojas, puede hacer uso de la hoja de argumentos.
Debe especificar la hoja por su nombre
data <- read_excel("my_file.xlsx", sheet = "sheetname")
Puede especificar la hoja por su índice
data <- read_excel("my_file.xlsx", sheet = 2)
A veces, en la hoja de Excel contiene los valores que faltan, si está leyendo el archivo en R, se mostrará como una celda en blanco, puede evitar este tipo de problemas al configurar el argumento na.
QQ-gráficas en R: Cuantiles-Gráficas de Cuantiles-Guía de inicio rápido»
data <- read_excel("file.xlsx", na = "---")
Si desea leer varios archivos de Excel, entonces,
library(readxl)file.list <- list.files(pattern='*.xlsx')df.list <- lapply(file.list, read_excel)
Si también desea incluir los archivos en subdirectorios, entonces
file.list <- list.files(pattern='*.xlsx', recursive = TRUE)
Supongamos que todas las hojas tienen el mismo nombre de columna, puede usar bind_rows,
library(dplyr)df <- bind_rows(df.list, .id = "id")
paquete xlsx
Uno de los otros paquetes es xlsx, una solución basada en Java, para leer, escribir y formatear archivos de Excel en R.
Si no está instalado, puede instalar el paquete según el código siguiente.
install.packages("xlsx")
Carguemos el paquete xlsx en R.
library("xlsx")
¿Cómo usar el paquete xlsx?
Aprendizaje automático del algoritmo KNN «Clasificación & Regresión»
En xlsx pakage se leen principalmente dos funciones.xlsx () y read.xlsx2 ()
Supongamos que si tiene archivos más grandes, entonces lea.se recomienda la función xlsx2 () porque es de carga más rápida que de lectura.xlsx.
El formato de paquete Xlsx se da a continuación.
read.xlsx(file, sheetIndex, header=TRUE)read.xlsx2(file, sheetIndex, header=TRUE)
archivo que indica la ruta del archivo
El índice de la hoja a leer
el encabezado indica un valor lógico. Si el encabezado es VERDADERO, la primera fila se considera como nombres de columna.
library("xlsx")data <- read.xlsx(file.choose(), 1) # read first sheetdata <- read.xlsx("file.xlsx", 1) # read first sheetdata <- read.xlsx("file.xlsx", sheetName="Sheet1") # read the data contains in Sheet1
Otra forma de importar datos es copiar desde Excel e importarlos a R
Si está utilizando el sistema Windows,
Impulso de degradado extremo en R «Guía definitiva»
data <- read.table(file = "clipboard", sep = "\t", header=TRUE)
Sistema MAC OSX
data <- read.table(pipe("pbpaste"), sep="\t", header = TRUE)
esta no es la mejor manera de importar datos a R
Paquete openxlsx
el paquete openxlsx es otra alternativa al paquete readxl
library(openxlsx)read.xlsx(file_path)
o
read.xlsx(file_path, cols = 1:2, rows = 2:3)
paquete XLConnect
XLConnect es una alternativa al paquete xlsx
install.packages("XLConnect")library(XLConnect)data <- readWorksheetFromFile(file_path, sheet = "list-column", startRow = 1, endRow = 10, startCol = 1, endCol = 3)
Si desea leer varias hojas,
Leer varias hojas
load <- loadWorkbook(file_path)data <- readWorksheet(load, sheet = "list-column", startRow = 1, endRow = 10, startCol = 1, endCol = 3)data2 <- readWorksheet(load, sheet = "two-row-header", startRow = 1, endRow = 10, startCol = 1, endCol = 4)
En este paquete, puede Importar una región con nombre una vez
data <- readNamedRegionFromFile(file, # File path name, # Region name ...) # Arguments of readNamedRegion()
Leer varias regiones con nombre
Clasificación de Bayes ingenua en R «Modelo de predicción»
load <- loadWorkbook(file_path)data <- readNamedRegion(load, name_Region_1, ...)data2 <- readNamedRegion(load, name_Region_2, ...)
Si tiene un archivo csv, entonces
data<-read.csv("file.csv",1)
A veces se pueden producir errores de JAVA al leer archivos de excel, puede evitar esos problemas al establecer la ruta de acceso de java en R
Imprime la ruta de acceso de JAVA Home en R
Sys.getenv("JAVA_HOME")
Establece la ruta de acceso de JAVA
Sys.setenv(JAVA_HOME = "path_to_jre_java_folder")
la carpeta jre contiene dentro de la carpeta Java de su computadora (Archivos de programa)
Disfruté de esto tutorial? No se olvide de mostrar su amor, Por favor, Suscríbase al Boletín de noticias y COMENTAR a continuación!
R Trazar símbolos pch: Diferentes formas de puntos en R »
La entrada Leer datos de archivos de Excel (xls,xlsx,csv)en R-Guía rápida aparece primero en finnstats.