Lectura De Datos De Archivos De Excel (xls,xlsx,csv) en R-Quick Guide

. (Puede informar de un problema sobre el contenido en esta página aquí) ¿Desea compartir su contenido en R-bloggers? haga clic aquí si tiene un blog, o aquí si no lo tiene.

Leyendo datos de archivos de Excel en R, muchas personas aún guardan su conjunto de datos en R, pero a veces llegan al análisis de datos enfrentándose a muchas dificultades, mientras cargan el conjunto de datos en R, podemos hacer uso de la potencia de las funciones de R.

En este tutorial vamos a describir cómo leer los formatos de archivo xls o xlsx de datos de excel en R. Esto se puede hacer en función del uso del paquete readxl, xlsx, openxlsx o XLConnect.

Lectura de datos De archivos De Excel en R

Paquete readxl

Si no está instalado el paquete readxl, puede usar el siguiente código

Medidas repetidas de ANOVA en R Tutorial completo»

install.packages("readxl")

Carga el paquete readxl en R.

library("readxl")

A continuación se muestra la lectura de los formatos xls y xlsx.

Para archivos xls

data<- read_excel("file.xls")

Para archivos xlsx

data <- read_excel("file.xlsx")

Puede elegir un archivo de forma interactiva basado en el archivo.función choose (). Esto consume mucho tiempo, así que no se recomienda.

data <- read_excel(file.choose())

Imagine que si tiene varias hojas, puede hacer uso de la hoja de argumentos.

Debe especificar la hoja por su nombre

data <- read_excel("my_file.xlsx", sheet = "sheetname")

Puede especificar la hoja por su índice

data <- read_excel("my_file.xlsx", sheet = 2)

A veces, en la hoja de Excel contiene los valores que faltan, si está leyendo el archivo en R, se mostrará como una celda en blanco, puede evitar este tipo de problemas al configurar el argumento na.

QQ-gráficas en R: Cuantiles-Gráficas de Cuantiles-Guía de inicio rápido»

data <- read_excel("file.xlsx", na = "---")

Si desea leer varios archivos de Excel, entonces,

library(readxl)file.list <- list.files(pattern='*.xlsx')df.list <- lapply(file.list, read_excel)

Si también desea incluir los archivos en subdirectorios, entonces

file.list <- list.files(pattern='*.xlsx', recursive = TRUE)

Supongamos que todas las hojas tienen el mismo nombre de columna, puede usar bind_rows,

library(dplyr)df <- bind_rows(df.list, .id = "id")

paquete xlsx

Uno de los otros paquetes es xlsx, una solución basada en Java, para leer, escribir y formatear archivos de Excel en R.

Si no está instalado, puede instalar el paquete según el código siguiente.

install.packages("xlsx")

Carguemos el paquete xlsx en R.

library("xlsx")

¿Cómo usar el paquete xlsx?

Aprendizaje automático del algoritmo KNN «Clasificación & Regresión»

En xlsx pakage se leen principalmente dos funciones.xlsx () y read.xlsx2 ()

Supongamos que si tiene archivos más grandes, entonces lea.se recomienda la función xlsx2 () porque es de carga más rápida que de lectura.xlsx.

El formato de paquete Xlsx se da a continuación.

read.xlsx(file, sheetIndex, header=TRUE)read.xlsx2(file, sheetIndex, header=TRUE)

archivo que indica la ruta del archivo

El índice de la hoja a leer

el encabezado indica un valor lógico. Si el encabezado es VERDADERO, la primera fila se considera como nombres de columna.

library("xlsx")data <- read.xlsx(file.choose(), 1) # read first sheetdata <- read.xlsx("file.xlsx", 1) # read first sheetdata <- read.xlsx("file.xlsx", sheetName="Sheet1") # read the data contains in Sheet1

Otra forma de importar datos es copiar desde Excel e importarlos a R

Si está utilizando el sistema Windows,

Impulso de degradado extremo en R «Guía definitiva»

data <- read.table(file = "clipboard", sep = "\t", header=TRUE)

Sistema MAC OSX

data <- read.table(pipe("pbpaste"), sep="\t", header = TRUE)

esta no es la mejor manera de importar datos a R

Paquete openxlsx

el paquete openxlsx es otra alternativa al paquete readxl

library(openxlsx)read.xlsx(file_path)

o

read.xlsx(file_path, cols = 1:2, rows = 2:3)

paquete XLConnect

XLConnect es una alternativa al paquete xlsx

install.packages("XLConnect")library(XLConnect)data <- readWorksheetFromFile(file_path, sheet = "list-column", startRow = 1, endRow = 10, startCol = 1, endCol = 3)

Si desea leer varias hojas,

Leer varias hojas

load <- loadWorkbook(file_path)data <- readWorksheet(load, sheet = "list-column", startRow = 1, endRow = 10, startCol = 1, endCol = 3)data2 <- readWorksheet(load, sheet = "two-row-header", startRow = 1, endRow = 10, startCol = 1, endCol = 4)

En este paquete, puede Importar una región con nombre una vez

data <- readNamedRegionFromFile(file, # File path name, # Region name ...) # Arguments of readNamedRegion()

Leer varias regiones con nombre

Clasificación de Bayes ingenua en R «Modelo de predicción»

load <- loadWorkbook(file_path)data <- readNamedRegion(load, name_Region_1, ...)data2 <- readNamedRegion(load, name_Region_2, ...)

Si tiene un archivo csv, entonces

data<-read.csv("file.csv",1)

A veces se pueden producir errores de JAVA al leer archivos de excel, puede evitar esos problemas al establecer la ruta de acceso de java en R

Imprime la ruta de acceso de JAVA Home en R

Sys.getenv("JAVA_HOME")

Establece la ruta de acceso de JAVA

Sys.setenv(JAVA_HOME = "path_to_jre_java_folder")

la carpeta jre contiene dentro de la carpeta Java de su computadora (Archivos de programa)

Disfruté de esto tutorial? No se olvide de mostrar su amor, Por favor, Suscríbase al Boletín de noticias y COMENTAR a continuación!

R Trazar símbolos pch: Diferentes formas de puntos en R »

La entrada Leer datos de archivos de Excel (xls,xlsx,csv)en R-Guía rápida aparece primero en finnstats.

Leave a Reply

Tu dirección de correo electrónico no será publicada.