adatok olvasása Excel fájlokból (xls,xlsx,csv) R-be-Gyors útmutató
adatok olvasása az Excel fájlokból az R-be, így sokan még mindig mentik az adatkészletet az R – be, de néha sok nehézséggel szembesülnek az adatelemzéssel, miközben az adatkészletet R-be töltik, kihasználhatjuk az R funkciók erejét.
ebben az oktatóanyagban leírjuk, hogyan lehet az excel data XLS vagy xlsx fájlformátumokat r-be olvasni.
adatok olvasása Excel fájlokból R
readxl csomag
ha nincs telepítve readxl csomag akkor használhatja az alábbi kódot
ismételt intézkedések ANOVA R teljes bemutató ”
install.packages("readxl")
library("readxl")
az XLS és xlsx formátum olvasása az alábbiakban található.
xls fájlokhoz
data<- read_excel("file.xls")
xlsx fájlokhoz
data <- read_excel("file.xlsx")
a fájl alapján interaktív módon választhat fájlt.választ () funkció. Ez időigényes, ezért nem ajánlott.
data <- read_excel(file.choose())
képzelje el, ha több lapja van, akkor használhatja az argumentumlapot.
meg kell adnia a lapot a neve szerint
data <- read_excel("my_file.xlsx", sheet = "sheetname")
megadhatja a lapot az indexe szerint
data <- read_excel("my_file.xlsx", sheet = 2)
néha az excel lap tartalmazza a hiányzó értékeket, ha a fájlt R-ben olvassa, üres cellaként jelenik meg, elkerülheti az ilyen típusú problémákat az NA argumentum beállítása közben.
QQ-telkek R – ben: Kvantilis-Kvantilis telkek-gyors üzembe helyezési útmutató ”
data <- read_excel("file.xlsx", na = "---")
ha több excel fájlt szeretne olvasni, akkor,
library(readxl)file.list <- list.files(pattern='*.xlsx')df.list <- lapply(file.list, read_excel)
ha a fájlokat alkönyvtárakba is be szeretné vonni, akkor
file.list <- list.files(pattern='*.xlsx', recursive = TRUE)
tegyük fel, hogy az összes lapnak ugyanaz az oszlopneve van, akkor használhatja a bind_rows,
library(dplyr)df <- bind_rows(df.list, .id = "id")
xlsx csomag
az egyik másik csomag xlsx, java-alapú megoldás, az olvasás, írás és formázás excel fájlokat R.
ha nincs telepítve, akkor telepíteni a csomagot alapján alábbi kódot.
install.packages("xlsx")
töltsük be az xlsx csomagot R.
library("xlsx")
hogyan kell használni az xlsx csomagot?
KNN algoritmus Gépi tanulás “osztályozás & regresszió”
a xlsx pakage főleg két funkciót olvasni.xlsx () és olvasni.xlsx2 ()
tegyük fel, hogy ha nagyobb fájljai vannak, akkor olvassa el.xlsx2 () funkció ajánlott, mert ez a terhelés gyorsabb, mint olvasni.xlsx.
az Xlsx csomag formátuma az alábbiakban található.
read.xlsx(file, sheetIndex, header=TRUE)read.xlsx2(file, sheetIndex, header=TRUE)
a fájl elérési útját jelző fájl
sheetIndex jelölje meg az olvasandó lap indexét
a fejléc logikai értéket jelöl. Ha a fejléc igaz, akkor az első sor oszlopnévnek számít.
library("xlsx")data <- read.xlsx(file.choose(), 1) # read first sheetdata <- read.xlsx("file.xlsx", 1) # read first sheetdata <- read.xlsx("file.xlsx", sheetName="Sheet1") # read the data contains in Sheet1
az adatok importálásának másik módja az Excelből történő másolás és az R-be történő importálás
ha windows rendszert használ,
extrém színátmenet növelése az R “végső útmutató”
data <- read.table(file = "clipboard", sep = "\t", header=TRUE)
MAC OSX rendszer
data <- read.table(pipe("pbpaste"), sep="\t", header = TRUE)
ez nem a jobb módja az adatok importálása R
openxlsx csomag
openxlsx csomag egy másik alternatívája readxl csomag
library(openxlsx)read.xlsx(file_path)
vagy
read.xlsx(file_path, cols = 1:2, rows = 2:3)
XLConnect csomag
az xlconnect az xlsx csomag alternatívája
install.packages("XLConnect")library(XLConnect)data <- readWorksheetFromFile(file_path, sheet = "list-column", startRow = 1, endRow = 10, startCol = 1, endCol = 3)
ha több lapot szeretne olvasni, akkor
több lap olvasása
load <- loadWorkbook(file_path)data <- readWorksheet(load, sheet = "list-column", startRow = 1, endRow = 10, startCol = 1, endCol = 3)data2 <- readWorksheet(load, sheet = "two-row-header", startRow = 1, endRow = 10, startCol = 1, endCol = 4)
ebben a csomagban yu importálhat egy megnevezett régiót egyszer
data <- readNamedRegionFromFile(file, # File path name, # Region name ...) # Arguments of readNamedRegion()
több megnevezett régió olvasása
naiv Bayes osztályozás R “előrejelzési modellben”
load <- loadWorkbook(file_path)data <- readNamedRegion(load, name_Region_1, ...)data2 <- readNamedRegion(load, name_Region_2, ...)
ha csv fájlja van, akkor
data<-read.csv("file.csv",1)
néha Excel fájlok olvasása JAVA hibák fordulhatnak elő, elkerülheti ezeket a problémákat, miközben a java elérési útját írja be R
kinyomtatja a JAVA Home elérési útját R
Sys.getenv("JAVA_HOME")
beállítja a JAVA elérési útját
Sys.setenv(JAVA_HOME = "path_to_jre_java_folder")
a JRE mappa a számítógép Java mappájában található (Program Files)
élveztem ezt bemutató? Ne felejtsd el Megmutatni a szeretetedet, kérlek iratkozz fel a hírlevélre és kommenteld alább!
R Plot PCH szimbólumok: különböző pont alakzatok R ”
a post olvasás adatok Excel fájlok (xls,xlsx,csv) a R-Quick Guide jelent meg először finnstats.