odczyt danych z plików Excel (xls,XLSX,csv) do R-Quick Guide
odczytywanie danych z plików Excel do R, tak wiele osób nadal zapisuje swój zbiór danych w R, ale czasami przychodzi do analizy danych napotykając wiele trudności, podczas ładowania zestawu danych do R, możemy skorzystać z mocy funkcji R.
w tym tutorialu opiszemy, jak odczytać dane Excela w formatach xls lub XLSX do R. można to zrobić w oparciu o użycie pakietu readxl, XLSX, openxlsx lub xlconnect.
odczyt danych z plików Excel do R
pakiet readxl
jeśli nie masz zainstalowanego pakietu readxl, możesz użyć poniższego kodu
powtórzone miary ANOVA w R kompletny samouczek ”
install.packages("readxl")
załaduj pakiet readxl do R.
library("readxl")
odczyt formatu xls i xlsx podano poniżej.
dla plików xls
data<- read_excel("file.xls")
dla plików xlsx
data <- read_excel("file.xlsx")
możesz wybrać plik interaktywnie na podstawie pliku.wybierz funkcję (). Jest to czasochłonne, więc nie zaleca się.
data <- read_excel(file.choose())
wyobraź sobie, że masz wiele arkuszy, możesz użyć arkusza argumentów.
musisz określić arkusz według jego nazwy
data <- read_excel("my_file.xlsx", sheet = "sheetname")
możesz określić arkusz według jego indeksu
data <- read_excel("my_file.xlsx", sheet = 2)
czasami w arkuszu excel zawiera brakujące wartości, jeśli czytasz plik w R, wyświetli się jako pusta komórka, możesz uniknąć tego rodzaju problemów podczas ustawiania argumentu na.
QQ-wykresy W R: Kwantyl-Kwantyl wykresy-Quick Start Guide ”
data <- read_excel("file.xlsx", na = "---")
jeśli chcesz odczytać wiele plików Excela to,
library(readxl)file.list <- list.files(pattern='*.xlsx')df.list <- lapply(file.list, read_excel)
jeśli chcesz również dołączyć pliki do podkatalogów, to
file.list <- list.files(pattern='*.xlsx', recursive = TRUE)
Załóżmy, że wszystkie arkusze mają tę samą nazwę kolumny, możesz użyć bind_rows,
library(dplyr)df <- bind_rows(df.list, .id = "id")
Pakiet xlsx
jednym z innych pakietów jest XLSX, rozwiązanie oparte na Javie, do odczytu, zapisu i formatowania plików excel w R.
jeśli nie jesteś zainstalowany, możesz zainstalować pakiet na podstawie poniższego kodu.
install.packages("xlsx")
załadujmy pakiet xlsx w R.
library("xlsx")
Jak korzystać z pakietu xlsx?
algorytm KNN Uczenie maszynowe „Klasyfikacja & regresja”
w XLSX pakage odczytuje się głównie dwie funkcje.xlsx () i read.Xlsx2 ()
Załóżmy, że jeśli masz większe pliki, to przeczytaj.funkcja xlsx2 () zalecana, ponieważ ładuje się szybciej niż odczyt.xlsx.
Format pakietu Xlsx podano poniżej.
read.xlsx(file, sheetIndex, header=TRUE)read.xlsx2(file, sheetIndex, header=TRUE)
plik wskazujący ścieżkę do pliku
sheetIndex wskazuje indeks czytanego arkusza
nagłówek wskazuje wartość logiczną. Jeśli nagłówek jest prawdziwy, to pierwszy wiersz jest traktowany jako nazwy kolumn.
library("xlsx")data <- read.xlsx(file.choose(), 1) # read first sheetdata <- read.xlsx("file.xlsx", 1) # read first sheetdata <- read.xlsx("file.xlsx", sheetName="Sheet1") # read the data contains in Sheet1
innym sposobem importowania danych jest kopiowanie z programu Excel i importowanie do R
jeśli używasz systemu windows,
Extreme Gradient Boosting in R „Ultimate Guide”
data <- read.table(file = "clipboard", sep = "\t", header=TRUE)
system MAC OSX
data <- read.table(pipe("pbpaste"), sep="\t", header = TRUE)
nie jest to lepszy sposób importowania danych do R
Pakiet openxlsx
pakiet openxlsx jest kolejną alternatywą dla pakietu readxl
library(openxlsx)read.xlsx(file_path)
lub
read.xlsx(file_path, cols = 1:2, rows = 2:3)
pakiet XLConnect
xlconnect jest alternatywą dla pakietu xlsx
install.packages("XLConnect")library(XLConnect)data <- readWorksheetFromFile(file_path, sheet = "list-column", startRow = 1, endRow = 10, startCol = 1, endCol = 3)
jeśli chcesz przeczytać kilka arkuszy to
Czytanie kilku arkuszy
load <- loadWorkbook(file_path)data <- readWorksheet(load, sheet = "list-column", startRow = 1, endRow = 10, startCol = 1, endCol = 3)data2 <- readWorksheet(load, sheet = "two-row-header", startRow = 1, endRow = 10, startCol = 1, endCol = 4)
w tym pakiecie YU może zaimportować nazwany region raz
data <- readNamedRegionFromFile(file, # File path name, # Region name ...) # Arguments of readNamedRegion()
Czytanie kilku nazwanych regionów
naiwna Klasyfikacja Bayesa w modelu przewidywania R””
load <- loadWorkbook(file_path)data <- readNamedRegion(load, name_Region_1, ...)data2 <- readNamedRegion(load, name_Region_2, ...)
jeśli Masz plik csv to
data<-read.csv("file.csv",1)
czasami czytanie plików excel mogą wystąpić błędy JAVA, można uniknąć tych problemów podczas ustawiania ścieżki java W R
drukuje ścieżkę JAVA Home W R
Sys.getenv("JAVA_HOME")
ustawia ścieżkę JAVA
Sys.setenv(JAVA_HOME = "path_to_jre_java_folder")
folder jre zawiera wewnątrz folderu Java komputera (pliki programów)
tutorial? Nie zapomnij pokazać swojej miłości, Zapisz się do Newslettera i komentuj poniżej!
R Wykres Symbole pch: różne kształty punktów w R ”
the post odczyt danych z plików Excel (xls,XLSX,csv) do R-Szybka porada appeared first on finnstats.