Excelファイル(xls,xlsx,csv)からR-Quick Guideへのデータの読み込み
ExcelファイルからRにデータを読み込むと、多くの人がrにデータセットを保存していますが、時には多くの困難に直面しているデータ分析に来て、rにデータセットをロードしながら、R関数の力を利用することができます。これは、readxl、xlsx、openxlsx、またはXLConnectパッケージを使用して行うことができます。
ExcelファイルからRへのデータの読み取り
readxlパッケージ
readxlパッケージがインストールされていない場合は、以下のコードを使用できます
RでのANOVA”
install.packages("readxl")
readxlパッケージをRにロードします。
library("readxl")
xlsおよびxlsx形式の読み取りを以下に示します。
xlsファイルの場合
data<- read_excel("file.xls")
xlsxファイルの場合
data <- read_excel("file.xlsx")
ファイルに基づいて対話的にファイルを選択できます。choose()関数。 これは時間がかかるのでお勧めしません。
data <- read_excel(file.choose())
あなたが複数のシートを持っているなら、あなたは引数シートを利用することができます想像してみてください。
あなたはその名前でシートを指定する必要があります
data <- read_excel("my_file.xlsx", sheet = "sheetname")
あなたはそのインデックスでシートを指定することができます
data <- read_excel("my_file.xlsx", sheet = 2)
時にはexcelシートに欠損値が含まれていますが、rでファイルを読み込んでいる場合は空白のセルとして表示されます。na引数を設定しながら、これらの種類の問題を回避することができます。
QQ-rでのプロット:分位数-分位数プロット-クイックスタートガイド”
data <- read_excel("file.xlsx", na = "---")
複数のexcelファイルを読みたい場合は、次のようにします。,
library(readxl)file.list <- list.files(pattern='*.xlsx')df.list <- lapply(file.list, read_excel)
サブディレクトリにファイルも含めたい場合は、
file.list <- list.files(pattern='*.xlsx', recursive = TRUE)
すべてのシートが同じ列名を持っていると仮定し、bind_rowsを使用できます,
library(dplyr)df <- bind_rows(df.list, .id = "id")
xlsxパッケージ
別のパッケージの一つは、rでexcelファイルを読み書きし、フォーマットするためのxlsx、javaベースのソリューションです。
インストールされていない場合は、以下のコードに基づいてパッケージをインストールすることができます。
install.packages("xlsx")
Rにxlsxパッケージをロードしましょう。
library("xlsx")
xlsxパッケージを使用する方法は?
KNNアルゴリズム機械学習”分類&回帰”
xlsx pakageでは、主に二つの関数が読み込まれます。xlsx()と読み取ります。xlsx2()
あなたが大きなファイルを持っている場合は、読んだとします。xlsx2()関数は、読み取りよりも読み込みが速いため推奨されます。xlsx。
Xlsxパッケージの形式は以下の通りです。
read.xlsx(file, sheetIndex, header=TRUE)read.xlsx2(file, sheetIndex, header=TRUE)
ファイルパスを示すファイル
sheetIndexは、読み出されるシートのインデックスを示す
ヘッダは論理値を示す。 HeaderがTRUEの場合、最初の行は列名と見なされます。
library("xlsx")data <- read.xlsx(file.choose(), 1) # read first sheetdata <- read.xlsx("file.xlsx", 1) # read first sheetdata <- read.xlsx("file.xlsx", sheetName="Sheet1") # read the data contains in Sheet1
データをインポートする別の方法は、ExcelからコピーしてRにインポートすることです
windowsシステムを使用している場合は、
rの極端な勾配ブースト”Ultimate Guide”
data <- read.table(file = "clipboard", sep = "\t", header=TRUE)
MAC OSXシステム
data <- read.table(pipe("pbpaste"), sep="\t", header = TRUE)
これは、rにデータをインポートするより良い方法ではありません
openxlsxパッケージ
openxlsxパッケージは、readxlパッケージ
library(openxlsx)read.xlsx(file_path)
または
read.xlsx(file_path, cols = 1:2, rows = 2:3)
XLConnectパッケー7149>xlconnectはxlsxパッケージの代替です
install.packages("XLConnect")library(XLConnect)data <- readWorksheetFromFile(file_path, sheet = "list-column", startRow = 1, endRow = 10, startCol = 1, endCol = 3)
複数のシートを読みたい場合は
いくつかのシートを読む
load <- loadWorkbook(file_path)data <- readWorksheet(load, sheet = "list-column", startRow = 1, endRow = 10, startCol = 1, endCol = 3)data2 <- readWorksheet(load, sheet = "two-row-header", startRow = 1, endRow = 10, startCol = 1, endCol = 4)
このパッケージでは、名前付き領域を一度インポートすることができます
data <- readNamedRegionFromFile(file, # File path name, # Region name ...) # Arguments of readNamedRegion()
いくつかの名前付き領域を読む
Naive Bayes Classification in R”予測モデル”
load <- loadWorkbook(file_path)data <- readNamedRegion(load, name_Region_1, ...)data2 <- readNamedRegion(load, name_Region_2, ...)
csvファイルがある場合、
data<-read.csv("file.csv",1)
excelファイルを読み込むとJAVAエラーが発生することがありますが、r
JAVA HomeのパスをR
Sys.getenv("JAVA_HOME")
JAVAのパスを設定します
Sys.setenv(JAVA_HOME = "path_to_jre_java_folder")
jreフォル2139>
チュートリアル? あなたの愛を示すことを忘れてはいけない、ニュースレターを購読し、以下のコメントをしてください!
r Plot pch Symbols:Different point shapes in R”
the post Excelファイル(xls,xlsx,csv)からR-Quick Guideにデータを読み込むappeared first on finnstats.