『壹』 如何用R讀取數據
在R語言裡面,有很多讀取數據的方法。R能讀文本文件,csv格式文件,通過RODBC包讀取資料庫數據等等。下面我介紹幾種最基本的讀取數據的方法!
工具/原料
RStudio
方法
不管是讀取數據還是寫入,R都是在工作路徑中完成的。所以首先我們要知道我們的R所在的工作路徑是在哪裡。使用getwd()函數來獲取我們的工作路徑。
下面查看工作路徑裡面有哪些文件,使用dir()函數
如果你所想導入的數據並不在你當前的工作路徑中,有兩種方法可以解決。第一種就是把數據文件放到工作路徑中,第二種方法就是更改工作路徑。更改工作路徑使用setwd()函數。比如你想要把工作路徑設置成桌面
現在我讀取我工作路徑中,名字為hw1_data.csv的文件。使用read.csv()函數
也可以使用read.table()函數來讀取csv格式的文件。由於csv文件的分隔符是「,」所以我們在用read.table()函數的時候,sep參數,我們要設定為sep=「,」
發現read.table()讀出來的數據,列名並不是我們文件中的列名,而是V1,V2。。。我們需要加上header這個參數來修改這個問題
另外在read.table()函數族中還有很多參數,對我們讀取數據都有幫助,大家可以去了解下。使用?read.table()進行了解
『貳』 R語言文件讀取
參考文章地址(https://zhuanlan.hu.com/p/120422644)
逗號分隔文件 (.csv文件)、 製表符分隔文件 (.tsv文件)和 空格分隔文件 (.txt文件)
(一).csv文件的讀取
mydata <- read.csv(file=" ", header=T, sep=",", quote="\", dec=".", fill=T, comment.char=" ")
comment.char用於設置需要跳過的內容,比如需要跳過的行前面有「#」,那麼設置comment.char=「#」,當然你也可以設置從中間開始讀,注意,這個函數是read.csv裡面的哦!
file: 以csv結尾的文件名,由文件所在路徑及其文件名構成
header:是否把第一行作為表頭
sep:分隔方式,csv文件分隔讀入參數設置為"."
tsv文件分隔讀入參數設置為"\t"
txt文件分隔為空格,不需要設置sep參數
也可以通過mydata <- read.table("D:/mydata.csv", header=T, sep=",", row.names="id")讀取
(二).tsv文件的讀取
mydata <- read.table("D:/mydata.tsv", header=T, sep="\t", row.names="id")
除了分隔方式跟上面一樣
(三).txt文件的讀取
mydata <- read.table("c:/mydata.txt", header=TRUE, row.names="id")
除了分隔方式跟上面一樣
(四)以.gz結尾的壓縮文件的讀取
1.在R中可以使用gzfile()的方式讀取壓縮文件
2.使用data.table包里的fread()函數
安裝並載入data.table包
install.packages("data.table")
library(data.table)
使用fread()函數讀取文件,這里參數和之前的一致,唯一的不同就是fread()可以直接讀取壓縮文件
mydata <- fread(『c:/mydata.txt.gz』, header=T, row.names=』id』)
(五)讀取.xlsx後綴文件,也就是excel文件
1. 安裝並載入openxlsx包
install.packages("openxlsx")
library(openxlsx)
2.進行數據的導入
mydata <- read.xlsx( "mydata.xlsx",rowNames=T)
其他參數可以通過? read.xlsx在R中根據需要進行添加的。
『叄』 R語言讀取大數據表格中有條件的子集
不知道你說的大表格有多大,但只要能載入到R語言的內存中運算就可以計算。使用subset函數內
假設數據集為x
java">a<-subset(x,A>30)
a<-subset(a,D>50)
subset第一容個參數是要篩選的數據集,第二個就是條件,像你說的問題,在第一步過濾的基礎上再過濾一次就行,也可以合並到一起。
『肆』 在r語言中用什麼命令讀取全部數據
使用R語言的時候,如果是少量數據,不妨使用c()或其他函數進行創建;但是對於大量數據,最好還是先通過其他更方便的軟體創建數據文件,然後使用R讀入這個文件。
.csv是非常好的數據文件格式,跨平台支持非常好。我在Excel或者SPSS中創建的數據,只要存為csv格式,就可以使用幾乎任何數據處理軟體對這些數據進行處理了。使用通用格式在多人合作、不同版本兼容等常見行為中,優勢十分明顯。另外,之所以使用不同的數據處理軟體,第一,可以取長補短。比如有些工作SPSS很復雜的,可以用R語言幾行命令搞定。第二,可以進行軟體間處理結果對照,發現問題。
R語言中讀取外部文件的最基本函數是read.table(),還有用來讀csv的read.csv(), .csv是非常好的數據文件格式,跨平台支持非常好。。
輸入help(read.table)命令,就看到了關於數據輸入函數的說明。
『伍』 r語言怎麼讀取txt文件
1、demo、txt用於測試: