導航:首頁 > 網路數據 > r中讀取大數據函數

r中讀取大數據函數

發布時間:2024-03-11 13:50:48

『壹』 如何用R讀取數據

在R語言裡面,有很多讀取數據的方法。R能讀文本文件,csv格式文件,通過RODBC包讀取資料庫數據等等。下面我介紹幾種最基本的讀取數據的方法!

工具/原料
RStudio
方法
不管是讀取數據還是寫入,R都是在工作路徑中完成的。所以首先我們要知道我們的R所在的工作路徑是在哪裡。使用getwd()函數來獲取我們的工作路徑。

下面查看工作路徑裡面有哪些文件,使用dir()函數

如果你所想導入的數據並不在你當前的工作路徑中,有兩種方法可以解決。第一種就是把數據文件放到工作路徑中,第二種方法就是更改工作路徑。更改工作路徑使用setwd()函數。比如你想要把工作路徑設置成桌面

現在我讀取我工作路徑中,名字為hw1_data.csv的文件。使用read.csv()函數

也可以使用read.table()函數來讀取csv格式的文件。由於csv文件的分隔符是「,」所以我們在用read.table()函數的時候,sep參數,我們要設定為sep=「,」

發現read.table()讀出來的數據,列名並不是我們文件中的列名,而是V1,V2。。。我們需要加上header這個參數來修改這個問題

另外在read.table()函數族中還有很多參數,對我們讀取數據都有幫助,大家可以去了解下。使用?read.table()進行了解

『貳』 R語言文件讀取

參考文章地址(https://zhuanlan.hu.com/p/120422644)

逗號分隔文件 (.csv文件)、 製表符分隔文件 (.tsv文件)和 空格分隔文件 (.txt文件)

(一).csv文件的讀取

mydata <- read.csv(file=" ", header=T, sep=",", quote="\", dec=".", fill=T, comment.char=" ")

comment.char用於設置需要跳過的內容,比如需要跳過的行前面有「#」,那麼設置comment.char=「#」,當然你也可以設置從中間開始讀,注意,這個函數是read.csv裡面的哦!

file: 以csv結尾的文件名,由文件所在路徑及其文件名構成

header:是否把第一行作為表頭

sep:分隔方式,csv文件分隔讀入參數設置為"."

                               tsv文件分隔讀入參數設置為"\t"

                               txt文件分隔為空格,不需要設置sep參數

也可以通過mydata <- read.table("D:/mydata.csv", header=T, sep=",", row.names="id")讀取

(二).tsv文件的讀取

mydata <- read.table("D:/mydata.tsv", header=T, sep="\t", row.names="id")

除了分隔方式跟上面一樣

(三).txt文件的讀取

mydata <- read.table("c:/mydata.txt", header=TRUE, row.names="id")

除了分隔方式跟上面一樣

(四)以.gz結尾的壓縮文件的讀取

1.在R中可以使用gzfile()的方式讀取壓縮文件

2.使用data.table包里的fread()函數

安裝並載入data.table包

install.packages("data.table")

library(data.table)

使用fread()函數讀取文件,這里參數和之前的一致,唯一的不同就是fread()可以直接讀取壓縮文件

mydata <- fread(『c:/mydata.txt.gz』, header=T, row.names=』id』)

(五)讀取.xlsx後綴文件,也就是excel文件

1. 安裝並載入openxlsx包

install.packages("openxlsx")

library(openxlsx)

2.進行數據的導入

mydata <- read.xlsx( "mydata.xlsx",rowNames=T)

其他參數可以通過? read.xlsx在R中根據需要進行添加的。

『叄』 R語言讀取大數據表格中有條件的子集

不知道你說的大表格有多大,但只要能載入到R語言的內存中運算就可以計算。使用subset函數內

假設數據集為x

java">a<-subset(x,A>30)
a<-subset(a,D>50)

subset第一容個參數是要篩選的數據集,第二個就是條件,像你說的問題,在第一步過濾的基礎上再過濾一次就行,也可以合並到一起。

『肆』 在r語言中用什麼命令讀取全部數據

使用R語言的時候,如果是少量數據,不妨使用c()或其他函數進行創建;但是對於大量數據,最好還是先通過其他更方便的軟體創建數據文件,然後使用R讀入這個文件。
.csv是非常好的數據文件格式,跨平台支持非常好。我在Excel或者SPSS中創建的數據,只要存為csv格式,就可以使用幾乎任何數據處理軟體對這些數據進行處理了。使用通用格式在多人合作、不同版本兼容等常見行為中,優勢十分明顯。另外,之所以使用不同的數據處理軟體,第一,可以取長補短。比如有些工作SPSS很復雜的,可以用R語言幾行命令搞定。第二,可以進行軟體間處理結果對照,發現問題。
R語言中讀取外部文件的最基本函數是read.table(),還有用來讀csv的read.csv(), .csv是非常好的數據文件格式,跨平台支持非常好。。
輸入help(read.table)命令,就看到了關於數據輸入函數的說明。

『伍』 r語言怎麼讀取txt文件

1、demo、txt用於測試:

閱讀全文

與r中讀取大數據函數相關的資料

熱點內容
win10文件共享提示伺服器沒有響應 瀏覽:788
倒t型電阻網路相對穩定度怎麼算 瀏覽:367
怎麼樣編程彈窗 瀏覽:730
咨詢投標文件內容包含 瀏覽:248
win7win10c盤空間越來越小 瀏覽:806
悠途出行app在哪裡選座 瀏覽:67
突襲2哪個版本好玩 瀏覽:549
網站怎麼申請認證 瀏覽:676
簡訊apk是什麼文件 瀏覽:940
app官方下載在哪裡 瀏覽:511
iphone5s改名字 瀏覽:772
win10文件夾打開一直閃跳 瀏覽:208
win10攝像頭不能拍照 瀏覽:56
雲陽數控編程培訓哪裡學 瀏覽:519
文件的存放路徑怎麼改 瀏覽:583
cad字體文件如何導出 瀏覽:236
cs16需要cdkey哪個文件里 瀏覽:817
如何讓另一個表格的數據關聯 瀏覽:368
來自app的快捷指令是怎麼有的 瀏覽:844
保留文件的原始文字圖片 瀏覽:385

友情鏈接