導航:首頁 > 網路數據 > r中讀取大數據函數

r中讀取大數據函數

發布時間:2024-03-11 13:50:48

『壹』 如何用R讀取數據

在R語言裡面,有很多讀取數據的方法。R能讀文本文件,csv格式文件,通過RODBC包讀取資料庫數據等等。下面我介紹幾種最基本的讀取數據的方法!

工具/原料
RStudio
方法
不管是讀取數據還是寫入,R都是在工作路徑中完成的。所以首先我們要知道我們的R所在的工作路徑是在哪裡。使用getwd()函數來獲取我們的工作路徑。

下面查看工作路徑裡面有哪些文件,使用dir()函數

如果你所想導入的數據並不在你當前的工作路徑中,有兩種方法可以解決。第一種就是把數據文件放到工作路徑中,第二種方法就是更改工作路徑。更改工作路徑使用setwd()函數。比如你想要把工作路徑設置成桌面

現在我讀取我工作路徑中,名字為hw1_data.csv的文件。使用read.csv()函數

也可以使用read.table()函數來讀取csv格式的文件。由於csv文件的分隔符是「,」所以我們在用read.table()函數的時候,sep參數,我們要設定為sep=「,」

發現read.table()讀出來的數據,列名並不是我們文件中的列名,而是V1,V2。。。我們需要加上header這個參數來修改這個問題

另外在read.table()函數族中還有很多參數,對我們讀取數據都有幫助,大家可以去了解下。使用?read.table()進行了解

『貳』 R語言文件讀取

參考文章地址(https://zhuanlan.hu.com/p/120422644)

逗號分隔文件 (.csv文件)、 製表符分隔文件 (.tsv文件)和 空格分隔文件 (.txt文件)

(一).csv文件的讀取

mydata <- read.csv(file=" ", header=T, sep=",", quote="\", dec=".", fill=T, comment.char=" ")

comment.char用於設置需要跳過的內容,比如需要跳過的行前面有「#」,那麼設置comment.char=「#」,當然你也可以設置從中間開始讀,注意,這個函數是read.csv裡面的哦!

file: 以csv結尾的文件名,由文件所在路徑及其文件名構成

header:是否把第一行作為表頭

sep:分隔方式,csv文件分隔讀入參數設置為"."

                               tsv文件分隔讀入參數設置為"\t"

                               txt文件分隔為空格,不需要設置sep參數

也可以通過mydata <- read.table("D:/mydata.csv", header=T, sep=",", row.names="id")讀取

(二).tsv文件的讀取

mydata <- read.table("D:/mydata.tsv", header=T, sep="\t", row.names="id")

除了分隔方式跟上面一樣

(三).txt文件的讀取

mydata <- read.table("c:/mydata.txt", header=TRUE, row.names="id")

除了分隔方式跟上面一樣

(四)以.gz結尾的壓縮文件的讀取

1.在R中可以使用gzfile()的方式讀取壓縮文件

2.使用data.table包里的fread()函數

安裝並載入data.table包

install.packages("data.table")

library(data.table)

使用fread()函數讀取文件,這里參數和之前的一致,唯一的不同就是fread()可以直接讀取壓縮文件

mydata <- fread(『c:/mydata.txt.gz』, header=T, row.names=』id』)

(五)讀取.xlsx後綴文件,也就是excel文件

1. 安裝並載入openxlsx包

install.packages("openxlsx")

library(openxlsx)

2.進行數據的導入

mydata <- read.xlsx( "mydata.xlsx",rowNames=T)

其他參數可以通過? read.xlsx在R中根據需要進行添加的。

『叄』 R語言讀取大數據表格中有條件的子集

不知道你說的大表格有多大,但只要能載入到R語言的內存中運算就可以計算。使用subset函數內

假設數據集為x

java">a<-subset(x,A>30)
a<-subset(a,D>50)

subset第一容個參數是要篩選的數據集,第二個就是條件,像你說的問題,在第一步過濾的基礎上再過濾一次就行,也可以合並到一起。

『肆』 在r語言中用什麼命令讀取全部數據

使用R語言的時候,如果是少量數據,不妨使用c()或其他函數進行創建;但是對於大量數據,最好還是先通過其他更方便的軟體創建數據文件,然後使用R讀入這個文件。
.csv是非常好的數據文件格式,跨平台支持非常好。我在Excel或者SPSS中創建的數據,只要存為csv格式,就可以使用幾乎任何數據處理軟體對這些數據進行處理了。使用通用格式在多人合作、不同版本兼容等常見行為中,優勢十分明顯。另外,之所以使用不同的數據處理軟體,第一,可以取長補短。比如有些工作SPSS很復雜的,可以用R語言幾行命令搞定。第二,可以進行軟體間處理結果對照,發現問題。
R語言中讀取外部文件的最基本函數是read.table(),還有用來讀csv的read.csv(), .csv是非常好的數據文件格式,跨平台支持非常好。。
輸入help(read.table)命令,就看到了關於數據輸入函數的說明。

『伍』 r語言怎麼讀取txt文件

1、demo、txt用於測試:

閱讀全文

與r中讀取大數據函數相關的資料

熱點內容
abc文件破解密碼 瀏覽:516
怎麼登錄米家app賬號 瀏覽:165
兆歐表多少轉讀數據 瀏覽:414
多媒體網路通訊 瀏覽:747
文件上的表填不了內容該怎麼辦 瀏覽:899
弟弟迷上網路小說怎麼辦 瀏覽:766
網路上有人想訪問我的地址怎麼辦 瀏覽:730
linux解壓zip亂碼 瀏覽:839
看直播數據用哪個平台最好 瀏覽:730
win10晶元驅動程序版本 瀏覽:763
如何給word添加公式編輯器 瀏覽:666
iphone桌面文件夾怎樣合並 瀏覽:919
要我蘋果賬號密碼忘記了怎麼辦 瀏覽:578
快快卡在配置游戲文件 瀏覽:393
數據包重發時間怎麼調整 瀏覽:882
youtubeapp怎麼下載 瀏覽:366
編程檢測是什麼 瀏覽:753
網路攝像機的傳輸距離 瀏覽:941
超值貓qq群購秒殺群 瀏覽:138
pdf文件能備注嗎 瀏覽:174

友情鏈接