導航:首頁 > 網路數據 > r中讀取大數據函數

r中讀取大數據函數

發布時間:2024-03-11 13:50:48

『壹』 如何用R讀取數據

在R語言裡面,有很多讀取數據的方法。R能讀文本文件,csv格式文件,通過RODBC包讀取資料庫數據等等。下面我介紹幾種最基本的讀取數據的方法!

工具/原料
RStudio
方法
不管是讀取數據還是寫入,R都是在工作路徑中完成的。所以首先我們要知道我們的R所在的工作路徑是在哪裡。使用getwd()函數來獲取我們的工作路徑。

下面查看工作路徑裡面有哪些文件,使用dir()函數

如果你所想導入的數據並不在你當前的工作路徑中,有兩種方法可以解決。第一種就是把數據文件放到工作路徑中,第二種方法就是更改工作路徑。更改工作路徑使用setwd()函數。比如你想要把工作路徑設置成桌面

現在我讀取我工作路徑中,名字為hw1_data.csv的文件。使用read.csv()函數

也可以使用read.table()函數來讀取csv格式的文件。由於csv文件的分隔符是「,」所以我們在用read.table()函數的時候,sep參數,我們要設定為sep=「,」

發現read.table()讀出來的數據,列名並不是我們文件中的列名,而是V1,V2。。。我們需要加上header這個參數來修改這個問題

另外在read.table()函數族中還有很多參數,對我們讀取數據都有幫助,大家可以去了解下。使用?read.table()進行了解

『貳』 R語言文件讀取

參考文章地址(https://zhuanlan.hu.com/p/120422644)

逗號分隔文件 (.csv文件)、 製表符分隔文件 (.tsv文件)和 空格分隔文件 (.txt文件)

(一).csv文件的讀取

mydata <- read.csv(file=" ", header=T, sep=",", quote="\", dec=".", fill=T, comment.char=" ")

comment.char用於設置需要跳過的內容,比如需要跳過的行前面有「#」,那麼設置comment.char=「#」,當然你也可以設置從中間開始讀,注意,這個函數是read.csv裡面的哦!

file: 以csv結尾的文件名,由文件所在路徑及其文件名構成

header:是否把第一行作為表頭

sep:分隔方式,csv文件分隔讀入參數設置為"."

                               tsv文件分隔讀入參數設置為"\t"

                               txt文件分隔為空格,不需要設置sep參數

也可以通過mydata <- read.table("D:/mydata.csv", header=T, sep=",", row.names="id")讀取

(二).tsv文件的讀取

mydata <- read.table("D:/mydata.tsv", header=T, sep="\t", row.names="id")

除了分隔方式跟上面一樣

(三).txt文件的讀取

mydata <- read.table("c:/mydata.txt", header=TRUE, row.names="id")

除了分隔方式跟上面一樣

(四)以.gz結尾的壓縮文件的讀取

1.在R中可以使用gzfile()的方式讀取壓縮文件

2.使用data.table包里的fread()函數

安裝並載入data.table包

install.packages("data.table")

library(data.table)

使用fread()函數讀取文件,這里參數和之前的一致,唯一的不同就是fread()可以直接讀取壓縮文件

mydata <- fread(『c:/mydata.txt.gz』, header=T, row.names=』id』)

(五)讀取.xlsx後綴文件,也就是excel文件

1. 安裝並載入openxlsx包

install.packages("openxlsx")

library(openxlsx)

2.進行數據的導入

mydata <- read.xlsx( "mydata.xlsx",rowNames=T)

其他參數可以通過? read.xlsx在R中根據需要進行添加的。

『叄』 R語言讀取大數據表格中有條件的子集

不知道你說的大表格有多大,但只要能載入到R語言的內存中運算就可以計算。使用subset函數內

假設數據集為x

java">a<-subset(x,A>30)
a<-subset(a,D>50)

subset第一容個參數是要篩選的數據集,第二個就是條件,像你說的問題,在第一步過濾的基礎上再過濾一次就行,也可以合並到一起。

『肆』 在r語言中用什麼命令讀取全部數據

使用R語言的時候,如果是少量數據,不妨使用c()或其他函數進行創建;但是對於大量數據,最好還是先通過其他更方便的軟體創建數據文件,然後使用R讀入這個文件。
.csv是非常好的數據文件格式,跨平台支持非常好。我在Excel或者SPSS中創建的數據,只要存為csv格式,就可以使用幾乎任何數據處理軟體對這些數據進行處理了。使用通用格式在多人合作、不同版本兼容等常見行為中,優勢十分明顯。另外,之所以使用不同的數據處理軟體,第一,可以取長補短。比如有些工作SPSS很復雜的,可以用R語言幾行命令搞定。第二,可以進行軟體間處理結果對照,發現問題。
R語言中讀取外部文件的最基本函數是read.table(),還有用來讀csv的read.csv(), .csv是非常好的數據文件格式,跨平台支持非常好。。
輸入help(read.table)命令,就看到了關於數據輸入函數的說明。

『伍』 r語言怎麼讀取txt文件

1、demo、txt用於測試:

閱讀全文

與r中讀取大數據函數相關的資料

熱點內容
cocoapods版本更新 瀏覽:361
國外it大神教你學習如何編程 瀏覽:312
手機存儲應用程序 瀏覽:284
頁面自適應屏幕如何調整代碼數據 瀏覽:681
jsjson工具 瀏覽:299
資料庫中如何備份一張表的數據 瀏覽:739
網路設備能用到什麼 瀏覽:64
暴風轉碼如何添加文件夾 瀏覽:515
延安整合網路營銷有哪些 瀏覽:74
查找word打開過的文件在哪裡 瀏覽:137
b樹java代碼 瀏覽:683
電腦文件存儲 瀏覽:657
蘭州中考徵集志願在哪個網站 瀏覽:215
cs文件上傳下載 瀏覽:244
拷貝文件到根目錄下重命名linux 瀏覽:603
api函數的頭文件 瀏覽:249
華為怎麼綁定迷你編程 瀏覽:215
機構怎麼申請少兒編程考級 瀏覽:495
崑山數控編程哪裡好學 瀏覽:459
jspcfor跳出 瀏覽:65

友情鏈接