導航:首頁 > 數據分析 > 如何用r將數據分類

如何用r將數據分類

發布時間:2023-03-31 17:34:41

⑴ 如何在R中導入不同類型的數據

在使用R的時候,我們肯定需要導入數據,現在總結一下如何導入不同類型的數據:
1.使用鍵盤輸入數據
在導入數據比較少的時候,我們使用這種方法。R中的函數 edit() 會自動調用一個允許手動輸入數據的文本編輯器。具體步驟如下:
(1) 創建一個空數據框(或矩陣) ,其中變數名和變數的模式需與理想中的最終數據集一致;
(2) 針對這個數據對象調用文本編輯器,輸入你的數據,並將結果保存回此數據對象中。在下例中,你將創建一個名為 mydata 的數據框,它含有三個變數: age (數值型) 、 height(字元型)和 weight (數值型) 。然後通過edit()函數調用文本編輯器,鍵入數據,最後保存結果。編輯器界面如下,我們在這個界面可以輸入變數值,也可以改變變數類型。
[plain] view plain
mydata<-data.frame(age=numeric(0),height=numeric(0),weight=numeric(0))
edit(mydata)
需要注意的是函數 edit() 事實上是在對象的一個副本上進行操作的。如果你沒有將它其賦值到一個對象,你的所有修改將會全部丟失!
2.導入帶分隔符的文本文件數據/CSV文件
read.table() 可以從帶分隔符的文本文件中導入數據。此函數可讀入一個表格格式的文件並將其保存為一個數據框。其語法如下:
read.table(file,header=value,sep="delimter",row.names="name")
file表示文件名,header表示表的首行是否包含變數值的邏輯值,sep 用來指定分隔數據的分隔符, row.names 用以指定一個或多個表示行標識符的變數,是個一可選參數,他還有許多參數,可以通過幫助文檔進行查看。
3.導入Excel數據
雖然Excel可能是世界上最流行的數據分析工具,但R如果直接讀取Excel數據還是比較困難的。
但我們可以在Excel中將數據將其導出為一個逗號分隔文件(csv) ,並使用前文描述的方式將其導入R中。在Windows系統中,你也可以使用 RODBC 包來訪問Excel文件。但它好像只能在32位的R軟體上面使用。雖然也有一些包可以這些問題,比如gdata,XLConnect,xlsReadWrite等,但它的有許多前提要求,比如Java環境,Per,或者32-bit R。因此一般情況將數據轉換為csv文件或者將數據導入到資料庫在導入在R。
4.導入XML數據
強大的R中有若干用於處理XML文件的包。 XML 包允許用戶讀取、寫入和操作XML文件。因為我還沒有遇到這種數據,因此還不太清楚xml包大體如何使用,感興趣的朋友可以下載xml包,通過幫助文檔進行學習。
5.從網頁抓取數據
不僅Python可以爬取網頁數據,R也可以在Web數據抓取。在這個的過程中,用戶可以從互聯網上提取嵌入在網頁中的信息,並將其保存為R中的數據結構以做進一步的分析。 完成這個任務的一種途徑是使用函數 readLines()下載網頁,然後使用如 grep() 和 gsub() 一類的函數處理它。對於結構復雜的網頁,可以使用RCurl 包和 XML 包來提取其中想要的信息。
6.導入SPSS數據
我們可以調用通過 foreign 包中的函數 read.spss() 將SPSS數據集可以導入到R中,也可以使用 Hmisc 包中的 spss.get() 函數。函數 spss.get() 是對 read. spss() 的一個封裝,它可以為你自動設置後者的許多參數,讓整個轉換過程更加簡單一致,最後得到數據分析人員所期望的結果。使用的時候我們只需要安裝Hmisc 包,在較新的R中foreign 包已被默認安裝。
[plain] view plain
mydata<-spss.get("data.sav",use.value.labels=TRUE)

這段代碼中,data.sav 是要導入的SPSS數據文件, use.value.labels=TRUE 表示讓函數將帶有值標簽的變數導入為R中水平對應相同的因子, mydataframe 是導入後的R數據框。

⑵ 如何用r語言進行數據分類

  1. 通過選擇菜單

    程序包->安裝程序包->在彈出的對話框中,選擇你要安裝的包,然後確掘梁定。

  2. 使用命令

    install.packages("package_name","dir")package_name:是指歲櫻定要安裝的包名,請注意大小寫。dir:包安裝的路徑。默認情況下是安裝在..library 文件夾中的。可以通過本參數來進行修改,來選擇安裝的文件夾。

  3. 本地來安裝

    如果你已經下載的相應的包的壓縮文件,則可以在本地來進行安裝。請注意在windows、unix、macOS操作系統下安裝文件的後綴名是不一樣的:

    1)linux環境編譯運行:tar.gz文件

    2)windows 環境編譯運行 :.zip文件

    3)MacOSg環境編譯運行:.tgz文件

  4. 載入包

包安裝後,如果要使用包的功能。必須先把包載入到內存中(默認情況下,R啟動後默認載入基本包),載入包命令:

Library(「包名」)

閱讀全文

與如何用r將數據分類相關的資料

熱點內容
空姐大戰猛鬼電影 瀏覽:507
朴惠麗韓劇什麼電視 瀏覽:554
《柏林漂流》未刪減 瀏覽:804
男主有戰爭後遺症小說 瀏覽:44
泰國精子電影 瀏覽:859
杭州大樹網路技術 瀏覽:83
截取pdf文件的某些頁 瀏覽:98
歐美原始部落電影 瀏覽:484
win1032位c盤多大 瀏覽:407
兩個女的和一個男的的電影叫什麼 瀏覽:91
怎麼找到php網站的首頁面html 瀏覽:62
電影煉獄國語版迅雷下載 瀏覽:66
女主不停生孩子系統小說 瀏覽:893
包書網txt下載 瀏覽:805
泰國罪孽父親出海 瀏覽:201
能看的網站小電影 瀏覽:460
華北電力大學javaee 瀏覽:266
練習編程可以去哪些學校 瀏覽:111
使命召喚小說同人 瀏覽:242
學校繳費用要用什麼app 瀏覽:316

友情鏈接