📜  如何在 R 编程中从文件中导入数据

📅  最后修改于: 2022-05-13 01:55:46.228000             🧑  作者: Mango

如何在 R 编程中从文件中导入数据

事实的集合称为数据。数据可以有不同的形式。要使用 R 编程语言分析数据,应首先在 R 中导入数据,这些数据可以是不同的格式,如 txt、CSV 或任何其他分隔符分隔的文件。导入数据后,然后对其进行操作、分析和报告。

使用 R 编程语言从文件中导入数据

在本文中,我们将了解如何在 R 编程语言中导入不同的文件。

将 CSV 文件导入 R

方法 1:使用 read.csv() 方法。

在这里,我们将使用 R 中的 read.csv() 方法导入 csv 文件。

R
# specifying the path
path <- "/gfg.csv"
 
# reading contents of csv file
content <- read.csv(path)
 
# contents of the csv file
print (content)


R
# simple R program to read csv file using read.table()
x <- read.csv2("D://Data//myfile.csv", header = TRUE, sep=", ")
 
# print x
print(x)


R
# Simple R program to read txt file
x<-read.table("D://Data//myfile.txt", header=FALSE)
 
# print x
print(x)


R
x <- read.delim("D://Data//myfile.csv", sep="|", header=TRUE)
 
# print x
print(x)
 
# print type of x
typeof(x)


R
# Read a JSON file
 
# Load the package required to read JSON files.
library("rjson")
 
# Give the input file name to the function.
res <- fromJSON(file = "E:\\exp.json")
 
# Print the result.
print(res)


HTML


    1
    Alia
    620
    IT


    2
    Brijesh
    440
    Commerce


    3
    Yash
    600
    Humanities


    4
    Mallika
    660
    IT


    5
    Zayn
    560
    IT



R
# loading the library and other important packages
library("XML")
library("methods")
 
# the contents of sample.xml are parsed
data <- xmlParse(file = "sample.xml")
 
print(data)


R
# import haven library package
library("haven")
 
# Use read_sav() function to read SPSS file
dataframe <- read_sav("SPSS.sav")   
dataframe


输出:

ID Name    Post Age 
1  5    H      CA  67 
2  6    K     SDE  39 
3  7    Z   Admin  28

方法 2:使用 read.table() 方法。

在这里,我们将使用 read.table() 方法将 CSV 文件导入 R 编程语言。

R

# simple R program to read csv file using read.table()
x <- read.csv2("D://Data//myfile.csv", header = TRUE, sep=", ")
 
# print x
print(x)

输出:

Col1.Col2.Col3
1      100, a1, b1
2      200, a2, b2
3      300, a3, b3

从文本文件导入数据

我们可以使用基本的 R函数read.table()轻松导入或读取.txt文件。 read.table() 用于读取表格格式的文件。此函数易于使用且灵活。

R

# Simple R program to read txt file
x<-read.table("D://Data//myfile.txt", header=FALSE)
 
# print x
print(x)

输出:

V1 V2 V3
1 100 a1 b1
2 200 a2 b2
3 300 a3 b3

如果 header 参数设置为 TRUE,则读取文件中存在的列名。

从分隔文件导入数据

R 有一个函数read.delim()将分隔文件读入列表。默认情况下,文件由 sep="" 表示的制表符分隔,分隔符可以是逗号 (, )、美元符号 ($) 等。

R

x <- read.delim("D://Data//myfile.csv", sep="|", header=TRUE)
 
# print x
print(x)
 
# print type of x
typeof(x)

输出:

X.V1.V2.V3
1 1, 100, a1, b1
2 2, 200, a2, b2
3 3, 300, a3, b3


[1] "list

在 R 中导入 Json 文件

在这里,我们将使用rjson包将 JSON 文件导入 R 编程语言。

R

# Read a JSON file
 
# Load the package required to read JSON files.
library("rjson")
 
# Give the input file name to the function.
res <- fromJSON(file = "E:\\exp.json")
 
# Print the result.
print(res)

输出:

$ID
[1] "1" "2" "3" "4" "5"

$Name
[1] "Mithuna"   "Tanushree" "Parnasha"  "Arjun"     "Pankaj"

$Salary
[1] "722.5"  "815.2"  "1611"   "2829"   "843.25"

在 R 中导入 XML 文件

要在此处导入 XML 文件,我们将使用 R 编程语言中的 XML 包。

用于演示的 XML 文件:

HTML



    1
    Alia
    620
    IT


    2
    Brijesh
    440
    Commerce


    3
    Yash
    600
    Humanities


    4
    Mallika
    660
    IT


    5
    Zayn
    560
    IT


读取 XML 文件:

安装包后可以读取,然后用xmlparse()函数解析。

R

# loading the library and other important packages
library("XML")
library("methods")
 
# the contents of sample.xml are parsed
data <- xmlParse(file = "sample.xml")
 
print(data)

输出:

1
Alia
620
IT
2
Brijesh
440
Commerce
3
Yash
600
Humanities
4
Mallika
660
IT
5
Zayn
560
IT

将 SPSS sav 文件导入 R

在这里,我们将阅读 R 编程语言中的 SPSS .sav 文件。为此,我们将使用 Haven 包。要在 R 中读取 SPSS 文件,我们使用 Haven 包中的 read_sav()函数。

R

# import haven library package
library("haven")
 
# Use read_sav() function to read SPSS file
dataframe <- read_sav("SPSS.sav")   
dataframe

输出: