📜  在 R 脚本中导入数据

📅  最后修改于: 2022-05-13 01:54:59.718000             🧑  作者: Mango

在 R 脚本中导入数据

在本文中,我们将了解如何在 R 编程语言中导入数据。

在 R 中导入数据

首先,让我们考虑一个可用于演示的数据集。对于此演示,我们将使用单个数据集的两个示例,一个为 .csv 格式,另一个为 .txt

读取逗号分隔值 (CSV) 文件

方法一:使用 read.csv()函数将 CSV 文件读入 R

该函数有两个参数:

  • file.choose():它打开一个菜单来从桌面选择一个 csv 文件。
  • header:表示数据集的第一行是否为变量名。如果变量名存在,则应用 T/True,否则应用 F/False。

例子:

R
# import and store the dataset in data1
data1 <- read.csv(file.choose(), header=T)
 
# display the data
data1


R
# import and store the dataset in data2
data2 <- read.table(file.choose(), header=T, sep=", ")
 
# display data
data2


R
# import and store the dataset in data3
data3 <- read.delim(file.choose(), header=T)
 
# display the data
data3


R
# import and store the dataset in data4
data4 <- read.table(file.choose(), header=T, sep="\t")
 
# display the data
data4


R
# display the dataset
dataset


R
# To load the data for use
attach(dataset)


R
# Read a JSON file
 
# Load the package required to read JSON files.
library("rjson")
 
# Give the input file name to the function.
result <- fromJSON(file = "E:\\example.json")
 
# Print the result.
print(result)


输出:

方法二:使用 read.table()函数

该函数指定数据集的分离方式,在这种情况下,我们将sep=”, “作为参数。

例子:

R

# import and store the dataset in data2
data2 <- read.table(file.choose(), header=T, sep=", ")
 
# display data
data2

输出:

在 R 编程语言中读取制表符分隔 (txt) 文件

方法一:使用 read.delim()函数

该函数有两个参数:

  • file.choose():它打开一个菜单来从桌面选择一个 csv 文件。
  • header:表示数据集的第一行是否为变量名。如果变量名存在,则应用 T/True,否则应用 F/False。

例子:

R

# import and store the dataset in data3
data3 <- read.delim(file.choose(), header=T)
 
# display the data
data3

输出:

方法二:使用 read.table()函数

该函数指定数据集的分离方式,在这种情况下,我们将sep=”\t”作为参数。

例子:

R

# import and store the dataset in data4
data4 <- read.table(file.choose(), header=T, sep="\t")
 
# display the data
data4

输出:

使用 R-Studio

在这里,我们将通过以下步骤通过 R studio 导入数据。

脚步:

  • 从环境选项卡单击导入数据集菜单
  • 从选项中选择文件扩展名
  • 第三步,会出现一个弹框,可以输入文件名,也可以浏览桌面。
  • 所选文件将显示在新窗口及其尺寸。
  • 为了在控制台上查看输出,输入文件名。

例子:

R

# display the dataset
dataset

输出:

  • 为了将数据加载到控制台上使用,我们使用了attach命令。

例子:

R

# To load the data for use
attach(dataset)

将 JSON 文件读入 R

为了在 R 中使用 JSON 文件,需要安装“rjson”包。使用 rjson 包下的 JSON 文件完成的最常见任务如下:

  • 在 R 控制台中安装和加载 rjson 包
  • 创建 JSON 文件
  • 从 JSON 文件中读取数据
  • 写入 JSON 文件
  • 将 JSON 数据转换为 Dataframe
  • 使用 URL

用于演示的 JSON 文件:

{ 
   "ID":["1","2","3","4","5"],
   "Name":["Mithuna","Tanushree","Parnasha","Arjun","Pankaj"],
   "Salary":["722.5","815.2","1611","2829","843.25"],
   "StartDate":["6/17/2014","1/1/2012","11/15/2014","9/23/2013","5/21/2013"],
   "Dept":["IT","IT","HR","Operations","Finance"]
}

代码:

R

# Read a JSON file
 
# Load the package required to read JSON files.
library("rjson")
 
# Give the input file name to the function.
result <- fromJSON(file = "E:\\example.json")
 
# Print the result.
print(result)

输出:

$ID
[1] "1" "2" "3" "4" "5"

$Name
[1] "Mithuna"   "Tanushree" "Parnasha"  "Arjun"     "Pankaj"

$Salary
[1] "722.5"  "815.2"  "1611"   "2829"   "843.25"

$StartDate
[1] "6/17/2014"  "1/1/2012"   "11/15/2014" "9/23/2013"  "5/21/2013"

$Dept
[1] "IT"         "IT"         "HR"         "Operations" "Finance"