📜  在 r 中读取 csv (1)

📅  最后修改于: 2023-12-03 15:23:17.279000             🧑  作者: Mango

在 R 中读取 CSV

简介

CSV(Comma Separated Values,逗号分隔值)是一种常见的文本格式,用于存储表格结构的数据。在 R 中,可以使用 read.csv()read.csv2() 函数读取 CSV 文件。

语法
read.csv(file, header = TRUE, sep = ",", quote = "\"",
        dec = ".", fill = TRUE, comment.char = "", ...)
read.csv2(file, header = TRUE, sep = ";", quote = "\"",
         dec = ",", fill = TRUE, comment.char = "", ...)

参数说明:

  • file : 要读取的 CSV 文件路径,可以是本地文件路径或者 URL。
  • header : 是否将第一行作为列名,默认为 TRUE
  • sep : 字段分隔符,默认为逗号 ,
  • quote : 字段引号,默认为双引号 "
  • dec : 十进制符号,默认为点号 .
  • fill : 是否将缺失值填充,默认为 TRUE
  • comment.char : 注释字符,默认为空字符。
  • ... : 其他需要传递给 read.table() 函数的参数。
示例

假设有如下 CSV 文件 example.csv

"ID","Name","Gender","Age"
101,"Tom","Male",28
102,"Lisa","Female",26
103,"Tony","Male",32
104,"Alice","Female",24

首先,需要将当前工作目录设置为包含 example.csv 文件的目录,这可以使用 setwd() 函数实现:

# 将当前工作目录设置为包含 example.csv 文件的目录
setwd("/path/to/folder")

注意:在实际使用中,需要将/path/to/folder改为实际的目录路径。

接下来,使用 read.csv() 函数读取 CSV 文件:

# 读取 example.csv 文件
data <- read.csv("example.csv")
print(data)

运行结果:

   ID  Name Gender Age
1 101   Tom   Male  28
2 102  Lisa Female  26
3 103  Tony   Male  32
4 104 Alice Female  24

通过设置 header = FALSE 参数可以将第一行视为数据而不是列名:

# 将第一行视为数据而不是列名
data <- read.csv("example.csv", header = FALSE)
print(data)

运行结果:

   V1    V2      V3  V4
1 ID  Name Gender Age
2 101   Tom   Male  28
3 102  Lisa Female  26
4 103  Tony   Male  32
5 104 Alice Female  24

如果 CSV 文件的字段分隔符不是逗号 ,,可以通过设置 sep 参数来指定。例如,如果 CSV 文件的字段分隔符是分号 ;,可以这样读取:

# 读取分隔符为分号的 CSV 文件
data <- read.csv("example.csv", sep = ";")
print(data)

运行结果:

   ID  Name Gender Age
1 101   Tom   Male  28
2 102  Lisa Female  26
3 103  Tony   Male  32
4 104 Alice Female  24
总结

使用 read.csv()read.csv2() 函数可以方便地读取 CSV 文件。这些函数有很多可选参数,可以灵活地设置读取参数。在读取 CSV 文件前,需要将当前工作目录设置为包含 CSV 文件的目录。