วิธีการนำเข้าไฟล์ CSV ใน R: 6 ขั้นตอนง่ายๆ

By Leonard Cucosth
R ProgrammingData Analysis

การเรียนรู้วิธีการนำเข้าไฟล์ CSV เข้า R และ RStudio เป็นพื้นฐานสำคัญสำหรับขั้นตอนการวิเคราะห์ข้อมูล คู่มือฉบับสมบูรณ์นี้จะแสดงให้คุณเห็นวิธีการ นำเข้าไฟล์ CSV ใน R และ นำเข้าไฟล์ CSV ใน RStudio โดยใช้ทั้ง RStudio Import CSV ผ่านหน้าต่างกราฟิก และ ฟังก์ชัน read.csv() ด้วยโค้ด

ไม่ว่าคุณจะต้องการ โหลดไฟล์ CSV ใน R เพื่อทำความสะอาดข้อมูล นำเข้า CSV เข้า R เพื่อวิเคราะห์ทางสถิติ หรือ อัปโหลด CSV เข้า RStudio เพื่อสำรวจข้อมูลอย่างรวดเร็ว บทเรียนนี้ครอบคลุมทุกอย่าง เราจะแสดงวิธีการ อ่าน CSV ใน R การใช้ ฟังก์ชัน read.csv() อย่างมีประสิทธิภาพ และจัดการกับปัญหาทั่วไปในการนำเข้าข้อมูล

ใน 6 ขั้นตอนที่ง่ายต่อการทำตาม คุณจะเชี่ยวชาญ R Studio Import CSV และเรียนรู้วิธีการ นำเข้าข้อมูล CSV เข้า R อย่างมีประสิทธิภาพด้วย read.csv() สำหรับโปรเจกต์ใดๆ

ข้อกำหนดเบื้องต้น

ก่อนที่คุณจะเริ่ม ให้แน่ใจว่าคุณได้ติดตั้ง R และ RStudio บนคอมพิวเตอร์ของคุณแล้ว หากคุณยังไม่ได้ติดตั้ง สามารถทำตามคู่มือทีละขั้นตอนของเราเกี่ยวกับ วิธีการติดตั้ง R และ RStudio บน Windows, macOS, Linux และ UNIX

เมื่อเสร็จแล้ว ให้เปิด RStudio และเราจะเริ่มกันเลย

กำลังทำงานกับไฟล์ Excel แทนหรือไม่? ดูคู่มือของเราเกี่ยวกับการนำเข้าไฟล์ Excel ใน R

วิธีที่ 1: วิธีการนำเข้าไฟล์ CSV ใน R โดยใช้ GUI

การใช้ GUI ใน RStudio เป็นวิธีที่ตรงไปตรงมาและสะดวกสบายในการนำเข้าไฟล์ CSV นี่คือขั้นตอนที่ต้องทำตาม:

ขั้นตอนที่ 1: เปิด RStudio

เริ่มต้นด้วยการเปิด RStudio บนคอมพิวเตอร์ของคุณ

ขั้นตอนที่ 2: ไปที่ 'Import Dataset'

มองหาหน้าต่าง Environment ซึ่งโดยปกติจะอยู่ด้านบนขวามือ คุณจะเห็นเมนูแบบเลื่อนลง Import Dataset คลิกที่มัน

หน้าต่าง Environment ของ RStudio แสดงเมนู Import Dataset สำหรับนำเข้าไฟล์ CSV เข้า R หน้าต่าง Environment ของ RStudio พร้อมเน้นเมนู Import Dataset

ขั้นตอนที่ 3: เลือก 'From Text (readr)...'

ในเมนูแบบเลื่อนลง ให้เลือกตัวเลือก From Text (readr)... นี่จะเปิดหน้าต่าง File Explorer

เมนู Import Dataset ของ RStudio แสดงตัวเลือก From Text (readr) เพื่อนำเข้าไฟล์ CSV เข้า R การเลือกตัวเลือก "From Text (readr)..." จากเมนู Import Dataset ใน RStudio

ขั้นตอนที่ 4: เลือกไฟล์ CSV ของคุณ

คลิกที่ปุ่ม Browse และไปที่ไฟล์ CSV ของคุณใน File Explorer เลือกไฟล์ แล้วคลิก Open

ขั้นตอนที่ 5: ปรับการตั้งค่าการนำเข้า

RStudio จะเปิดหน้าต่างการนำเข้าข้อมูล ที่นี่คุณสามารถปรับแต่งวิธีที่ RStudio อ่านไฟล์ CSV ของคุณ คุณสามารถตั้งค่าต่างๆ เช่น แถวแรกมีชื่อคอลัมน์หรือไม่ หรือจำนวนแถวสูงสุดที่จะอ่าน

ขั้นตอนที่ 6: คลิกที่ 'Import'

เมื่อคุณได้ปรับการตั้งค่าให้เหมาะกับความต้องการของคุณแล้ว ให้คลิกที่ปุ่ม Import ข้อมูล CSV ของคุณจะถูกนำเข้าเข้า RStudio เป็น Data Frame

หน้าต่าง Import CSV Data ของ RStudio พร้อมแสดงตัวอย่างข้อมูลไฟล์ CSV และตัวเลือกการตั้งค่าการนำเข้า หน้าต่าง Import Text Data ใน RStudio แสดงตัวอย่างข้อมูล CSV และตัวเลือกการนำเข้า

วิธีที่ 2: วิธีการนำเข้าไฟล์ CSV ใน R โดยใช้โค้ด

หากคุณต้องการวิธีการที่สามารถทำซ้ำได้มากขึ้นในการนำเข้าไฟล์ CSV หรือคุณกำลังทำงานนอก RStudio นี่คือวิธีที่คุณสามารถนำเข้าไฟล์ CSV โดยใช้โค้ดใน R:

ขั้นตอนที่ 1: ตั้งค่า Working Directory ของคุณ

ขั้นแรก คุณต้องตั้งค่า Working Directory ไปยังตำแหน่งที่เก็บไฟล์ CSV ของคุณ คุณสามารถใช้ฟังก์ชัน setwd() สำหรับสิ่งนี้:

setwd("/path/to/your/directory")

แทนที่ "/path/to/your/directory" ด้วย Path จริงไปยัง Directory ของคุณ

ขั้นตอนที่ 2: ใช้ฟังก์ชัน read.csv()

ฟังก์ชัน read.csv() ใช้เพื่อนำเข้าข้อมูล CSV เข้า R สมมติว่าไฟล์ของเรามีชื่อว่า data.csv:

data <- read.csv("data.csv")

ในโค้ดนี้ data.csv คือชื่อของไฟล์ CSV ที่จะนำเข้า และ data คือ Data Frame ของ R ที่เราเก็บข้อมูล CSV

ขั้นตอนที่ 3: ตรวจสอบข้อมูล

เพื่อให้แน่ใจว่าข้อมูลของคุณถูกนำเข้าอย่างถูกต้อง คุณสามารถใช้ฟังก์ชัน head() เพื่อดูแถวแรกๆ ไม่กี่แถว หรือฟังก์ชัน View() เพื่อดู Dataset ทั้งหมด:

head(data)
View(data)

ขั้นตอนที่ 4: จัดการกับข้อมูลที่ขาดหาย

ไฟล์ CSV มักจะมีค่าที่ขาดหาย ซึ่ง R จะแปลงเป็น NA คุณสามารถจัดการกับค่าเหล่านี้โดยใช้ฟังก์ชันต่างๆ เช่น na.omit() เพื่อลบแถวที่มี NA หรือ replace() และ is.na() เพื่อแทนที่ค่า NA:

# ลบแถวที่มี NA
data <- na.omit(data)
 
# แทนที่ค่า NA ด้วย 0
data[is.na(data)] <- 0

ขั้นตอนที่ 5: บันทึกข้อมูล

หากคุณต้องการบันทึก Data Frame ของคุณกลับเป็นไฟล์ CSV คุณสามารถใช้ฟังก์ชัน write.csv():

write.csv(data, "data_modified.csv")

นี่จะบันทึก Data Frame 'data' ของคุณเป็นไฟล์ CSV ชื่อ data_modified.csv

ตอนนี้คุณรู้วิธีการนำเข้าไฟล์ CSV เข้า R ทั้งผ่าน GUI ใน RStudio และการเขียนโค้ดใน R แล้ว ทั้งสองวิธีมีจุดแข็งของตัวเอง ดังนั้นให้เลือกวิธีที่เหมาะสมกับความต้องการและระดับความคุ้นเคยของคุณ

คำถามที่พบบ่อย

เพื่อนำเข้าไฟล์ CSV เข้า R: (1) ตั้งค่า Working Directory ด้วย setwd('/path/to/directory'), (2) ใช้ data <- read.csv('filename.csv') เพื่อโหลดไฟล์ CSV ของคุณ อีกทางเลือกหนึ่ง ใช้ GUI ของ RStudio โดยคลิก Import Dataset > From Text (readr)
ฟังก์ชัน read.csv() เป็นฟังก์ชันพื้นฐานของ R ที่ใช้กันมากที่สุดในการนำเข้าไฟล์ CSV มันอ่านค่าที่คั่นด้วยจุลภาค (Comma-Separated Values) โดยอัตโนมัติและสร้าง Data Frame สำหรับการควบคุมที่มากขึ้น คุณสามารถใช้ read.table() พร้อม Parameter ที่กำหนดเอง หรือ read_csv() จาก Package readr สำหรับประสิทธิภาพที่เร็วขึ้น
ใน RStudio ให้คลิกเมนู 'Import Dataset' ในหน้าต่าง Environment (ด้านบนขวา) เลือก 'From Text (readr)...' เรียกดูไฟล์ CSV ของคุณ ตั้งค่าตัวเลือกการนำเข้า (Delimiter, Column Names, Data Types) แล้วคลิก Import RStudio จะสร้างโค้ดและโหลดข้อมูลของคุณโดยอัตโนมัติ
ใช้ขั้นตอนเหล่านี้: (1) ตั้งค่า Working Directory ด้วย setwd('/path/to/directory'), (2) โหลดไฟล์ด้วย data <- read.csv('file.csv'), (3) ตรวจสอบการนำเข้าด้วย head(data) หรือ View(data) ฟังก์ชัน read.csv() จัดการกับ Comma Delimiter โดยอัตโนมัติและแปลงข้อมูลเป็น Data Frame
read.csv() เป็นฟังก์ชัน Base R ที่ช้ากว่าแต่พร้อมใช้งานโดยค่าเริ่มต้น ในขณะที่ read_csv() จาก Package readr (ส่วนหนึ่งของ tidyverse) เร็วกว่ามาก ให้ Feedback ความคืบหน้าที่ดีขึ้น และสร้าง Tibbles แทน Data Frames read_csv() ยังมีพฤติกรรมเริ่มต้นที่ดีกว่าสำหรับการแยกวิเคราะห์ Column Types
คุณไม่จำเป็นต้อง 'อัปโหลด' ไฟล์ CSV เข้า RStudio - เพียงแค่วางไฟล์ CSV ของคุณไว้ที่ไหนก็ได้บนคอมพิวเตอร์ของคุณ จากนั้นใช้ read.csv('path/to/file.csv') หรือฟีเจอร์ Import Dataset GUI ของ RStudio หากทำงานบน RStudio Server (Cloud) คุณสามารถอัปโหลดไฟล์โดยใช้ปุ่ม 'Upload' ในหน้าต่าง Files
ฟังก์ชัน read.csv() แปลงเซลล์ว่างเป็น NA โดยอัตโนมัติ คุณสามารถระบุค่า NA ที่กำหนดเองโดยใช้ Parameter na.strings: read.csv('file.csv', na.strings = c('', 'NA', 'N/A', 'missing')) หลังจากนำเข้า ใช้ na.omit() เพื่อลบแถวที่มี NA หรือแทนที่ด้วยค่าเฉพาะ
ใช้ read.csv2() สำหรับไฟล์ที่คั่นด้วยเครื่องหมายอัฒภาค (Semicolon) หรือ read.table() พร้อม Delimiter ที่กำหนดเอง: read.table('file.csv', sep = '\t', header = TRUE) สำหรับไฟล์ที่คั่นด้วย Tab Parameter sep รับอักขระ Delimiter ใดๆ รวมถึง Pipes (|), Semicolons (;) หรือตัวคั่นที่กำหนดเอง
ตั้งค่า Working Directory ของคุณเป็น Desktop: setwd('~/Desktop') บน Mac/Linux หรือ setwd('C:/Users/YourName/Desktop') บน Windows จากนั้นใช้ data <- read.csv('file.csv') อีกทางเลือกหนึ่ง ใช้ Path แบบเต็ม: read.csv('~/Desktop/file.csv')
Best Practices ได้แก่: (1) ใช้ read_csv() จาก readr เสมอสำหรับไฟล์ขนาดใหญ่ (เร็วกว่า), (2) ระบุ Column Types อย่างชัดเจนด้วย col_types เพื่อหลีกเลี่ยงข้อผิดพลาดในการแยกวิเคราะห์, (3) ใช้ stringsAsFactors = FALSE ใน read.csv() เพื่อรักษาข้อความเป็น Character Strings, (4) ตรวจสอบปัญหา Encoding ด้วย Parameter encoding, (5) ตรวจสอบการนำเข้าด้วย str(data) หรือ summary(data) เสมอหลังจากโหลด
ใช้ list.files() เพื่อรับชื่อไฟล์ CSV ทั้งหมด จากนั้น lapply() หรือ Loop เพื่ออ่านพวกมัน: files <- list.files(pattern = '\\.csv$'); data_list <- lapply(files, read.csv); combined_data <- do.call(rbind, data_list) นี่จะอ่านไฟล์ CSV ทั้งหมดใน Directory และรวมเป็น Data Frame เดียว

สรุป

ในคู่มือฉบับสมบูรณ์นี้ คุณได้เรียนรู้ วิธีการนำเข้าไฟล์ CSV เข้า R โดยใช้ทั้งหน้าต่างกราฟิกของ RStudio และ ฟังก์ชัน read.csv() ด้วยวิธีการใช้โค้ด ไม่ว่าคุณจะใช้ฟีเจอร์ RStudio Import CSV GUI หรือแนวทางบรรทัดคำสั่ง เทคนิคเหล่านี้จะช่วยให้คุณ โหลดไฟล์ CSV ใน R อย่างมีประสิทธิภาพสำหรับโปรเจกต์การวิเคราะห์ข้อมูลของคุณ

ฟังก์ชัน read.csv() เป็นเครื่องมือสำคัญของคุณสำหรับการนำเข้าข้อมูล CSV เข้า R โดยมีความยืดหยุ่นในการจัดการกับ Delimiter ที่แตกต่าง ค่าที่ขาดหาย และประเภทข้อมูล เมื่อคุณคุ้นเคยกับการเขียนโปรแกรม R มากขึ้น แนวทางที่ใช้โค้ดจะให้การควบคุม ความสามารถในการทำซ้ำ และความสามารถในการทำงานอัตโนมัติมากขึ้นในขั้นตอนการทำงานของคุณ

ต้องการความช่วยเหลือกับรูปแบบข้อมูลอื่นๆ หรือไม่? ดูคู่มือของเราเกี่ยวกับการนำเข้าไฟล์ Excel ใน R หรือเรียนรู้เพิ่มเติมเกี่ยวกับการติดตั้ง R และ RStudio บนระบบของคุณ