Cum Să Importi un Fișier CSV în R: 6 Pași Simpli

By Leonard Cucosro
RAnaliză DateProgramare

Învață cum să importi un fișier CSV în R și RStudio - o abilitate fundamentală pentru orice flux de lucru în analiza datelor. Acest ghid complet îți arată cum să importi fișiere CSV în R folosind atât interfața grafică RStudio cât și funcția read.csv() cu metode bazate pe cod.

Fie că trebuie să încarci un fișier CSV în R pentru curățarea datelor, analiza statistică sau explorare rapidă, acest tutorial acoperă totul. În șase pași simpli, vei stăpâni importul fișierelor CSV în R eficient pentru orice proiect.

Prerechizite

Înainte de a începe, asigură-te că ai R și RStudio instalate pe calculator. Dacă nu le-ai instalat încă, urmează ghidul nostru pas cu pas despre cum să instalezi R și RStudio pe Windows, macOS, Linux și UNIX.

După ce ai terminat, deschide RStudio și hai să începem.

Lucrezi cu fișiere Excel? Vezi ghidul nostru despre importul fișierelor Excel în R.


Metoda 1: Cum Să Importi un Fișier CSV în R Folosind GUI

Folosirea interfeței grafice în RStudio este o modalitate simplă și convenabilă de a importa un fișier CSV. Iată pașii de urmat:

Pasul 1: Lansează RStudio

Începe prin a deschide RStudio pe calculatorul tău.

Pasul 2: Mergi la 'Import Dataset'

Caută panoul Environment, care se află de obicei în partea dreaptă sus. Vei vedea un meniu derulant Import Dataset. Apasă pe el.

Panoul Environment din RStudio care afișează meniul derulant Import Dataset pentru importarea fișierelor CSV în R Panoul Environment din RStudio cu meniul Import Dataset evidențiat

Pasul 3: Alege 'From Text (readr)...'

În meniul derulant, selectează opțiunea From Text (readr).... Aceasta va deschide un explorator de fișiere.

Meniul derulant Import Dataset din RStudio care afișează opțiunea From Text readr pentru a importa fișiere CSV în R Selectarea opțiunii "From Text (readr)..." din meniul Import Dataset în RStudio

Pasul 4: Selectează Fișierul CSV

Apasă pe butonul Browse și navighează la fișierul tău CSV în exploratorul de fișiere, selectează-l și apasă Open.

Pasul 5: Ajustează Setările de Import

RStudio va deschide o fereastră pentru importul datelor. Aici poți ajusta modul în care RStudio citește fișierul tău CSV:

  • Dacă primul rând conține numele coloanelor
  • Numărul maxim de rânduri de citit
  • Delimitatorul folosit (virgulă, punct și virgulă, tab)
  • Tipurile de date pentru fiecare coloană

Pasul 6: Apasă pe 'Import'

După ce ai ajustat setările conform nevoilor tale, apasă pe butonul Import. Datele tale CSV vor fi importate în RStudio sub forma unui cadru de date (data frame).

Fereastra de import date CSV din RStudio cu previzualizarea datelor din fișierul CSV și opțiunile de configurare Fereastra Import Text Data în RStudio cu previzualizarea datelor CSV și opțiunile de import


Metoda 2: Cum Să Importi un Fișier CSV în R Folosind Cod

Dacă preferi o metodă mai reproductibilă de a importa fișierele CSV, sau lucrezi în afara RStudio, iată cum poți importa un fișier CSV folosind cod:

Pasul 1: Setează Directorul de Lucru

În primul rând, trebuie să îți setezi directorul de lucru la locația fișierului CSV. Folosește funcția setwd():

setwd("/cale/catre/directorul/tau")

Înlocuiește "/cale/catre/directorul/tau" cu calea reală către directorul tău.

Exemplu pentru Windows:

setwd("C:/Users/NumeTau/Documents")

Exemplu pentru macOS/Linux:

setwd("~/Documents")

Pasul 2: Folosește Funcția read.csv()

Funcția read.csv() este utilizată pentru a importa date din fișiere CSV în R. Să presupunem că fișierul se numește data.csv:

data <- read.csv("data.csv")

În acest cod:

  • data.csv este numele fișierului CSV pe care îl importăm
  • data este cadrul de date R unde stocăm datele CSV

Pasul 3: Verifică Datele Importate

Pentru a te asigura că datele au fost importate corect, poți folosi:

# Vizualizează primele 6 rânduri
head(data)
 
# Vizualizează întregul set de date într-o fereastră nouă
View(data)
 
# Verifică structura datelor
str(data)
 
# Rezumat statistic
summary(data)

Pasul 4: Gestionează Datele Lipsă

Fișierele CSV pot conține adesea valori lipsă, pe care R le convertește în NA (Not Available). Poți gestiona aceste valori astfel:

# Elimină rândurile cu NA
data <- na.omit(data)
 
# Înlocuiește valorile NA cu 0
data[is.na(data)] <- 0
 
# Verifică câte valori NA există
sum(is.na(data))

Pasul 5: Salvează Datele

Dacă dorești să salvezi cadrul de date înapoi într-un fișier CSV, folosește funcția write.csv():

write.csv(data, "data_modificat.csv", row.names = FALSE)

Acest cod va salva cadrul de date data într-un fișier CSV numit data_modificat.csv.


Opțiuni Avansate pentru read.csv()

Funcția read.csv() acceptă mai mulți parametri pentru a personaliza importul:

data <- read.csv(
  "data.csv",
  header = TRUE,           # Primul rând conține nume de coloane
  sep = ",",               # Delimitatorul (virgulă implicit)
  stringsAsFactors = FALSE,# Păstrează textul ca string, nu factor
  na.strings = c("", "NA", "N/A"),  # Valori considerate NA
  encoding = "UTF-8"       # Codificarea fișierului
)

Delimitatoare Alternative

Pentru fișiere cu delimitatoare diferite:

# Fișiere delimitate prin punct și virgulă (format european)
data <- read.csv2("data.csv")
 
# Fișiere delimitate prin tab
data <- read.table("data.tsv", sep = "\t", header = TRUE)
 
# Delimitator personalizat (pipe)
data <- read.table("data.txt", sep = "|", header = TRUE)

Citire Rapidă cu readr

Pentru fișiere mari, pachetul readr oferă funcții mai rapide:

# Instalează și încarcă readr
install.packages("readr")
library(readr)
 
# Citește CSV cu read_csv (mai rapid)
data <- read_csv("data.csv")

Întrebări Frecvente

Pentru a importa un fișier CSV în R: (1) Setează directorul de lucru cu setwd('/cale/catre/director'), (2) Folosește data <- read.csv('nume_fisier.csv') pentru a încărca fișierul CSV. Alternativ, folosește interfața grafică RStudio apăsând Import Dataset > From Text (readr).
Funcția read.csv() este cea mai comună funcție built-in în R pentru importarea fișierelor CSV. Citește automat valorile separate prin virgulă și creează un data frame. Pentru mai mult control, poți folosi read.table() cu parametri personalizați sau read_csv() din pachetul readr pentru performanță mai bună.
read.csv() este o funcție R de bază, mai lentă dar disponibilă implicit, în timp ce read_csv() din pachetul readr (parte din tidyverse) este mult mai rapidă, oferă feedback mai bun despre progres și creează tibbles în loc de data frames. read_csv() are și un comportament implicit mai bun pentru parsarea tipurilor de coloane.
Funcția read.csv() convertește automat celulele goale în NA. Poți specifica valori NA personalizate folosind parametrul na.strings: read.csv('fisier.csv', na.strings = c('', 'NA', 'N/A', 'lipsă')). După import, folosește na.omit() pentru a elimina rândurile cu NA sau înlocuiește-le cu valori specifice.
Folosește read.csv2() pentru fișiere delimitate prin punct și virgulă, sau read.table() cu delimitator personalizat: read.table('fisier.csv', sep = '\t', header = TRUE) pentru fișiere delimitate prin tab. Parametrul sep acceptă orice caracter delimitator inclusiv pipe (|), punct și virgulă (;) sau separatori personalizați.
Setează directorul de lucru la desktop: setwd('~/Desktop') pe Mac/Linux sau setwd('C:/Users/NumeTau/Desktop') pe Windows, apoi folosește data <- read.csv('fisier.csv'). Alternativ, folosește calea completă: read.csv('~/Desktop/fisier.csv').
CSV (Comma-Separated Values) este un format de fișier text simplu care stochează date tabulare (numere și text) în text simplu. Fiecare linie din fișier este un rând de date, iar valorile din fiecare rând sunt separate prin virgule. Este unul dintre cele mai comune formate pentru schimbul de date între programe.
Folosește list.files() pentru a obține toate numele fișierelor CSV, apoi lapply() sau o buclă pentru a le citi: files <- list.files(pattern = '\.csv$'); data_list <- lapply(files, read.csv); combined_data <- do.call(rbind, data_list). Aceasta citește toate fișierele CSV din director și le combină într-un singur data frame.
Bunele practici includ: (1) Folosește read_csv() din readr pentru fișiere mari (mai rapid), (2) Specifică tipurile de coloane explicit cu col_types pentru a evita erorile de parsare, (3) Folosește stringsAsFactors = FALSE în read.csv() pentru a păstra textul ca șiruri de caractere, (4) Verifică problemele de codificare cu parametrul encoding, (5) Verifică întotdeauna importul cu str(data) sau summary(data) după încărcare.

Concluzie

În acest ghid complet, ai învățat cum să importi fișiere CSV în R folosind atât interfața grafică RStudio cât și funcția read.csv() cu metode bazate pe cod.

Rezumat:

MetodăComandă/Acțiune
GUI RStudioImport Dataset > From Text (readr)
Cod Rdata <- read.csv("fisier.csv")
readr (rapid)data <- read_csv("fisier.csv")
Verificarehead(data), str(data), View(data)
Salvarewrite.csv(data, "fisier.csv")

Funcția read.csv() este instrumentul tău esențial pentru importarea datelor CSV în R, oferind flexibilitate pentru a gestiona diferite delimitatoare, valori lipsă și tipuri de date.

Ai nevoie de ajutor cu alte formate de date? Consultă ghidul nostru despre importul fișierelor Excel în R sau învață mai multe despre instalarea R și RStudio pe sistemul tău.