Cum Să Importi un Fișier Excel în R: 6 Pași Simpli

By Leonard Cucosro
RAnaliză DateProgramare

Învățarea modului de import a datelor Excel în R și RStudio este esențială pentru orice analist de date care lucrează cu fișiere de tip spreadsheet. Acest ghid complet îți arată cum să importi fișiere Excel în RStudio folosind atât interfața grafică cât și pachetul readxl cu metode bazate pe cod.

Fie că trebuie să importi Excel în R pentru analiza datelor, să încarci date Excel în R pentru modelare statistică, sau să importi fișiere Excel în RStudio pentru analiză rapidă, acest tutorial acoperă totul. Vom gestiona atât formatele .xls cât și .xlsx folosind puternica funcție read_excel().

În șase pași simpli, vei stăpâni fluxurile de lucru RStudio import Excel și vei învăța cum să importi Excel în R eficient pentru orice proiect de analiză a datelor.

Prerechizite

Înainte de a începe, asigură-te că ai R și RStudio instalate pe calculator. Dacă nu le-ai instalat încă, urmează ghidul nostru pas cu pas despre cum să instalezi R și RStudio pe Windows, macOS, Linux și UNIX.

După ce ai terminat, deschide RStudio și putem începe.

Lucrezi cu fișiere CSV? Vezi ghidul nostru despre importul fișierelor CSV în R.


Importă un Fișier Excel în R Folosind GUI

Cel mai simplu mod de a importa un fișier Excel în R este prin intermediul interfeței grafice RStudio. Iată pașii de urmat:

Pasul 1: Deschide RStudio

În primul rând, lansează RStudio pe calculatorul tău.

Pasul 2: Apasă pe 'Import Dataset'

Mergi la panoul Environment în RStudio, care se află de obicei în partea dreaptă sus. Vei vedea un meniu derulant Import Dataset – așa cum este arătat în imaginea de mai jos. Apasă pe el.

Panoul Environment din RStudio care afișează meniul derulant Import Dataset pentru importarea fișierelor Excel în R Panoul Environment din RStudio cu meniul Import Dataset evidențiat

Pasul 3: Alege 'From Excel...'

În meniul derulant, selectează opțiunea From Excel.... Aceasta va deschide un explorator de fișiere.

Meniul derulant Import Dataset din RStudio care afișează opțiunea From Excel pentru importarea fișierelor Excel în R Selectarea opțiunii "From Excel..." din meniul Import Dataset în RStudio

Pasul 4: Selectează Fișierul Tău

În fereastra Import Excel Data, apasă pe butonul Browse pentru a naviga la fișierul tău Excel în exploratorul de fișiere, selectează-l și apasă Open.

Pasul 5: Configurează Opțiunile de Import

RStudio îți va arăta o fereastră de import a datelor unde poți personaliza modul în care RStudio citește fișierul tău Excel. Poți seta opțiuni precum:

  • Care foi de calcul (sheets) să fie importate
  • Dacă primul rând conține numele coloanelor
  • Dacă să convertească textul în factori
  • Numărul maxim de rânduri de citit, printre altele

Pasul 6: Apasă pe 'Import'

După ce ai ajustat setările conform nevoilor tale, apasă pe butonul Import.

Fereastra Import Excel Data din RStudio cu previzualizarea datelor din fișierul Excel și opțiunile de configurare Fereastra Import Excel Data în RStudio cu previzualizarea datelor și opțiunile de import

Datele tale vor fi importate în RStudio și vor apărea ca un data frame în mediul tău. Acum poți lucra cu datele tale Excel în R.

Această abordare GUI este o modalitate excelentă pentru începători de a începe să lucreze cu date în RStudio. Cu toate acestea, pe măsură ce devii mai avansat, s-ar putea să găsești abordarea bazată pe cod mai flexibilă și puternică, în special pentru reproductibilitate și automatizarea fluxurilor tale de analiză a datelor.


Importă un Fișier Excel în R Folosind Cod

Pe măsură ce devii mai avansat în R, probabil vei prefera să importi fișiere Excel prin cod. Să învățăm cum să facem asta.

Pasul 1: Instalează Pachetele Necesare

Mai multe pachete în R pot importa fișiere Excel, dar pentru acest tutorial vom folosi pachetele readxl și writexl. Aceste pachete pot gestiona atât formatele .xls cât și .xlsx.

install.packages("readxl")
install.packages("writexl")

Funcția install.packages() descarcă și instalează pachetul de pe CRAN (Comprehensive R Archive Network).

Pasul 2: Încarcă Pachetul Necesar

După instalare, trebuie să încărcăm pachetul readxl în mediul nostru R. Putem face acest lucru folosind funcția library():

library(readxl)

Pasul 3: Setează Directorul de Lucru

În R, este important să setezi directorul de lucru la locația unde se află fișierul tău Excel. Aceasta se poate face cu funcția setwd().

setwd("/cale/catre/directorul/tau")

Înlocuiește "/cale/catre/directorul/tau" cu calea reală către directorul tău.

Exemplu pentru Windows:

setwd("C:/Users/NumeTau/Documents")

Exemplu pentru macOS/Linux:

setwd("~/Documents")

Pasul 4: Importă Fișierul Excel

Acum suntem pregătiți să importăm fișierul nostru Excel. Vom folosi funcția read_excel() pentru aceasta. Să presupunem că fișierul nostru se numește data.xlsx.

data <- read_excel("data.xlsx")

În acest cod:

  • data.xlsx este numele fișierului Excel pe care îl importăm
  • data este numele data frame-ului R unde stocăm conținutul fișierului Excel

Pasul 5: Verifică Datele

Pentru a te asigura că datele au fost importate corect, poți vizualiza primele rânduri cu funcția head() sau întregul set de date cu funcția View():

# Vizualizează primele 6 rânduri
head(data)
 
# Vizualizează întregul set de date
View(data)
 
# Verifică structura datelor
str(data)
 
# Rezumat statistic
summary(data)

Pasul 6: Salvează Datele

Dacă dorești să scrii datele înapoi în Excel, folosește funcția write_xlsx() din biblioteca writexl.

library(writexl)
write_xlsx(data, "data_modificat.xlsx")

Aceasta va salva data frame-ul tău 'data' într-un fișier Excel numit data_modificat.xlsx.


Opțiuni Avansate pentru read_excel()

Funcția read_excel() oferă mai multe opțiuni pentru a personaliza importul:

Importă o Foi Specifică

# Importă după numele foii
data <- read_excel("fisier.xlsx", sheet = "Sheet1")
 
# Importă după numărul foii
data <- read_excel("fisier.xlsx", sheet = 2)
 
# Listează toate foile din fișier
excel_sheets("fisier.xlsx")

Specifică Intervalul de Celule

# Importă un interval specific de celule
data <- read_excel("fisier.xlsx", range = "A1:D10")
 
# Importă un interval dintr-o foaie specifică
data <- read_excel("fisier.xlsx", range = "Sheet1!B2:E50")

Gestionează Valorile Lipsă

# Specifică valorile care ar trebui tratate ca NA
data <- read_excel(
  "fisier.xlsx",
  na = c("", "NA", "N/A", "lipsă", "-")
)

Configurează Tipurile de Coloane

# Specifică tipurile de date pentru coloane
data <- read_excel(
  "fisier.xlsx",
  col_types = c("text", "numeric", "date", "logical")
)

Întrebări Frecvente

Pentru a importa date Excel în R: (1) Instalează pachetul readxl cu install.packages('readxl'), (2) Încarcă-l cu library(readxl), (3) Folosește data <- read_excel('nume_fisier.xlsx') pentru a încărca fișierul Excel. Alternativ, folosește interfața grafică RStudio apăsând Import Dataset > From Excel.
Pachetul readxl este cea mai populară alegere pentru importarea fișierelor Excel în R. Gestionează atât formatele .xls cât și .xlsx fără a necesita dependențe externe. Instalează-l cu install.packages('readxl') și folosește funcția read_excel() pentru a importa datele.
Da, pachetul readxl poate citi atât fișiere .xls (format Excel vechi) cât și .xlsx (format Excel modern). Funcția read_excel() detectează automat formatul fișierului și îl importă corect fără nicio configurare suplimentară necesară.
Folosește parametrul sheet în read_excel(): data <- read_excel('fisier.xlsx', sheet = 'NumeFoaie') sau data <- read_excel('fisier.xlsx', sheet = 2) pentru a importa după numărul foii. Poți lista toate foile cu excel_sheets('fisier.xlsx').
Problemele comune includ: (1) Erori de cale la fișier - folosește slash-uri forward sau backslash-uri duble, (2) Pachetul readxl nu este instalat, (3) Nume greșit al foii, (4) Celule unite cauzând dezalinierea datelor, (5) Caractere speciale în numele coloanelor. Verifică întotdeauna datele cu head() după import.
Folosește pachetul writexl: (1) Instalează cu install.packages('writexl'), (2) Încarcă cu library(writexl), (3) Exportă cu write_xlsx(data, 'output.xlsx'). Aceasta creează un fișier Excel nou cu data frame-ul tău R.
Funcția read_excel() creează automat un data frame (tehnic un tibble). Folosește: data <- read_excel('fisier.xlsx'). Obiectul 'data' rezultat este un data frame pe care îl poți manipula cu funcții R standard precum subset(), filter() sau select().
Nu, R de bază nu include funcționalitate de import Excel. Trebuie să instalezi un pachet precum readxl (recomandat), xlsx sau openxlsx. Pachetul readxl este cea mai ușoară opțiune deoarece nu are dependențe externe și vine pre-instalat cu RStudio.
Funcția read_excel() convertește automat celulele goale în valori NA. Poți specifica valori NA personalizate folosind parametrul na: read_excel('fisier.xlsx', na = c('', 'NA', 'N/A', 'lipsă')). Aceasta spune lui R care valori ar trebui tratate ca date lipsă.

Concluzie

În acest ghid complet, ai învățat cum să importi fișiere Excel în R folosind atât interfața grafică RStudio cât și metodele bazate pe cod cu pachetul readxl.

Rezumat:

MetodăComandă/Acțiune
GUI RStudioImport Dataset > From Excel
Cod Rdata <- read_excel("fisier.xlsx")
Foi specificeread_excel("file.xlsx", sheet = "Sheet1")
Interval celuleread_excel("file.xlsx", range = "A1:D10")
Salvarewrite_xlsx(data, "output.xlsx")

Funcția read_excel() este instrumentul tău principal pentru importarea datelor Excel în R, oferind flexibilitate pentru a selecta foi specifice, gestiona numele coloanelor și administra valorile lipsă.

Ai nevoie de ajutor cu alte formate de date? Consultă ghidul nostru despre importul fișierelor CSV în R sau învață mai multe despre instalarea R și RStudio pe sistemul tău.