Cum Să Efectuezi Analiza de Mediere în R: 7 Pași Simpli

By Leonard Cucosro
Advanced AnalysisR ProgrammingStatistical Tests

Învățarea cum să efectuezi analiza de mediere în R este esențială pentru înțelegerea efectelor indirecte în cercetarea ta. Acest ghid complet îți arată cum să efectuezi analiza de mediere în R folosind pachetul lavaan și tehnici de mediere în R, cu o prezentare pas cu pas folosind un set de date fictiv de 30 de respondenți.

Indiferent dacă trebuie să efectuezi analiza de mediere în R pentru teza ta, să înțelegi analiza de mediere R pentru publicare sau să construiești un model de mediere în R pentru cercetare exploratorie, acest tutorial acoperă totul. Îți vom arăta cum să folosești pachetul de mediere în R cu lavaan, să interpretezi coeficienții de cale (a, b, c) și să vizualizezi rezultatele cu diagrame profesionale.

În șapte pași ușor de urmat, vei stăpâni fluxurile de lucru pentru mediere în R folosind atât pachetele lavaan cât și mediation, și vei învăța cum să efectuezi analiza completă de mediere în R de la importul datelor până la interpretare.

Obiective de Învățare

La sfârșitul acestei lecții, vei fi capabil să:

  • Înțelegi conceptul de analiză de mediere și scopul său în explorarea efectelor indirecte.

  • Vizualizezi un model de mediere folosind o diagramă simplă.

  • Instalezi și încarci pachetele R necesare pentru analiza de mediere

  • Importi și explorezi un set de date în R, calculând statistici descriptive și corelații între variabile.

  • Specifici un model de mediere în R.

  • Estimezi și ajustezi modelul de mediere la setul tău de date în R

  • Interpretezi rezultatele unei analize de mediere, incluzând efecte directe, efecte indirecte și efecte totale.

  • Creezi o vizualizare a rezultatelor analizei de mediere în R.

  • Aplici procesul de analiză de mediere propriilor tale întrebări de cercetare și seturi de date.

Ești gata? Să începem și să explorăm procesul!

Ce Este Analiza de Mediere?

Înainte de a începe să calculăm numere, să discutăm pe scurt ce este analiza de mediere. Este o tehnică statistică care ne ajută să înțelegem cum o variabilă independentă (X) influențează o variabilă dependentă (Y) printr-o variabilă mediatoare (M).

Diagrama analizei de mediere care arată variabila independentă X, variabila mediatoare M și variabila dependentă Y cu căile a, b și c

Diagrama modelului de mediere de bază cu căile X→M→Y.

Analiza de mediere este deosebit de utilă pentru a determina dacă efectul lui X asupra lui Y este în întregime, parțial sau deloc mediat de M.

Setul Nostru de Date: O Scurtă Prezentare

În exemplul nostru, vom lucra cu un set de date de 30 de respondenți. Să spunem că acești respondenți sunt angajați și dorim să studiem relația dintre satisfacția la locul de muncă (X), performanța la locul de muncă (Y) și motivația la locul de muncă (M).

Ipoteza noastră este că satisfacția la locul de muncă influențează performanța la locul de muncă indirect prin motivația la locul de muncă. Așadar, vom efectua o analiză de mediere pentru a vedea dacă acest lucru este adevărat.

Pentru a vizualiza ipoteza noastră, putem crea o diagramă simplă cu trei variabile: satisfacția la locul de muncă (X), motivația la locul de muncă (M) și performanța la locul de muncă (Y).

Exemplu de analiză de mediere cu variabilele satisfacție la locul de muncă, motivație la locul de muncă și performanță la locul de muncă arătând căile a, b și c

Exemplu de model de mediere: satisfacția la locul de muncă → motivația la locul de muncă → performanța la locul de muncă.

În această diagramă, săgeata de la X la M reprezintă efectul satisfacției la locul de muncă asupra motivației la locul de muncă (calea a). Săgeata de la M la Y reprezintă efectul motivației la locul de muncă asupra performanței la locul de muncă (calea b). Efectul indirect al satisfacției la locul de muncă asupra performanței la locul de muncă prin motivația la locul de muncă este produsul căilor a și b (a×ba \times b).

Cum Să Efectuezi Analiza de Mediere în R

Acum că avem o înțelegere clară a setului nostru de date și a ipotezei, să sărim în R și să începem să lucrăm cu datele.

Pasul 1: Instalează și Încarcă Pachetele

Mai întâi, va trebui să instalăm și să încărcăm pachetele necesare pentru efectuarea analizei de mediere în R, precum și pentru vizualizarea rezultatelor:

# Instalează pachetele
install.packages("psych")
install.packages("lavaan")
install.packages("ggplot2")
install.packages("readxl")
install.packages("semPlot")
 
# Încarcă pachetele
library(psych)
library(lavaan)
library(ggplot2)
library(readxl)
library(semPlot)

Iată o scurtă descriere a pachetelor de mai sus:

  • psych: Pachet pentru efectuarea analizelor psihologice și psihometrice, cum ar fi analiza factorială și statisticile descriptive.

  • lavaan: Pachet pentru modelarea ecuațiilor structurale (SEM) cu sintaxă ușor de utilizat și o gamă de indici de ajustare.

  • ggplot2: Pachet flexibil de vizualizare a datelor bazat pe Grammar of Graphics pentru crearea de grafice complexe și personalizabile.

  • readxl: Pachet ușor pentru importarea fișierelor Excel (.xls și .xlsx) în data frames R.

  • semPlot: Instrument de vizualizare pentru crearea de diagrame de cale ale modelelor de ecuații structurale (SEM) cu opțiuni de personalizare.

Pasul 2: Importă și Explorează Setul de Date

În continuare, vom importa setul nostru de date în R și vom privi primele câteva rânduri pentru a ne familiariza cu datele. Poți folosi propriul tău set de date sau poți descărca setul de date de practică din bara laterală (numai în scopuri educaționale).

NOTĂ: Dacă setul tău de date este un fișier Excel .xlsx, folosește următoarea sintaxă:

# Importă setul de date
data <- read_excel("calea/către/setul/tău/de/date.xlsx")
 
# Explorează setul de date
head(data)
  • Dacă setul tău de date este un fișier CSV, folosește următoarea sintaxă:
# Importă setul de date
data <- read.csv("calea/către/setul/tău/de/date.csv")
 
# Explorează setul de date
head(data)

Presupunând că setul nostru de date conține trei coloane – job_satisfaction, workplace_motivation și job_performance – output-ul ar trebui să arate așa:

Consola R arătând output-ul head() al setului de date de mediere cu coloanele satisfacție la locul de muncă, motivație la locul de muncă și performanță la locul de muncă

Previzualizarea setului de date arătând primele 6 rânduri ale setului de date pentru analiza de mediere în R.

Pasul 3: Statistici Descriptive și Corelații

Înainte de a efectua analiza de mediere, să calculăm câteva statistici descriptive și corelații pentru variabilele noastre.

# Statistici descriptive
summary(data)
 
# Corelații
correlations <- cor(data)
print(correlations)

Acest lucru ne va oferi o prezentare generală a mediei, abaterii standard și corelațiilor variabilelor noastre.

Output-ul consolei R arătând rezumatul statisticilor descriptive și matricea de corelație pentru variabilele analizei de mediere

Output-ul statisticilor descriptive și al matricei de corelație în R pentru variabilele de mediere.

Efectuarea statisticilor descriptive și a analizei de corelație înainte de analiza de mediere este importantă din mai multe motive:

  • Înțelegerea datelor: Statisticile descriptive oferă un rezumat al setului tău de date și te ajută să înțelegi tendința centrală, dispersia și forma distribuției pentru fiecare variabilă. Această înțelegere este crucială înainte de a te scufunda în analize mai complexe, cum ar fi analiza de mediere, deoarece te ajută să identifici orice probleme potențiale sau valori extreme în date.

  • Verificarea presupunerilor: Multe tehnici statistice, inclusiv analiza de mediere, se bazează pe anumite presupuneri despre date. Statisticile descriptive te pot ajuta să evaluezi dacă aceste presupuneri sunt îndeplinite. De exemplu, normalitatea variabilelor este adesea o presupunere în analiza de mediere și poți examina acest lucru prin statistici descriptive precum asimetria și aplatizarea.

  • Perspective preliminare: Analiza de corelație oferă o înțelegere inițială a relațiilor dintre variabilele tale. Te ajută să examinezi puterea și direcția asociațiilor, ceea ce poate fi util în generarea de ipoteze sau informarea modelului de mediere. Corelații puternice între variabila independentă (X) și mediator (M), precum și între mediator (M) și variabila dependentă (Y), ar putea indica prezența efectelor de mediere.

  • Evaluarea multicoliniarității: Examinarea corelațiilor poate ajuta și la detectarea multicoliniarității, o situație în care două sau mai multe variabile predictive sunt foarte corelate. Multicoliniaritatea poate cauza probleme în analiza de mediere, deoarece poate duce la estimări instabile sau erori standard umflate. Prin identificarea multicoliniarității devreme, o poți aborda înainte de a continua cu analiza de mediere.

Pasul 4: Specifică Modelul de Mediere

Acum că înțelegem mai bine setul nostru de date, este timpul să specificăm modelul de mediere. Vom folosi pachetul R lavaan pentru a defini modelul folosind următoarea sintaxă:

mediation_model <- '
 # Efecte directe
 workplace_motivation ~ a*job_satisfaction
 job_performance ~ c*job_satisfaction + b*workplace_motivation
 
 # Efect indirect (a * b)
 indirect := a*b
 
 # Efect total (c + indirect)
 total := c + indirect
'

În acest model, definim efectele directe ale satisfacției la locul de muncă (X) asupra motivației la locul de muncă (M) și performanței la locul de muncă (Y). De asemenea, specificăm efectul indirect (a×ba \times b) și efectul total (c+indirectc + indirect).

NOTĂ: Dacă te întrebi de ce nu obții niciun output pentru scriptul R de mai sus, este pentru că acesta specifică doar modelul de mediere ca un șir de caractere, dar nu efectuează analiza și nu afișează niciun rezultat. Analiza efectivă de mediere în R va fi efectuată în pasul următor.

Pasul 5: Estimează Modelul de Mediere

Cu modelul nostru de mediere specificat, îl putem estima acum folosind pachetul lavaan. Vom ajusta modelul la setul nostru de date și apoi vom rezuma rezultatele.

# Estimează modelul de mediere
mediation_results <- sem(mediation_model, data = data)
 
# Rezumă rezultatele
summary(mediation_results, standardized = TRUE, fit.measures = TRUE)

Rezumatul va arăta efectele directe estimate (căile a, b și c), efectul indirect (a×ba \times b) și efectul total (c+indirectc + indirect) împreună cu nivelurile lor de semnificație – așa cum se vede mai jos:

Output-ul analizei de mediere lavaan în R arătând estimările parametrilor, coeficienții de cale, efectele indirecte și efectele totale

Output-ul SEM lavaan afișând rezultatele analizei de mediere cu estimările căilor și nivelurile de semnificație.

Bine, dar ce înseamnă toate aceste numere? Să discutăm acest lucru în continuare.

Pasul 6: Interpretează Output-ul Medierii în R

Pe baza output-ului analizei tale de mediere folosind setul de date fictiv pe care l-am folosit în această lecție, iată cum să interpretezi rezultatele analizei de mediere în R:

Estimările Parametrilor:

  • Calea a (satisfacția la locul de muncă → motivația la locul de muncă): Coeficientul estimat pentru efectul direct al satisfacției la locul de muncă (X) asupra motivației la locul de muncă (M) este 1.218. Acest lucru sugerează că, în medie, o creștere de o unitate în satisfacția la locul de muncă este asociată cu o creștere de 1.218 unități în motivația la locul de muncă, presupunând o relație liniară. Coeficientul standardizat (Std.all) este 1.000, ceea ce indică o relație pozitivă puternică între satisfacția la locul de muncă și motivația la locul de muncă.

  • Calea b (motivația la locul de muncă → performanța la locul de muncă): Coeficientul estimat pentru efectul direct al motivației la locul de muncă (M) asupra performanței la locul de muncă (Y) este 0.727. Acest lucru sugerează că, în medie, o creștere de o unitate în motivația la locul de muncă este asociată cu o creștere de 0.727 unități în performanța la locul de muncă, presupunând o relație liniară. Coeficientul standardizat (Std.all) este 0.632, ceea ce indică o relație pozitivă moderată între motivația la locul de muncă și performanța la locul de muncă.

  • Calea c (satisfacția la locul de muncă → performanța la locul de muncă): Coeficientul estimat pentru efectul direct al satisfacției la locul de muncă (X) asupra performanței la locul de muncă (Y) fără a lua în considerare efectul de mediere este 0.516. Acest lucru sugerează că, în medie, o creștere de o unitate în satisfacția la locul de muncă este asociată cu o creștere de 0.516 unități în performanța la locul de muncă, presupunând o relație liniară. Coeficientul standardizat (Std.all) este 0.368, ceea ce indică o relație pozitivă slabă până la moderată între satisfacția la locul de muncă și performanța la locul de muncă.

Parametri Definiți:

  • Efect indirect (a×ba \times b): Efectul indirect estimat al satisfacției la locul de muncă (X) asupra performanței la locul de muncă (Y) prin motivația la locul de muncă (M) este 0.885. Acest lucru sugerează că, în medie, o creștere de o unitate în satisfacția la locul de muncă rezultă într-o creștere de 0.885 unități în performanța la locul de muncă indirect prin efectul său asupra motivației la locul de muncă. Efectul indirect standardizat (Std.all) este 0.632, ceea ce indică o relație pozitivă moderată.

  • Efect total (c+indirectc + indirect): Efectul total estimat al satisfacției la locul de muncă (X) asupra performanței la locul de muncă (Y), luând în considerare atât efectele directe cât și indirecte, este 1.401. Acest lucru sugerează că, în medie, o creștere de o unitate în satisfacția la locul de muncă este asociată cu o creștere de 1.401 unități în performanța la locul de muncă când se iau în considerare atât efectele directe cât și indirecte. Efectul total standardizat (Std.all) este 1.000, ceea ce indică o relație pozitivă puternică.

Doar ca să știi, rezultatele prezentate aici se bazează pe un set de date fictiv creat numai în scopuri demonstrative, iar interpretările nu ar trebui considerate semnificative. Cu toate acestea, procesul de interpretare a rezultatelor analizei de mediere rămâne același pentru seturile de date din viața reală.

Pasul 7: Vizualizează Medierea în R

Pentru a face rezultatele noastre mai accesibile, să creăm o diagramă folosind pachetul ggplot2:

# Încarcă bibliotecile necesare
library(ggplot2)
 
# Creează un grafic cu bare pentru a vizualiza coeficienții de cale
ggplot(path_data, aes(x = path, y = coefficient, fill = path)) +
 geom_bar(stat = "identity", position = position_dodge()) +
 geom_text(aes(label = round(coefficient, 3)), vjust = -0.3, size = 4) +
 theme_minimal() +
 theme(legend.position = "none") +
 ylab("Coefficient") +
 xlab("Path") +
 ggtitle("Mediation Analysis Results")

Scriptul de mai sus va crea un grafic cu bare care afișează coeficienții pentru fiecare cale din modelul nostru de mediere:

Vizualizarea cu grafic cu bare a coeficienților de cale ai analizei de mediere creată cu ggplot2 în R

Graficul cu bare arătând coeficienții de cale (a, b, c, indirect, total) din analiza de mediere.

Graficul cu bare pe care l-am creat mai sus este o reprezentare bună a analizei noastre de mediere. Totuși, putem merge mai departe și genera o diagramă de mediere cu estimările căilor afișate pe săgeți, făcând mai ușoară interpretarea relațiilor dintre variabile folosind următorul script R:

# Încarcă bibliotecile necesare
library(ggplot2)
library(semPlot)
 
# Creează un grafic cu bare pentru a vizualiza coeficienții de cale
bar_plot <- ggplot(path_data, aes(x = path, y = coefficient, fill = path)) +
 geom_bar(stat = "identity", position = position_dodge()) +
 geom_text(aes(label = round(coefficient, 3)), vjust = -0.3, size = 4) +
 theme_minimal() +
 theme(legend.position = "none") +
 ylab("Coefficient") +
 xlab("Path") +
 ggtitle("Mediation Analysis Results")
 
# Afișează graficul cu bare
print(bar_plot)
 
# Afișează diagrama de mediere cu estimările căilor
semPaths(mediation_fit, whatLabels = "est", style = "lisrel", intercepts = FALSE)

Acest lucru va genera o diagramă de mediere cu estimările căilor afișate pe săgeți, făcând mai ușoară interpretarea relațiilor dintre variabilele din modelul nostru:

Vizualizarea diagramei de cale SemPlot a modelului de mediere în R cu estimările coeficienților pe săgeți

Diagrama de cale creată cu semPlot arătând modelul de mediere cu coeficienții estimați.

Iată o scurtă explicație despre cum să interpretezi diagrama de mai sus:

  • X → M (calea a): Această săgeată arată efectul satisfacției la locul de muncă (X) asupra motivației la locul de muncă (M). Un număr pozitiv înseamnă că pe măsură ce satisfacția la locul de muncă crește, motivația la locul de muncă crește de asemenea. Un număr negativ indică faptul că pe măsură ce satisfacția la locul de muncă crește, motivația la locul de muncă scade. Magnitudinea numărului reflectă puterea acestei relații.

  • M → Y (calea b): Această săgeată reprezintă efectul motivației la locul de muncă (M) asupra performanței la locul de muncă (Y), presupunând că satisfacția la locul de muncă (X) este menținută constantă. Un număr pozitiv înseamnă că pe măsură ce motivația la locul de muncă crește, performanța la locul de muncă crește de asemenea. Un număr negativ indică faptul că pe măsură ce motivația la locul de muncă crește, performanța la locul de muncă scade. Magnitudinea numărului reflectă puterea acestei relații.

  • X → Y (calea c): Această săgeată arată efectul direct al satisfacției la locul de muncă (X) asupra performanței la locul de muncă (Y), fără a lua în considerare mediatorul (motivația la locul de muncă). Un număr pozitiv înseamnă că pe măsură ce satisfacția la locul de muncă crește, performanța la locul de muncă crește de asemenea. Un număr negativ indică faptul că pe măsură ce satisfacția la locul de muncă crește, performanța la locul de muncă scade. Magnitudinea numărului reflectă puterea acestei relații.

Pentru a interpreta rezultatele, ia în considerare semnele (pozitive sau negative) și magnitudinile coeficienților de cale. O valoare absolută mai mare indică o relație mai puternică între variabile.

Dacă efectul indirect (a×ba \times b) este semnificativ, sugerează că motivația la locul de muncă mediază relația dintre satisfacția la locul de muncă și performanța la locul de muncă. În acest caz, o parte din efectul satisfacției la locul de muncă asupra performanței la locul de muncă poate fi explicată prin motivația la locul de muncă.

Pentru a efectua analiza de mediere în R: (1) Instalează și încarcă pachetul lavaan, (2) Importă setul tău de date, (3) Specifică modelul de mediere cu căile a, b și c, (4) Estimează modelul folosind funcția sem(), (5) Interpretează efectul indirect (a×b) și efectul total. Folosește summary(model, standardized = TRUE) pentru a vizualiza rezultatele.
Pachetul lavaan este cea mai populară alegere pentru analiza de mediere în R. Oferă capabilități cuprinzătoare de modelare a ecuațiilor structurale cu sintaxă ușor de utilizat. Pachete alternative includ mediation (pentru mediere cauzală) și psych (pentru mediere de bază). Pachetul lavaan oferă cea mai mare flexibilitate și instrumente de diagnostic.
Interpretează rezultatele medierii examinând: (1) Calea a (X→M) arată efectul asupra mediatorului, (2) Calea b (M→Y) arată efectul mediatorului asupra rezultatului, (3) Calea c (X→Y) este efectul direct, (4) Efectul indirect (a×b) testează semnificația medierii. Dacă efectul indirect este semnificativ și efectul direct devine nesemnificativ, ai mediere completă.
Pachetul lavaan (latent variable analysis) în R este folosit pentru modelarea ecuațiilor structurale (SEM), analiza factorială confirmatorie (CFA) și analiza de mediere/moderare. Oferă funcții precum sem() pentru estimarea modelului, cfa() pentru analiza factorială și oferă indici de ajustare cuprinzători și indici de modificare pentru evaluarea modelului.
Vizualizează medierea în R folosind pachetul semPlot: semPaths(model, whatLabels = 'est', style = 'lisrel'). Acest lucru creează diagrame de cale cu estimările coeficienților. Alternativ, folosește ggplot2 pentru a crea grafice cu bare ale coeficienților de cale sau folosește pachetul diagram pentru diagrame de mediere personalizate.
Efectul direct (calea c) este relația dintre X și Y care nu este explicată de mediator. Efectul indirect (a×b) este efectul lui X asupra lui Y prin mediatorul M. Efectul total = efectul direct + efectul indirect. Dacă efectul indirect este semnificativ, există mediere; dacă efectul direct devine nesemnificativ, este mediere completă.
Testează semnificația medierii folosind bootstrapping în lavaan: sem(model, data = data, se = 'bootstrap', bootstrap = 5000). Verifică dacă intervalul de încredere de 95% pentru efectul indirect (a×b) exclude zero. Dacă exclude, efectul indirect este semnificativ la p < .05, confirmând medierea.
Un model de mediere în R specifică cum o variabilă independentă (X) afectează o variabilă dependentă (Y) printr-un mediator (M). Include trei căi: a (X→M), b (M→Y) și c (X→Y). Modelul este definit folosind sintaxa lavaan cu efecte directe, efect indirect (:= a*b) și efect total (:= c + indirect).
Da, efectuează medierea multiplă în R specificând mai mulți mediatori în modelul tău lavaan. Definește căi separate de la X la fiecare mediator (M1, M2, etc.) și de la fiecare mediator la Y. Calculează efecte indirecte specifice (a1*b1, a2*b2) și efectul indirect total (suma tuturor efectelor indirecte specifice) folosind operatorul :=.
Analiza de mediere presupune: (1) Fără variabile confuzive care afectează X, M sau Y, (2) Ordonare temporală corectă (X→M→Y), (3) Relații liniare între variabile, (4) Fără eroare de măsurare în variabile, (5) Specificare corectă a modelului. Verifică presupunerile folosind analiza de corelație, grafice reziduale și teste de normalitate înainte de a efectua medierea.

Concluzie

În acest ghid cuprinzător, ai învățat cum să efectuezi analiza de mediere în R folosind pachetul lavaan cu un proces complet în 7 pași. De la instalarea pachetelor până la vizualizarea rezultatelor, acum înțelegi cum să efectuezi medierea în R, să interpretezi coeficienții de cale (a, b, c) și să testezi efectele indirecte.

Fluxul de lucru pentru analiza de mediere în R pe care l-am acoperit—de la importul datelor prin interpretarea analizei de mediere în R—îți oferă o fundație solidă pentru investigarea efectelor indirecte în cercetarea ta. Indiferent dacă construiești un model de mediere în R pentru teza ta sau explorezi mecanisme de mediere în date din lumea reală, pachetul lavaan oferă flexibilitatea și precizia de care ai nevoie.

Ai nevoie de ajutor cu analize înrudite? Verifică ghidurile noastre despre analiza de mediere în SPSS, instalarea R și RStudio sau învață despre moderatori vs mediatori pentru a-ți aprofunda înțelegerea tehnicilor statistice avansate.