3  Effect Sizes

3.1 Theorie

Effect size wordt hier gedefinieerd als een metriek die de relatie tussen twee entiteiten kwantificeert. Het geeft de richting en sterkte van deze relatie weer. Als relaties worden uitgedrukt in een vergelijkbare effect size, is het mogelijk om ze te vergelijken. Effect sizes zijn de bouwstenen van meta-analyses.Om een meta-analyse uit te voeren, is op zijn minst een schatting nodig van de effect size en de standaard-fout ervan. Deze moeten vergelijkbaar, berekenbaar, betrouwbaar en interpreteerbaar zijn. De standaard-fout van een effect size geeft aan hoe nauwkeurig de schatting van het effect van de studie is. Meta-analyse geeft effect-sizes met een grotere precisie een hoger gewicht omdat ze betere schatters zijn van het ware effect.

Er zijn verschillende effectmaten die we kunnen gebruiken in meta-analyses. Gebruikelijke zijn “één-variabele” relatiematen, zoals:
- gemiddelden (som van alle individuele waarden, gedeeld door de som van de steekproefgrootte);
- proporties (aantal individuen dat in een specifieke subgroep valt, gedeeld door het totale aantal individuen);
- correlaties (drukt de mate van co-variatie tussen twee variabelen uit, bijvoorbeeld de Pearson Product-Moment Correlatie en Point-Biserial Correlatie);
- risicoverhouding (relatief risico) als de verhouding tussen twee risico’s;
- odds ratio, als het aantal gevallen dat in een bepaalde subgroep valt, gedeeld door het aantal gevallen dat niet in die subgroep valt;
- incidentieratio’s (ook wel rate ratio genoemd), houdt rekening met de persoon/tijd-aspecten van twee groepen.

Effectgroottes kunnen ook vertekend zijn, bijvoorbeeld door meetfouten en bereikbeperking. Er bestaan formules om te corrigeren voor sommige vertekeningen, waaronder de kleine steekproefvertekening van gestandaardiseerde gemiddelde verschillen, verzwakking door onbetrouwbaarheid en problemen met bereikbeperking. Andere veel voorkomende problemen zijn dat studies de gegevens die nodig zijn om effectgroottes te berekenen in verschillende formaten rapporteren, evenals het probleem van de analyse-eenheid, dat optreedt wanneer studies meer dan één effect size bijdragen.

3.2 Praktijk

Laten we eerst kijken naar de gestandaardiseerde size van het verschil tussen groepen (SMD). Deze wordt gebruikt als de uitkomst continu is en de voorspeller categorisch. Het is het verschil in gemiddelden tussen twee onafhankelijke groepen gedeeld door de gepoolde standaardafwijking. Het wordt ook Cohen’s \(d\) genoemd.

\[SMD_{between} = \frac{\bar{X}_1 - \bar{X}_2}{s_p}\]

waarbij \(\bar{X}_1\) en \(\bar{X}_2\) de gemiddelden van de twee groepen zijn en \(s_p\) de gepoolde standaardafwijking. SMD’s worden vaak geïnterpreteerd als kleine (0,2), middelgrote (0,5) en grote (0,8) effecten. Er zijn verschillende functies in R waarmee we SMDbetween/Cohen’s d in één stap kunnen berekenen. Hier gebruiken we de functie esc_mean_sd, die deel uitmaakt van het esc-pakket. We hebben dit pakket nog niet eerder gebruikt, dus het is noodzakelijk om het eerst te installeren.

# install.packages("esc")
library(esc)

# Defineeer data die nodig zijn om SMD/d te berekenen
# Dit is een eenvoudig voorbeeld om een dataset te maken
grp1m <- 50   # gemiddelde van groep 1
grp2m <- 60   # gemiddelde van groep 2
grp1sd <- 10  # sd van groep 1
grp2sd <- 10  # sd van groep 2
grp1n <- 100  # n van groep 1 
grp2n <- 100  # n van groep 2

# CalculEER effect size
esc_mean_sd(grp1m = grp1m, grp2m = grp2m, 
            grp1sd = grp1sd, grp2sd = grp2sd, 
            grp1n = grp1n, grp2n = grp2n)

Effect Size Calculation for Meta Analysis

     Conversion: mean and sd to effect size d
    Effect Size:  -1.0000
 Standard Error:   0.1500
       Variance:   0.0225
       Lower CI:  -1.2940
       Upper CI:  -0.7060
         Weight:  44.4444

Om een meta-analyse van gestandaardiseerde gemiddelde verschillen uit te voeren, moet onze dataset ten minste de volgende kolommen bevatten:

  • n.e. Het aantal observaties in de interventie/experimentele groep.
  • mean.e. Het gemiddelde van de interventie/experimentele groep.
  • sd.e. De standaardafwijking in de interventie/experimentele groep.
  • n.c. Het aantal observaties in de controlegroep.
  • mean.c. Het gemiddelde van de controlegroep.
  • sd.c. De standaardafwijking in de controlegroep.

Voor binaire uitkomsten kunnen kansverhoudingen worden gebruikt. De functie esc_2x2 in het pakket esc biedt een eenvoudige manier om de (log)odds ratio in R te berekenen.

library(esc)

# Defineeer data die nodig zijn om de odds ratio te berekenen
grp1yes <- 45  # gebeurtenissen in de behandelingsgroep
grp1no <- 98   # niet-gebeurtenissen in de behandelingsgroep
grp2yes <- 67  # gebeurtenissen in de controlegroep
grp2no <- 76   # niet-gebeurtenissen in de controlegroep

# Calculeer OR door es.type op "or" te zetten
esc_2x2(grp1yes = grp1yes, grp1no = grp1no,
        grp2yes = grp2yes, grp2no = grp2no,
        es.type = "or")

Effect Size Calculation for Meta Analysis

     Conversion: 2x2 table (OR) coefficient to effect size odds ratio
    Effect Size:   0.5209
 Standard Error:   0.2460
       Variance:   0.0605
       Lower CI:   0.3216
       Upper CI:   0.8435
         Weight:  16.5263

Om een meta-analyse van odds ratio’s uit te voeren in R, moeten de volgende kolommen worden opgenomen in onze dataset:

  • event.e. Het aantal geberutenissen in de experimentele groep.
  • n.e. De sample size van de experimentele groep.
  • event.c. Het aantal gebeurtenissen in de controle groep.
  • n.c. De sample size van de controle groep.

Voor een voorbeeld voor correctie kijken we naar kleine steekproefcorrectie. We kunnen niet-gestandaardiseerde SMD’s/Cohen’s d eenvoudig omzetten naar Hedges’ g met behulp van de hedges_g functie in het esc pakket.

# Laad esc pakket
library(esc)

# Defineer niet aangepast SMD en sample size n
SMD <- 0.5
n <- 30

# Zet om naar Hedges g
g <- hedges_g(SMD, n)
g
[1] 0.4864865