7  Subgroep Analyse

7.1 Theorie

Hoewel er verschillende manieren zijn om de heterogeniteit van een meta-analyse te beoordelen, vertellen die ons niet waarom we een overmatige variabiliteit in onze gegevens vinden. Subgroepanalyse stelt ons in staat om hypotheses te testen over waarom sommige onderzoeken een hogere of lagere effectgrootte hebben dan andere. We moeten verschillende studiekenmerken definiëren die de waargenomen effectgrootte kunnen beïnvloeden en elke studie dienovereenkomstig coderen.

Er zijn talloze redenen waarom effectgroottes kunnen verschillen, maar we moeten ons beperken tot de redenen die van belang zijn in de context van onze analyse. Het idee achter subgroepanalyses is dat meta-analyse niet alleen gaat over het berekenen van een gemiddelde effectgrootte, maar dat het ook een hulpmiddel kan zijn om variatie in ons bewijs te onderzoeken. In subgroepanalyses zien we heterogeniteit niet alleen als hinderlijk, maar als interessante variatie die al dan niet verklaarbaar is door een wetenschappelijke hypothese. In het beste geval kan dit ons begrip van de wereld om ons heen vergroten, of op zijn minst praktische inzichten opleveren die richting geven aan toekomstige besluitvorming.

Voor subgroepanalyses gaan we meestal uit van een fixed-effects model. Studies binnen subgroepen worden in de meeste gevallen gepoold met behulp van het random-effects model. Vervolgens wordt een \(Q\)-toets op basis van de algemene subgroepresultaten gebruikt om te bepalen of de groepen significant verschillen. Het subgroepanalysemodel wordt een “fixed-effects” model genoemd omdat de verschillende categorieën zelf als vast worden verondersteld. Dit betekent dat alle subgroepen worden verondersteld een gemeenschappelijke schatting van de heterogeniteit tussen de studies te delen.Ze vertegenwoordigen de enige waarden die de subgroepvariabele kan aannemen. Enkele voorbeelden van subgroepanalyses zijn: leeftijdsgroep, culturele achtergrond,controle-/interventiegroep, instrument om de uitkomst te meten, studiekwaliteit, soort, setting.

Bij het berekenen van een subgroepanalyse moeten we beslissen of afzonderlijke of gemeenschappelijke schattingen van de heterogeniteit tussen studies moeten worden gebruikt om de resultaten binnen subgroepen te poolen. Subgroepanalyses zijn geen wondermiddel en het belangrijk rekening te houden met de beperkingen en valkuilen van subgroepanalyses. Ze missen vaak de statistische power die nodig is om subgroepverschillen te detecteren. Daarom betekent een niet-significante test voor subgroepverschillen niet automatisch dat de subgroepen gelijkwaardige resultaten opleveren.

7.2 Praktijk

Het uitvoeren van een subgroepanalyse met behulp van het {meta} pakket is relatief eenvoudig. In elke meta-analysefunctie in {meta} kan het argument subgroep worden gespecificeerd. Dit vertelt de functie welke effectgrootte in welke subgroep valt en voert een subgroepanalyse uit. Het argument subgroep accepteert diverse soorten variabelen. Het enige waar we op moeten letten is dat studies in dezelfde subgroep absoluut identieke labels hebben.

Laten we het databestand ThirdWave gebruiken om een subgroepanalyse uit te voeren en kjken naar de kolommen author en RiskofBias.

library(tidyverse) # voor databewerking
library(dmetar)    # voor de data
library(meta)      # voor de meta-analyse

data(ThirdWave)
head(ThirdWave[,c("Author", "RiskOfBias")])
           Author RiskOfBias
1     Call et al.       high
2 Cavanagh et al.        low
3   DanitzOrsillo       high
4  de Vibe et al.        low
5  Frazier et al.        low
6  Frogeli et al.        low

Laten we eerst m.gen aanmaken en vervolgens de subgroepanalyse uitvoeren.

m.gen <- metagen(TE = TE,
                 seTE = seTE,
                 studlab = Author,
                 data = ThirdWave,
                 sm = "SMD",
                 fixed = FALSE,
                 random = TRUE,
                 method.tau = "REML",
                 hakn = TRUE,
                 title = "Third Wave Psychotherapies")
update.meta(m.gen, 
            subgroup = RiskOfBias, 
            tau.common = FALSE)
Review:     Third Wave Psychotherapies

Number of studies: k = 18

                             SMD           95%-CI    t  p-value
Random effects model (HK) 0.5771 [0.3782; 0.7760] 6.12 < 0.0001

Quantifying heterogeneity:
 tau^2 = 0.0820 [0.0295; 0.3533]; tau = 0.2863 [0.1717; 0.5944]
 I^2 = 62.6% [37.9%; 77.5%]; H = 1.64 [1.27; 2.11]

Test of heterogeneity:
     Q d.f. p-value
 45.50   17  0.0002

Results for subgroups (random effects model (HK)):
                    k    SMD           95%-CI  tau^2    tau     Q   I^2
RiskOfBias = high   7 0.8126 [0.2835; 1.3417] 0.2423 0.4922 25.89 76.8%
RiskOfBias = low   11 0.4300 [0.2770; 0.5830] 0.0099 0.0997 13.42 25.5%

Test for subgroup differences (random effects model (HK)):
                  Q d.f. p-value
Between groups 2.84    1  0.0917

Details on meta-analytical method:
- Inverse variance method
- Restricted maximum-likelihood estimator for tau^2
- Q-Profile method for confidence interval of tau^2 and tau
- Hartung-Knapp adjustment for random effects model (df = 17)

In de uitvoer zien we een nieuw gedeelte genaamd Results for subgroups. Dit deel van de uitvoer toont de gepoolde effectgrootte afzonderlijk voor elke subgroep. We zien dat er k=7 studies zijn met een hoog risico op vertekening en 11 met een laag risico op vertekening. De geschatte heterogeniteit tussen studies verschilt aanzienlijk, met \(I^2\)=77% in studies met een hoog risico op vertekening, maar slechts 26% in studies met een laag risico. Met \(g\)=0,43 is de effectschatting in studies met een laag vertekeningsrisico kleiner dan in studies met een hoog vertekeningsrisico. Dit is een veel voorkomende bevinding, omdat vertekende studies de effecten van een behandeling eerder overschatten.

Maar is het verschil statistisch significant? We kunnen dit controleren door te kijken naar de resultaten van de Test for subgroup differences. Dit toont ons de \(Q\)-test, die in ons voorbeeld met 2 subgroepen gebaseerd is op één vrijheidsgraad. De \(p\)-waarde van de test is 0,09, wat groter is dan de conventionele significantiedrempel, maar nog steeds een verschil op trendniveau aangeeft.We kunnen de resultaten ook controleren als we uitgaan van een gemeenschappelijke \(\tau^2\)-schatting in beide subgroepen. We hoeven alleen tau.common op TRUE te zetten.

update.meta(m.gen, subgroup = RiskOfBias, tau.common = TRUE)
Review:     Third Wave Psychotherapies

Number of studies: k = 18

                             SMD           95%-CI    t  p-value
Random effects model (HK) 0.5771 [0.3782; 0.7760] 6.12 < 0.0001

Quantifying heterogeneity:
 tau^2 = 0.0820 [0.0295; 0.3533]; tau = 0.2863 [0.1717; 0.5944]
 I^2 = 62.6% [37.9%; 77.5%]; H = 1.64 [1.27; 2.11]

Quantifying residual heterogeneity:
 tau^2 = 0.0691 [0.0208; 0.3268]; tau = 0.2630 [0.1441; 0.5717]
 I^2 = 59.3% [30.6%; 76.1%]; H = 1.57 [1.20; 2.05]

Test of heterogeneity:
     Q d.f. p-value
 45.50   17  0.0002

Results for subgroups (random effects model (HK)):
                    k    SMD           95%-CI  tau^2    tau     Q   I^2
RiskOfBias = high   7 0.7691 [0.2533; 1.2848] 0.0691 0.2630 25.89 76.8%
RiskOfBias = low   11 0.4698 [0.3015; 0.6382] 0.0691 0.2630 13.42 25.5%

Test for subgroup differences (random effects model (HK)):
                   Q d.f. p-value
Between groups  1.79    1  0.1814
Within groups  39.31   16  0.0010

Details on meta-analytical method:
- Inverse variance method
- Restricted maximum-likelihood estimator for tau^2
  (assuming common tau^2 in subgroups)
- Q-Profile method for confidence interval of tau^2 and tau
- Hartung-Knapp adjustment for random effects model (df = 17)

We zien dat de geschatte heterogeniteitsvariantie tussen studies \(\tau^2\)= 0,069 is, en identiek in beide subgroepen. We hebben twee \(Q\)-tests: één tussen groepen (de eigenlijke subgroeptoets) en één voor de heterogeniteit binnen de subgroepen. Net als in een normale meta-analyse geeft dit laatste simpelweg aan dat er een overmatige variabiliteit is in de subgroepen (\(p\)= 0,001). De test van subgroepverschillen geeft opnieuw aan dat er geen significant verschil is tussen studies met een laag versus hoog risico op vertekening (p= 0,181).

De resultaten van subgroepanalyses worden meestal gerapporteerd in een tabel met het geschatte effect en de heterogeniteit in elke subgroep, evenals de p-waarde van de test voor subgroepverschillen.

library(kableExtra)
m.gen.sg = update.meta(m.gen, 
            subgroup = RiskOfBias, 
            tau.common = FALSE)

dat = data.frame(g = round(m.gen.sg$TE.random.w, 2),
                 g.ci = paste0(round(m.gen.sg$lower.random.w,2),"-", 
                               format(round(m.gen.sg$upper.random.w,2), nsmall = 2)),
                 p = c("0.009", format.pval(m.gen.sg$pval.random.w[2], eps = 0.001)),
                 i2 = round(m.gen.sg$I2.w, 2),
                 ci.i2 = paste0(format(round(m.gen.sg$lower.I2.w, 2), nsmall=2), "-", round(m.gen.sg$upper.I2.w, 2)),
                 p.sg = c(" ", " "))
dat$p = stringr::str_replace_all(dat$p, "\\<", "$<$")

dat = rbind(c("", "", "", "", "", 0.092), dat)

rownames(dat) = c("Risk of Bias", "- High", "- Low")
colnames(dat) = c("$g$", "95\\%CI", "$p$", "$I^2$", "95\\%CI", "$p$<sub>subgroup</sub>")

kable(dat, booktabs = T, digits = 2, escape = FALSE) %>% 
  kable_styling(latex_options = c("scale_down"),
                bootstrap_options = c("condensed", "striped"))
$g$ 95\%CI $p$ $I^2$ 95\%CI $p$subgroup
Risk of Bias 0.092
- High 0.81 0.28-1.34 0.009 0.77 0.51-0.89
- Low 0.43 0.28-0.58 $<$ 0.001 0.25 0.00-0.63