Études de cas / contrôle avec suivi: Construire la population source pour estimer les effets des facteurs de risque sur le développement, la maladie et la survie

Si les individus faisant l’objet d’une étude de cas / contrôle sont ensuite observés sous la forme d’une cohorte de cas et d’une cohorte de témoins, des analyses de régression pondérée peuvent être utilisées pour estimer l’association entre les expositions initialement enregistrées et les événements survenant au cours des cohortes. Pour simuler cette population, la cohorte des cas est ajoutée à la cohorte des contrôles élargie à l’inverse de l’incidence de la maladie. Le poids d’échantillonnage doit inclure tous les individus. Nous utilisons un ensemble de données simulées pour illustrer comment la régression linéaire généralisée pondérée peut être utilisée pour estimer l’association entre une exposition capturée pendant la composante étude de cas / contrôle et un résultat qui survient au cours de la période de suivi. en haut

En incluant une plus grande fraction d’individus dans une population source qui développent une maladie que ceux qui n’en développent pas, les études de cas / contrôle CC sont plus efficaces que les études de cohorte correspondantes pour obtenir des mesures d’association entre exposition et risque de maladie. incidence des maladies, cette fraction d’échantillonnage diminue et l’efficacité relative des études CC augmente. Dans les études CC imbriquées dans une cohorte définie, la fraction d’échantillonnage peut être calculée directement en nombre de témoins, c’est-à-dire les individus exempts de maladies. enregistré, divisé par le nombre total d’individus qui n’ont pas développé la maladie au cours de l’étude de cohorte Même les études CC qui ne sont pas entreprises dans une cohorte définie peuvent être conceptualisées comme étant imbriquées dans une population source ou la cohorte «hypothétique» sous-jacente est insaisissable parce qu’elle n’est ni saisie dans une liste ni suivie pour enregistrer les résultats. aux données de réutilisation pour mesurer les associations entre les expositions et un résultat autre que celui défini par un cas, l’occurrence de la maladie peut être utilisée pour calculer les poids pour les analyses de régression appropriées Une fois le risque de maladie estimé, suivi subséquent CoCo permet de mesurer l’association entre les expositions enregistrées au recrutement dans l’étude et un résultat au cours du suivi, tel que la croissance, la maladie ou le décès. Pourvu qu’il existe une association entre une exposition et un cas, et les cas présentent un risque plus élevé de résultats mesurés pendant le suivi que les témoins, les études CC avec CCF de suivi sont plus efficaces pour identifier une association entre l’exposition et de tels résultats que l’étude de cohorte correspondante, parce que l’exposition est condensée dans le CoCaWe créé une population imaginaire avec une exposition connue, l’occurrence de la maladie de cas, et la distribution des résultats afin de pré a envoyé un cadre conceptuel d’analyse de données CCF en utilisant ce que nous appelons la méthode de population reconstruite RPM Nous montrons ensuite comment ce cadre peut être traduit en analyse de régression pondérée

DECOMPOSER LA POPULATION ET PUIS RECONSTRUIRE LA COHORTE SOUS-JACENTE DES CAS ET DES COMMANDES

Imaginons une population avec N individus où nous recrutons le contrôle par cas dans une étude de CC et suivons le CoCa et le CoCo. L’exposition E et le résultat O sont distribués comme montré dans la Figure

Figure

Voir grand

Télécharger le diaporama

Diagramme de Venn montrant la distribution des cas et des témoins en relation avec une exposition et un résultat dans une population d’individus Les nombres ont été générés à l’aide des fonctions trouvées dans l’Annexe Supplémentaire Abréviations: CoCa, cohorte de cas; CoCo, cohorte de contrôles

Figure

Voir grand

Télécharger le diaporama

Diagramme de Venn montrant la distribution des cas et des témoins en relation avec une exposition et un résultat dans une population d’individus Les nombres ont été générés à l’aide des fonctions trouvées dans l’Annexe Supplémentaire Abréviations: CoCa, cohorte de cas; CoCo, cohorte de contrôles

Nos cas incidents sont recrutés dans cette étude du CCF dans un laps de temps court après le début d’un événement définissant la casse D; ceux qui ne développent pas D dans cette fenêtre temporelle ne sont pas NC NC La population a été générée à l’aide des fonctions données dans l’annexe supplémentaire qui décrivent comment E influence D, et comment E et D, séparément et en combinaison, influencent O Figure

Figure Vue largeTélécharger diapositive Présentation schématique des associations entre une exposition E, un cas de maladie D et un résultat O dans une population, où les flèches indiquent la direction de la causalitéFigure Vue largeTélécharger diapo Présentation schématique des associations entre une exposition E, un cas de maladie D et un résultat O dans une population, où les flèches indiquent le sens de la causalité Parce que notre étude recrute un nombre égal de cas et contrôle, n, le nombre de NC dans la population est Nn Parce que n de tous NC sont recrutés dans le CoCo, la fraction d’échantillonnage est calculé comme n / Nn, et le poids d’échantillonnage comme Nn / n Dans notre exemple où n = et N =, la fraction d’échantillonnage est / – =, le poids d’échantillonnage correspondant – / = Le risque relatif RR de l’expérience O donné E pour toute la population, dans le CoCa, parmi les NC, et dans le CoCo est montré dans le tableau, rangées A-D La légère différence dans RR entre NC Table, rangée C et la Table CoCo, rangée D est un artefact de l’arrondissement

re E et Résultat O ou Maladie définissant l’état du cas D comme base du cadre conceptuel de la méthode de reconstitution de la population O – Risque total RR% IC A Population de la population E – B CoCa E – C NC E – D CoCo E – D – Chances OU E CC étude E – O – F CoCa E – – G CoCo E – – H CoCa CoCo E – – O – risque total RR% CI A Source Population E – B CoCa E – C NC E – D CoCo E – D – Cotes OU E CC étude E – O – F CoCa E – – G CoCo E – – H CoCa CoCo E – – Abréviations: CC, cas / contrôle; CI, intervalle de confiance; CoCa, cohorte de cas; CoCo, cohorte de contrôles; D, maladie définissant le cas; NC, non-casses; OU, odds ratio; RR, rapport de risque relatif LargeLe rapport de cotes OR décrivant l’association entre E et obtenir D, devenant un cas peut être calculé à partir du tableau, ligne E dérivée du tableau, lignes B et D, qui distribue E parmi les cas D et les contrôles D- Nous passons maintenant au monde réel de l’épidémiologie où seule l’étude CCF représentée par le tableau CoCa, rangée B et le tableau CoCo, rangée D est connue. Elle est seulement nichée conceptuellement dans la population source Figure En analysant l’étude du CCF avec le RPM, les distributions exposition-résultat dans le CoCa et le CoCo devraient être identiques, mais comme ils représentent des échantillons de notre population, les associations estimées devraient être fournies avec des intervalles de confiance CIs Tableau, rangées F et GAs une estimation de l’association entre E et O la population source, il peut sembler tentant d’ignorer le schéma d’échantillonnage CC et de simplement calculer RR sur les données combinées des individus dans CoCa et CoCo Table, rangée H Cela correspond à ce que Jiang et al énumère la première approche ad hoc de l’analyse secondaire des données CC Cependant, cette approche suppose que D est conditionnellement indépendant de O donné E, c’est-à-dire quand aucun effet de E sur O n’est médiatisé par D d’autre part, change le risque de O, cette approche donne une estimation non biaisée de l’association entre E et O seulement quand le rapport des cas à NC dans la population source est:, ie, quand le risque D est% Dans de nombreuses situations , y compris dans le GEMS Global Enteric Multicenter Study , non seulement E peut augmenter le risque d’incidence de D, ce risque est généralement beaucoup plus faible que%, et une telle approche surestimerait donc la force de l’association entre E et O Table Une autre approche, suggérée par Nagelkerke et al., consiste à ne fonder les estimations que sur le tableau des individus CoCo, rangée G Jiang et al soutiennent que ceci, dans ce qu’ils appellent la deuxième approche ad hoc, peut être approximativement valide quand D est rare , mais souligne, tout comme Reilly et al , qu’elle est inefficace parce qu’elle élimine les données de cas S’il existe une interaction entre E et D sur O, c’est-à-dire lorsque l’association entre E et O diffère entre individus CoCa et CoCo, le biais peut être important et Une troisième approche consiste à calculer les RR pour le CoCa et le CoCo, et s’il n’y a pas d’interaction entre E et D sur O, indiquer la moyenne des RR à l’aide de l’analyse stratifiée de Mantel-Haenszel. approche ad hoc où l’analyse combinée des individus CoCa et CoCo est ajustée pour D Cette approche, qui donne une estimation RR du% IC, – dans notre exemple, non seulement ne tient pas compte du fait que les cas sont suréchantillonnés voir tableau, rangée H et la première approche ad hoc mais aussi supprime de fait l’effet de E sur O qui opère, c’est-à-dire est médiée par, DTo utiliser les données CCF pour estimer l’association entre E et O dans une population donnée, nous devons effectuer l’analyse sur la population reconst La fraction d’échantillonnage nécessaire pour estimer NC ne peut pas être calculée directement, mais doit être dérivée d’une source indépendante du risque d’incidence D Ainsi, si R est le risque d’incidence de D dans la fenêtre temporelle au cours de laquelle les cas sont recrutés , et parce que nous supposons un nombre égal de cas et de contrôles, la fraction d’échantillonnage des contrôles est proportionnelle aux probabilités d’incidence correspondantes, c.-à-d. R / R Si nous attribuons un poids aux cas, le poids d’échantillonnage des témoins est réciproque. , – R / R Dans notre exemple, supposons que le risque d’incidence D, dérivé d’une enquête parfaitement représentative dans la population, est de reconstruire le NC de la population, nous multiplions le nombre d’individus dans le CoCo par l’inverse de son incidence correspondante les cotes, le poids d’échantillonnage, c.-à-d., pour obtenir le nombre reconstruit de non-cancéreuses exposées et non exposées. Tableau de NCN, rangée A On peut alors estimer l’association entre E et O dans notre population reconstruite co nsisting du CoCa plus le tableau de rNC, rangée B

Tableau Reconstitution de la population O – Risque total RR A NCN E × = × = – × = × = B Population reconstruitea E = = – = O – Risque total RR A NCN E × = × = – × = × = B Population reconstituéea E = = – = = Deux-par-deux tableaux montrant les distributions de l’exposition, des résultats et de la maladie qui définissent le statut des cas dans les non-cas reconstruits et dans la population-source reconstituéeAbbreviations: D, maladie définissant la casse; E, l’exposition; O, résultat; PNC, non-cas reconstruits; RR, risque relatif Une cohorte de cas rNCView Large La différence de nombre de cellules entre le tableau imaginé, la rangée A et cette population reconstruite est un artefact de l’arrondi que nous avons entrepris pour générer la table CoCo, rangée D Nous n’incluons pas de CI pour ce RR estimation car l’erreur d’échantillonnage doit être dérivée du CoCa et du CoCo et non de la population reconstruitePour expliquer la différence entre le RR dans le CoCa combiné et le CoCo Table, ligne H et celle dans le Tableau de la population reconstruite, rangée B, et pour fournir une transition vers l’analyse de régression de ces données, la figure illustre comment la pondération des données influence l’effet estimé de E sur O

Figure Vue largeTélécharger les lamesRégressions reflétant le risque relatif pour un résultat pendant le suivi de A la cohorte des cas CoCa la cohorte des contrôles CoCo et B la population reconstruite CoCa non cancéreuses qui ont été reconstruites à partir du CoCo × poids d’échantillonnage [rNC] Les données sous-jacente chaque ligne correspond aux tables × dans Table et Table, de sorte que TB est le × dans la ligne B de Table, et TA est la table × dans la ligne A du tableau Notez que le changement de poids, ou individus, entre A et B modifie les positions du point final, et donc la pente de la ligne médiane A dépeint l’approche malavisée pour analyser les données CoCo et CoCa combinées Tableau, rangée H La surface de chaque cercle est proportionnelle au nombre d’expositions Exposé = et non exposé Exposition = les individus du CoCa et du CoCo B représentent la méthode de la population reconstruite. Tableau, rangée B La superficie de chaque cercle est proportionnelle au nombre d’individus exposés et non exposés dans la population. le CoCa et les abréviations RNC: CoCa, cohorte de cas; CoCo, cohorte de contrôles; les NCN, non cancéreuses qui ont été reconstituées à partir du poids d’échantillonnage CoCo ×; RR, risque relatifFigure Vue largeTélécharger diapositives Lignes de régression reflétant le risque relatif d’un résultat pendant le suivi de A cohorte de cas CoCa la cohorte de témoins CoCo et B la population reconstruite CoCa non cancéreuses qui ont été reconstruites à partir du CoCo × poids d’échantillonnage [rNC ] Les données sous-jacentes à chaque ligne correspondent aux tables × dans Table et Table, de sorte que TB est le × dans la ligne B de Table, et TA est la table × dans la ligne A du tableau Notez que la variation des poids, ou individus, A et B modifient les positions du point final, et donc la pente de la ligne médiane A dépeint l’approche mal avisée pour analyser les données combinées CoCo et CoCa. Tableau H La surface de chaque cercle est proportionnelle au nombre d’expositions exposées. = Et exposition non exposée = les individus du CoCa et du CoCo B représentent la méthode de population reconstruite. Tableau, rangée B La superficie de chaque cercle est proportionnelle au nombre de personnes exposées et non exposées. les individus éduqués dans le CoCa et le RNC Abréviations: CoCa, cohorte de cas; CoCo, cohorte de contrôles; les NCN, non cancéreuses qui ont été reconstituées à partir du poids d’échantillonnage CoCo ×; RR, risque relatif

ANALYSE DE DONNÉES CCF AU MOYEN D’UNE ANALYSE DE RÉGRESSION PONDÉRÉE

CoCa, c’est-à-dire, pour chaque cas, le poids pour les contrôles est alors – R / R, comme décrit ci-dessus S’il y a n cas et m contrôles, les poids sont pour les cas et n / m – R / R pour les contrôles Spécifier des poids d’échantillonnage appelés pweight dans Stata, et ensuite donner le nom de variable Pw dans le modèle de régression reconstruit de facto la population source en basant l’estimation de l’erreur type correspondante de l’association entre E et O sur les observations réelles du tableau, lignes B et D, plutôt que sur la population reconstruite dans le tableau, rangée B, cette dernière étant une approche qui sous-estimerait l’erreur-type et surestimerait ainsi la précision du RRTo pour estimer le RR du résultat O étant donné l’exposition E au GLM du La famille binomiale avec un lien de journal et avec un poids d’échantillonnage = Pw requiert la commande suivante dans Stata: eform ordonne à Stata de produire RR au lieu de lnRR, ce qui est la valeur par défaut Dans notre exemple, le RR est avec un IC. correspond à l’estimation ponctuelle RR dérivée de la population reconstruite Tableau, ligne B Ne tenant pas compte du fait que les cas sont suréchantillonnés, en omettant les poids d’échantillonnage, comme illustré graphiquement sur la figure A, donne un RR identique à celui dérivé de l’exposition distribution des résultats dans la combinaison du CoCa et du CoCo Table, rangée H, c’est-à-dire une surestimation substantielle Les analyses de la régression présentent plusieurs autres avantages, notamment la facilité d’ajustement des estimations des associations entre E et O pour les facteurs confondants catégoriels et continus. terme, ils nous permettent d’identifier et d’estimer efficacement la taille et la précision statistique de toute modification de mesure d’effet entre E et D sur O Une interaction signifie que RRCoCa et RRCoCo sont différents; Le fait d’obtenir D change le risque d’obtenir O donné E Le simple ajustement de D dans de telles circonstances violerait non seulement les hypothèses du modèle de régression, mais également éliminerait tout effet différentiel de E sur O entre ceux obtenant D et le NCWen estimant l’effet de E sur O dans la cohorte sous-jacente, il faut s’abstenir d’ajuster pour D, de sorte que le RR résultant incorpore tout effet de E sur O médiée par D ainsi que toute interaction entre E et D sur O Il y a cependant des situations où ajustement pour D est justifiée Par exemple, pour conseiller une action de santé publique, il peut être important de décomposer l’effet de E sur O par la mesure dans laquelle il est médiatisé par D. La taille de cette médiation peut être mesurée comme la variation relative de la RR associé à E lorsqu’il est estimé à partir de modèles incluant et excluant respectivement D comme covariable La variation de RR de O donnée E observée en incluant D comme covariable, c’est-à-dire correspondant à la troisième approche ad hoc de Jiang et al b ut maintenant avec un équilibre approprié entre les cas et NC, décrirait la variation relative du risque O donnée E au-dessus et au-delà de celle médiée par D Dans notre exemple, ce RR ajusté est% CI, – La médiation est en conséquence / = Si les modèles étaient fonctionnant sur des ensembles de données indépendants, les valeurs RR estimées pour E pourraient être comparées en utilisant leurs erreurs-types asymptotiques et leur indépendance Dans le cas présent, cependant, les modèles sont exécutés sur les mêmes données et les estimations du log RR dépendent donc de la dépendance. Dans Stata, la commande de post-estimation stocke les valeurs de score individuelles à partir de l’estimation de pseudo-vraisemblance maximale pondérée. Les valeurs de score sont ensuite utilisées pour calculer une erreur-type robuste pour la différence des valeurs RR logarithmiques dans les modèles. La syntaxe d’une régression log-binomiale est la suivante: La commande suest requiert que les poids d’échantillonnage soient utilisés comme poids d’importance plutôt que comme « poids d’importance ». poids « pweightThis donne le même point d’estimation de la médiation et nous fournit son% CI, qui s’étend à Summarizing, on pourrait dire que du RR = qui décrit l’effet de E sur O, D contribue avec%% CI,% – Alternativement, une approche bootstrap peut être suivie Pour chaque échantillon bootstrap à partir des données observées, les deux modèles sont ajustés et la différence entre les valeurs RR logarithmiques est calculée. Les erreurs standard bootstrap habituelles et les IC peuvent ensuite être calculés pour la différence. peut être converti en un CI pour le rapport des RR Si un GLM avec un lien log pour la famille binomiale ne converge pas, comme cela peut être le cas quand O est commun, ou pour d’autres raisons, nous souhaitons décrire l’association entre E et O avec un OU utilisant la régression logistique, on peut remplacer le lien log avec un lien logit GLM de la famille binomiale avec un lien d’identité estime la différence de risque absolue plutôt que le RR Utiliser ce lien permet de modéliser des interactions sur un additif e échelle, qui peut être plus pertinente que de le faire à une échelle multiplicative dans des études telles que GEMS, qui traite des expositions contre lesquelles des interventions de santé publique, telles que la vaccination, peuvent être justifiées [,,]

Nous avons jusqu’ici considéré les variables binaires E et O, mais le RPM est également valable pour des résultats continus. Ainsi, nous pouvons modéliser des variables continues distribuées symétriquement, comme les scores de développement infantile et croissance en utilisant un lien d’identité combiné à une distribution gaussienne : Qui est équivalent à la commande de régression linéaire plus simple:

L’estimation de l’effet décrit la variation de O associée à E

L’approche RPM peut également être utilisée pour modéliser les effets de E sur un comptage, comme celui capturé dans un taux d’incidence ou une densité d’incidence, en utilisant l’analyse de régression de Poisson ou, en cas de surdispersion, en utilisant une distribution binomiale négative:

L’estimation de l’effet décrit le taux d’incidence pour O où l’exposition est EFinally, passant de GLM à l’analyse de temps à événement, le modèle de risques proportionnels de Cox est bien adapté à l’analyse pondérée L’analyse de temps à événement exige des variables de résultat, T le temps écoulé entre le recrutement dans le CCF et la censure ou la survenue de O, qui a ici la valeur lorsque l’événement survient, par exemple, la mort, ou si l’individu est censuré à Stata, les poids d’échantillonnage sont inclus lorsque les données sont déclarées données de temps à événement: Les rapports de hasard pour l’événement où E est l’exposition est retourné par As dans les études de CC, ayant servi de contrôle dans une étude du CCF n’empêche pas un individu de servir plus tard ou de recruter en tant que contrôle pour une autre affaire De même, le fait d’avoir été inscrit en tant que cause ne devrait pas empêcher un individu d’être inclus comme cas, ni d’être ultérieurement inclus comme contrôle. La présentation suppose que nous avons accès à un Le poids est calculé à partir du risque d’incidence, que nous ne pouvons pas obtenir à partir de l’étude CCF. Dans GEMS, le risque de D est estimé à l’aide des enquêtes d’utilisation et d’attitude des soins HUAS, effectuées tous les mois tout au long de l’étude. les estimations comportent des erreurs d’échantillonnage qui doivent être prises en compte pour estimer l’effet de E sur O dans la cohorte sous-jacente. Dans l’annexe supplémentaire, nous fournissons une feuille Excel « Données » dans le classeur « RPMParametersAndTablesAugxlsx » qui génère des probabilités conjointes. et × des tableaux décrivant une population source imaginaire basée sur les paramètres choisis expliqués dans la feuille « Codes » Nous l’avons utilisée pour générer les tableaux × présentés dans le manuscrit actuel Cette population ie la cohorte sous-jacente présente une exposition E, un cas D et un résultat dichotomique O, ce dernier enregistré lors du suivi « Données » permet à l’utilisateur de changer les probabilités et les ns Dans la cellule C, il produit une commande R surlignée en jaune qui, en utilisant notre fonction R « rpmBootstrapR », également fournie dans l’annexe supplémentaire, estime les mesures composites d’association, ie le RR décrivant l’effet de E sur O dans le population reconstruite « RR non ajusté », l’effet de E sur O au-dessus et au-delà de celui médié par D « RR ajusté » et la proportion du RR non ajusté qui est médiée par D « Médiation RR » Ces estimations incorporent non seulement l’erreur d’échantillonnage de l’étude CCF mais aussi celle de l’estimation du risque d’incidence D obtenue à partir d’une enquête indépendante Ce poids d’échantillonnage est calculé sur la base du nombre de personnes ayant développé D HuasD et du nombre de personnes non HuasNoD L’analyse pourrait être modifiée façons Par exemple, l’effet de E sur O pourrait être modélisé en termes d’un OR dans la régression logistique; comme un résultat dichotomique sur une échelle additive, en utilisant un lien d’identité pour mesurer la différence de risque RD; comme numérateur de la densité ou du taux d’incidence dans la régression binomiale de Poisson ou négative; comme variable continue dans la régression linéaire; ou comme un hazard ratio dans la régression de Cox « rpmBootstrapR » génère également un test Stata testdta et un ensemble de données testcsv valeurs séparées par des virgules, qui contiennent des données de l’étude CCF imaginaire et qui peuvent être utilisées dans une régression GLM pondérée de la famille binomiale pour estimer RR, OR et RD décrivant l’effet de E sur un O dichotomique. Cette approche, décrite en détail dans le présent document, n’incorpore toutefois pas l’erreur d’échantillonnage de l’estimation du poids d’échantillonnage et ne doit donc être utilisée que lorsque la valeur est connue, comme lors de l’analyse des données d’une étude CCF imbriquée dans une cohorte définie, ou lorsque les enquêtes utilisées pour estimer le risque d’incidence D sont d’une taille telle que les poids d’échantillonnage dérivés peuvent être considérés comme des valeurs connues

EFFETS DE CHANGEMENT DES PARAMETRES DE POPULATION

Pour illustrer comment un changement dans les paramètres qui définissent les associations critiques dans la population sous-jacente influence l’effet observé et guider le lecteur sur l’utilisation du matériel dans l’annexe supplémentaire, considérons les changements qui se produisent si nous changeons l’association entre E et Ceci permet de modifier le RR dans la cellule D de la feuille de calcul « Données » dans le classeur « RPMParametersAndTablesAugxlsx ». Le lecteur trouvera dans la cellule Q que l’association décrite par le RR dans la population reconstruite entre E et De plus, puisque dans cet exemple nous maintenons la prévalence de l’exposition dans la population inchangée, l’incidence de D est réduite en conséquence, dans cet exemple de à Une telle incidence peut être obtenue dans une enquête auprès des individus qui identifie de nouveaux cas de DBy exécutant la commande retournée dans la cellule C en utilisant la fonction « rpmBootstrapR » dans R, puis la commande « glm OE [ppo = Pw], familybinomial linklog eform « sur l’ensemble de données généré » testdta « , Stata retournera non seulement le RR de mais aussi son% CI de – Cela suppose que le risque d’incidence de est un nombre fixe, une hypothèse qui est discutable à moins que le l’enquête a une taille d’échantillon très large Englobant l’erreur d’échantillonnage du poids d’échantillonnage, notre run bootstrap R a donné un RR de% CI, – Ajustant pour D réduit le RR en% CI, – et a quantifié la médiation en% CI, -, c’est-à-dire, D contribuant avec%% CI,% -% de l’effet de E sur OIf, d’autre part nous changeons l’association entre E et D de sorte que le RR change de, l’incidence augmente à, ce qui peut être obtenu par un aperçu des individus dont développer D Dans ce scénario, la cellule Q dans la feuille « Données » renvoie un RR de; Stata donne aussi son% CI de – Prise en compte de l’erreur d’échantillonnage de l’estimation d’incidence dérivée de l’enquête en utilisant rpmBootstrap, R a donné un RR de% CI, -, qui a été réduit en% CI, – après ajustement pour D; la médiation était% CI, -, donc d’après cette analyse, D a contribué avec%% CI,% -% de l’effet de E sur OT. Les données supplémentaires peuvent également être utilisées pour illustrer l’argument de Jiang et al. de O, la première approche ad hoc n’est valable que si le risque d’incidence est de% ou un risque d’incidence de% peut être atteint en changeant par exemple l’incidence de la population de D pour les individus non exposés à E, pD, que dans ce scénario irréaliste, la première cellule Q d’approche ad hoc de Jiang donne une estimation identique à celle obtenue avec la cellule RPM Q

DISCUSSION

Comme l’incidence des maladies infectieuses, telles que la diarrhée, varie au fil du temps et souvent entre des lieux relativement proches, ce risque est estimé à l’aide des cycles HUAS effectués périodiquement au cours de l’étude et non pas en un instant Les poids d’échantillonnage basés sur HUAS sont donc susceptibles d’approcher une représentation « en temps réel » des expositions, des cas cliniques et des résultats, augmentant ainsi la validité des analyses de régression pondérées. Si les estimations des risques d’incidence des enquêtes séquentielles diffèrent considérablement et que la mise en commun dans le temps est discutable, nous conseillons d’estimer d’abord les estimations composites, qui décrivent l’effet de la durée de l’étude. de E sur O pour chaque cycle d’enquête Ceci peut être particulièrement pertinent pour les études décrivant la contribution des agents microbiens à Lorsque cela est pertinent et approprié, on peut ensuite mettre en commun les tailles d’effets composites, assurant ainsi la transparence et la clarté épidémiologique. Ce document traite des études CCF à une seule population. Qui plus est, dans une analyse groupée des strates de population, les poids devraient être basés sur la taille relative des strates et l’incidence de D dans chaque zone. stratum Dans la plupart des études du CCF, relativement peu d’enfants seront enrôlés plus d’une fois. Même dans une étude de cohorte en Guinée-Bissau, les enfants ont été suivis chaque semaine avec des échantillons de selles pour identifier les infections entéropathogènes de la naissance jusqu’à l’âge. correction pour tenir compte des différences entre les enfants n’a pas sensiblement altéré Estimation ponctuelle ou précision Nous suggérons que si cette correction ne produit pas ou peu d’effet sur les estimations ponctuelles et leur précision, elle ne doit pas être incorporée dans les approches bootstrap qui capturent l’erreur d’échantillonnage des estimations du poids d’échantillonnage. de cet article pour décrire plus en détail comment prendre en compte les différences entre individus dans la survenance des expositions et / ou des résultats Dans cet article, nous décrivons comment une étude CCF peut être analysée en utilisant une analyse de régression pondérée. approche bootstrap, incorpore l’erreur d’échantillonnage non seulement de la composante CCF mais aussi du poids d’échantillonnage dérivé de l’enquête réalisée simultanément. En utilisant la feuille de calcul et une fonction R fournie dans l’annexe supplémentaire, nous montrons également comment les changements dans les paramètres de population dans l’association entre E et D, va changer l’association entre E et O dans la population reconstruiteIt est notre affirmation que si rel L’analyse de régression pondérée des données du CCF peut fournir un outil analytique utile, flexible et efficace. Nous espérons qu’en présentant le cadre conceptuel pour la conception d’une étude du CCF et des conseils pour l’analyse RPM en utilisant la régression pondérée, nous encouragerons la collaboration entre spécialistes des maladies infectieuses, épidémiologistes et biostatisticiens. Une telle collaboration pour conceptualiser, concevoir, entreprendre, analyser et interpréter les études du CCF améliorera les études et rendra plus probable que les analyses et les résultats aborderont les questions de Pertinence pour les maladies infectieuses cliniques et l’épidémiologie des maladies transmissibles Avec des contraintes sur les ressources financières et humaines pour aborder les questions critiques des relations entre les infections spécifiques et les résultats tels que les séquelles cliniques, l’impact nutritionnel de l’infection et la mortalité associée aux infections. à cause de leur efficacité, devenir particulièrement attrayant Le RPM décrit dans cet article fournit une base pour estimer les relations dans la population entre l’infection avec un pathogène par exemple, un pathogène diarrhéique tel que détecté dans GEMS et les conséquences de l’infection pendant la période de suivi. Par exemple, le CCF et le RPM fournissent un moyen d’aller au-delà de la description de la létalité chez les cas enrôlés infectés par le pathogène d’intérêt et de l’évaluation de l’association entre le pathogène et la mortalité dans la population source. prévoir que cet ajout à la boîte à outils de l’épidémiologie analytique pourrait également être utile pour estimer l’impact des interventions qui réduisent la fréquence d’une infection particulière sur des résultats spécifiques, par exemple, le retard de croissance ou la mort. maladies infectieuses rencontrées par les cliniciens sur la ligne de front de la clinique je prends soin

Remarques

Le soutien financier HKG, L vdM, H Sommerfelt et H Steinsland ont été soutenus par l’Université de Bergen; l’Institut norvégien de santé publique; et le Medical Research Council, Cape Town, Afrique du Sud; ainsi que le numéro de subvention du Programme norvégien de développement, de recherche et d’éducation PRO / W C B, D N, T H F, K K, et M M L ont été soutenus par le projet de loi & amp; Numéro de subvention de la Fondation Melinda Gates Supplément de parrainage Cet article a été publié dans le cadre du supplément intitulé «Le GEMS Global Enteric Multicenter Study», parrainé par le projet de loi & amp; Melinda Gates Foundation Conflits d’intérêts potentiels Tous les auteurs: Aucun conflit signalé Tous les auteurs ont soumis le formulaire ICMJE pour la divulgation des conflits d’intérêts potentiels Conflits que les éditeurs considèrent pertinents pour le contenu du manuscrit ont été divulgués