Network-Informed约束分裂合并测试作业
- 生物统计学、爱荷华大学爱荷华市,IA,美国
频繁的通用测试在一个有限的人口是一种有效的方法来防止大型传染病疫情。然而,当目标群体有很多成分,这种策略可以成本高昂。减轻资源负担的一个方法是将多个独立的测试分组为一个单元,以确定在个体层面进一步测试是必要的。这种方法,称为一组测试或集中测试,找到了已获得了高度的关注最低成本集中战略。现有的方法,然而,假设独立或非常简单的依赖个体之间的结构。这种假设忽视了一个事实:传染病的上下文中有一个底层传输网络连接的人。我们开发一个受限的分裂的层次聚类算法,分配个人池基于个体之间的联系模式。在基于真实网络的模拟研究中,我们将展示使用我们建议的方法的好处相比,随机分配,即使网络是不完全测量并有高度的missingness数据。
1。介绍
沉默蔓延的传染病传播发生前症状发生在那些无症状或那些不被感染的疾病。这是一个当前COVID-19流感大流行的定义特征,区分SARS-CoV-2,说,2003年冠流行(发怒,2020)。很多研究显示COVID-19无症状的50%或更高版本(奥兰托波尔,2020;萨顿et al ., 2020;Almadhi et al ., 2021),甚至当症状出现,病毒传染峰值发生前的症状(他et al ., 2020年)。研究人员注意到,即使是隔离100%的症状病例在症状出现的时候感染控制是不够的Moghadas et al ., 2020),他指出,“当前战略,仅仅依靠感染症状出现的识别需要紧急评估”(发怒,辛格,2020)。
2。方法
2.1。客观的
它一直被公认的诊断检测错误(即。,thesensitivity and specificity do not both equal 1), it should not be the goal to only minimize the expected number of tests. Rather, the expected number of correct classifications ought to be accounted for as well.Malinovsky et al。(2016)提出正确使用的预期数量的比例分类个人预期数量的测试,然后导出这个量的情况下独立的个体。对于更一般的设置,我们的目标函数是下面,但首先,我们需要引入一些符号。
在哪里米我>是<我>米我>×1的向量。预期的数量的正确分类<我>Z我>可以显示等于多少
然后定义为目标函数
在很少的情况下将的数量<米ath>
2.2。限制分裂池作业
的个人的具体分配池影响目标函数是通过的概率池没有感染者。的分子<我>问我>(<我>Z我>)是最大化和分母是最小化最大化<米ath>
的子序列<米ath>
换句话说,我们更相信一个人不是感染如果我们知道他们的邻居也不是感染比如果我们知道相同数量的non-neighbors不受感染。作为一个例子,考虑以下autologistic演员属性模型(ALAAM) (知更鸟et al ., 2001),由:
控制的整体流行疾病通过参数θ1通过θ和邻居之间的传播能力2,ϕ(θ)是一个常数涉及正常化θ:=(θ1,θ2)。不失一般性,考虑<米ath>
从这可以看出,演员1的比例越高的边缘属于集<米ath>
在几乎所有情况下,然而,池的大小<我>K我>将相对较小(如<我>K我>∈(100]),当然也不会成长<我>N我>,也就是说,<米ath>
2.3。添加健康数据分析
2.3.1。网络数据
国家青少年健康纵向调查(添加健康)收集的信息从一个代表性的青少年在7到12年级跨越144所学校(喜怒无常,1999)。这项研究是友谊网络在学生中,我们将作为一个代理的学生最容易传播。通过的84所学校的数据是可用的R包networkdata(Almquist 2014),网络规模从25到2587名学生。对于我们的分析,我们集中在两个网络,一个拥有495年演员和2675年边,其他演员和2587 12969边缘。
2.3.2。仿真框架
评估<我>问我>(<我>Z我>),我们使用了一个基于网络的susceptible-infectious-susceptible (SIS)模型作为我们的模拟器<我>F我>(指的是,例如,艾伦et al ., 2008)。在大多数现实的传染病汇集测试可以实现上下文,有更多的知识的疾病的患病率比其他方面的疾病传播。因此,我们限制了SIS模型,流行是在一个小范围内;下面给出的仿真结果,我们选择0.025±0.0075。因此,为了获得样本<我>F我>来估计<我>问我>(<我>Z我>我们反复执行以下步骤,直到所需的模拟数据集得到的数量:
3所示。结果
的值<我>问我>(<我>Z我>)<我>K我>从2到20中显示图1。的最优池大小AH495、AH2587 ERGM10000 10, 9日和10日,分别。dashed-dotted红线代表的平均价值<我>问我>50岁以上的随机分配池<我>K我>。结果算法1基于拉普拉斯算子给出了固体蓝线,并从算法2基于测地线距离冲绿色;ERGM10000这不是可行的使用算法1。很明显,有一个性能之间的差异可以忽略不计算法1和计算效率更高算法2算法。利用网络通知具体池作业控制随机池分配池大小<我>K我>,除了很小的池大小大大增加预期的每个测试的正确分类数。
图1。目标函数的值<我>问我>(<我>Z我>)(垂直轴)与池的大小<我>K我>(水平轴)(一)AH495,(B)AH2587,(C)ERGM10000。的值<我>问我>给出了使用算法1基于拉普拉斯算子的特征向量,算法2基于测地距离,使用随机池作业。
图2提供了网络扰动的结果通过引入missingness由于调查设计和漏报率。作为参考,使用oracle的结果算法1或算法2提出了一条垂直线,随机池分配的结果。所有结果对应于最优<我>K我>鉴于以上。没有明确的模式优势当比较两个调查设计,nominate-5和部分召回。虽然结果有所恶化情况说明加息,这些减少非常边际相比随机池不利用网络信息的任务。
图2。结果从missingness引入(一)AH495,(B)AH2587或(C)ERGM10000网络通过模拟两个常见的网络调查工具和不同水平的情况。水平轴对应<我>问我>(<我>Z我>),垂直线显示50个随机池的平均分配或结果的基础上,真正的底层网络。
当我们的算法运行在个人电脑的英特尔(R) (TM)核心i7 - 9850 h CPU 2.60 ghz处理器,我们提供的计算时间表1。这些结果表明,我们的方法能够真正地适用于大型组织。
表1。计算时间以秒为单位算法1、2。
4所示。讨论
常规普遍筛查可以在感染控制起着重要的作用。实施这一策略的成本,然而,很多组织可以遥不可及。池测试,只测试个人应该池阳性导致更少的进行整体测试,从而降低资源负担一个更易于管理的水平。
数据可用性声明
公开的数据集进行分析。这些数据可以在这里找到:https://github.com/Z-co/networkdata。
作者的贡献
作者证实了这项工作的唯一贡献者和已批准出版。
资金
这项研究是由美国疾病控制和预防中心(5 U01 CK000531-02) MInD-Healthcare项目的一部分。
的利益冲突
作者说,这项研究是在没有进行任何商业或金融关系可能被视为一个潜在的利益冲突。
出版商的注意
本文表达的所有索赔仅代表作者,不一定代表的附属组织,或出版商、编辑和审稿人。任何产品,可以评估在这篇文章中,或声称,可能是由其制造商,不保证或认可的出版商。
引用
Abdalhamid B。,Bilder, C. R., McCutchen, E. L., Hinrichs, S. H., Koepsell, S. A., and Iwen, P. C. (2020). Assessment of specimen pooling to conserve sars cov-2 testing resources.<我>点。j .中国。病理学研究我>。153年,715 - 718。doi: 10.1093 / ajcp / aqaa064
艾伦,L。,Bauch, C., Castillo-Chavez, C., Earn, D., Feng, Z., Lewis, M., et al. (2008).<我>数学流行病学我>。海德堡;柏林:施普林格。
Almadhi, m·A。,一个bdulrahman, A., Sharaf, S. A., AlSaad, D., Stevenson, N. J., Atkin, S. L., et al. (2021). The high prevalence of asymptomatic SARS-CoV-2 infection reveals the silent spread of covid-19.<我>我nt。j .传染性说我>。105年,656 - 661。doi: 10.1016 / j.ijid.2021.02.100
Almquist, z . w . (2014)。<我>networkdata:林弗里曼的网络数据收集我>。0.01 R包版本。
伯纳德·h·R。,凯尔沃兹,p D。,和年代ailer, L. (1979). Informant accuracy in social network data iv: a comparison of clique-level structure in behavioral and cognitive network data.<我>年代oc。网络我>2,191 - 218。0378 - 8733 . doi: 10.1016 / (79) 90014 - 5
伯纳德·h·R。,凯尔沃兹,p D。,和年代ailer, L. (1982). Informant accuracy in social-network data v: an experimental attempt to predict actual communication from recall data.<我>年代oc。科学。Res我>。11日,30 - 66。doi: 10.1016 / 0049 - 089 x (82) 90006 - 0
Bharti, N。,Exten, C., and Oliver-Veronesi, R. E. (2020). Lessons from campus outbreak management using test, trace, and isolate efforts.<我>点。j .感染。控制我>49岁,849 - 851。doi: 10.1016 / j.ajic.2020.11.008
黑色,m . S。,Bilder, C. R., and Tebbs, J. M. (2015). Optimal retesting configurations for hierarchical group testing.<我>j。r . Stat。Soc我>。64年,693 - 710。doi: 10.1111 / rssc.12097
丹尼,t . N。,一个ndrews, L., Bonsignori, M., Cavanaugh, K., Datto, M. B., Deckard, A., et al. (2020). Implementation of a pooled surveillance testing program for asymptomatic SARS-CoV-2 infections on a college campus – duke university, durham, north carolina, august 2-october 11, 2020.<我>病态。致命的工作。代表我>。69年,1743年。doi: 10.15585 / mmwr.mm6946e1
多尔夫曼,r (1943)。缺陷检测的大量人口的成员。<我>安。数学。统计我>。14日,436 - 440。doi: 10.1214 /中耳炎/ 1177731363
Elkalla, m (2020)。<我>Ucsd的健康开始Covid-19池测试我>。网上:https://www.10news.com/news/coronavirus/ucsd-health-begins-covid-19-pool-testing(2022年2月22日通过)。
弗里曼,l . C。,Romney, A. K., and Freeman, S. C. (1987). Cognitive structure and informant accuracy.<我>点。Anthropol我>。89年,310 - 325。doi: 10.1525 / aa.1987.89.2.02a00020
他,X。,lau, E. H., Wu, P., Deng, X., Wang, J., Hao, X., et al. (2020). Author correction: temporal dynamics in viral shedding and transmissibility of covid-19.<我>地中海Nat。我>。26日,1491 - 1493。doi: 10.1038 / s41591 - 020 - 1016 - z
黄平君,T。,Coletti, P., Melegaro, A., Wallinga, J., Grijalva, C. G., Edmunds, J. W., et al. (2019). A systematic review of social contact surveys to inform transmission models of close-contact infections.<我>流行病学我>723 - 736年。doi: 10.1097 / EDE.0000000000001047
发怒,h . v . (2020)。控制covid-19盲目流行:沉默在缺乏快速传播病毒筛查。<我>中国。感染。说我>。73年,e3053-e3054。doi: 10.1093 / cid / ciaa1251
发怒,h V。,和年代我ngh, A. (2020). Asymptomatic transmission during the coronavirus disease 2019 pandemic and implications for public health strategies.<我>中国。感染。说我>。71年,2752 - 2756。doi: 10.1093 / cid / ciaa654
Hughes-Oliver, j . m . (2006)。<我>池实验血液筛查和药物发现我>。纽约,纽约州:激飞纽约。
黄,f . k . (1975)。广义二项组测试问题。<我>j。统计协会。我>。70年,923 - 926。doi: 10.1080 / 01621459.1975.10480324
考夫曼L。,和Rousseeuw, P. J. (1990). “Finding groups in data: an introduction to cluster analysis,” in<我>威利系列在概率论与数理统计。应用概率统计我>(纽约:威利)。
凯尔沃兹,p D。,和伯纳德·h·R。(1976). Informant accuracy in social network data.<我>嗡嗡声。器官我>。35岁,269 - 286。doi: 10.17730 / humo.35.3.10215j2m359266n2
凯尔沃兹,p D。,和伯纳德·h·R。(1977). Informant accuracy in social network data ii.<我>嗡嗡声。Commun。Res我>。4,3-18。doi: 10.1111 / j.1468-2958.1977.tb00591.x
凯尔沃兹,p D。,和伯纳德·h·R。(1979). Informant accuracy in social network data iii: a comparison of triadic structure in behavioral and cognitive data.<我>年代oc。网络我>2,19-46。0378 - 8733 . doi: 10.1016 / (79) 90009 - 1
Larremore, d . B。怀尔德,B。莱斯特E。,年代hehata, S., Burke, J. M., Hay, J. A., et al. (2021). Test sensitivity is secondary to frequency and turnaround time for covid-19 screening.<我>科学。阿德我>。7,abd5393。doi: 10.1126 / sciadv.abd5393
Leecaster, M。,Toth, D. J. A., Pettey, W. B. P., Rainey, J. J., Gao, H., Uzicanin, A., et al. (2016). Estimates of social contact in a middle school based on self-report and wireless sensor data.<我>《公共科学图书馆•综合》我>11日,e0153690。doi: 10.1371 / journal.pone.0153690
Lendle, s D。,Hudgens, M. G., and Qaqish, B. F. (2012). Group testing for case identification with correlated responses.<我>生物识别技术我>68年,532 - 540。doi: 10.1111 / j.1541-0420.2011.01674.x
酒鬼,D。,Koskinen, J., and Robins, G. (2012). Exponential<我>社交网络的随机图模型:理论、方法和应用。社会科学的结构分析我>。剑桥:剑桥大学出版社。
MacNaughton-Smith, P。威廉姆斯,w . T。,戴尔,m . B。,和Mockett, L. G. (1964). Dissimilarity analysis: a new technique of hierarchical sub-division.<我>自然我>202年,1034 - 1035。doi: 10.1038 / 2021034 a0
Malinovsky Y。,一个lbert, P. S., and Roy, A. (2016). Reader reaction: a note on the evaluation of group testing algorithms in the presence of misclassification.<我>生物识别技术我>72年,299 - 302。doi: 10.1111 / biom.12385
Malinovsky Y。哈伯,G。,和一个lbert, P. S. (2020). An optimal design for hierarchical generalized group testing.<我>j。r . Stat。Soc。C我>69年,607 - 621。doi: 10.1111 / rssc.12409
Mandavilli, a (2020)。<我>联邦官员转向一个新的测试策略感染我>。网上:https://www.nytimes.com/2020/07/01/health/coronavirus-pooled-testing.html
Mastrandrea, R。Fournet, J。,和Barrat, A. (2015). Contact patterns in a high school: a comparison between data collected using wearable sensors, contact diaries and friendship surveys.<我>《公共科学图书馆•综合》我>10,e0136497。doi: 10.1371 / journal.pone.0136497
Moghadas, s M。Shoukat,。,F我tzpatrick, M. C., Wells, C. R., Sah, P., Pandey, A., et al. (2020). Projecting hospital utilization during the covid-19 outbreaks in the united states.<我>Proc。国家的。学会科学。美国我>。117年,9122 - 9126。doi: 10.1073 / pnas.2004064117
喜怒无常,j . w . (1999)。<我>青少年社会关系的结构:建模的友谊在动态社会设置我>。网上:https://www.proquest.com/openview/3b0fe11b37f19311a088cfa2b4322c75/1?pq-origsite=gscholar&cbl=18750&diss=y
纽曼,m (2010)。<我>网络:介绍我>。牛津:牛津大学出版社。
奥兰,d . P。,和Topol, E. J. (2020). Prevalence of asymptomatic SARS-CoV-2 infection.<我>安。内部地中海我>。173年,362 - 367。doi: 10.7326 / m20 - 3012
Pilcher c, D。,Westreich, D., and Hudgens, M. G. (2020). Group testing for severe acute respiratory syndrome- coronavirus 2 to enable rapid scale-up of testing and real-time surveillance of incidence.<我>j。感染。说我>。222年,903 - 909。doi: 10.1093 / infdis / jiaa378
雷诺兹,D。浏览完,J。,Deamond, S., Moran, M., Gold, W., and Styra, R. (2008). Understanding, compliance and psychological impact of the sars quarantine experience.<我>论文。感染我>。136年,997 - 1007。doi: 10.1017 / S0950268807009156
知更鸟,G。,Pattison, P., and Elliott, P. (2001). Network models for social influence processes.<我>心理测量学我>66年,161 - 189。doi: 10.1007 / BF02294834
休厄尔·d·k(新闻)。利用网络结构来提高集中测试效率。我>
Smieszek, T。,Barclay, V. C., Seeni, I., Rainey, J. J., Gao, H., Uzicanin, A., et al. (2014). How should social mixing be measured: comparing web-based survey and sensor-based methods.<我>BMC感染。说我>。14日,136年。doi: 10.1186 / 1471-2334-14-136
4格,a (1957)。缺陷检测的大量人口的成员。<我>安。数学。统计我>。28日,1033 - 1036。doi: 10.1214 /中耳炎/ 1177706807
石头,a (2020)。<我>内布拉斯加州公共卫生实验室开始池测试COVID-19样本我>。网上:https://www.ketv.com/article/nebraska-public-health-lab-begins-pool-testing-covid-19-samples/31934880
萨顿,D。,Fuchs, K., DAlton, M., and Goffman, D. (2020). Universal screening for SARS-CoV-2 in women admitted for delivery.<我>心血管病。j .地中海我>。382年,2163 - 2164。doi: 10.1056 / NEJMc2009316
纽约州立大学石溪分校。(2020)。<我>总理Malatras和石溪大学总统Mcinnis宣布与纽约州立大学上州医科大学合作推出COVID-19集中监测测试我>。网上:https://www.suny.edu/suny-news/press-releases/09-2020/9-24-20/stony-brook-pooled-testing.html(2022年2月22日通过)。
冯Luxburg, (2007)。谱聚类的教程。<我>年代tat。第一版我>。17日,395 - 416。doi: 10.1007 / s11222 - 007 - 9033 - z
Wacharapluesadee, S。Kaewpom, T。Ampoot, W。佳,S。,Khamhang, W., Worachotsueptrakun, K., et al. (2020). Evaluating the efficiency of specimen pooling for pcr-based detection of covid-19.<我>j。地中海性研究。我>。92年,2193 - 2199。doi: 10.1002 / jmv.26005
关键词:组织测试、传染病、网络分析、分裂聚类、流行病学
引用:西维尔DK (2022) Network-Informed约束分裂汇集测试作业。<我>前面。大数据我>5:893760。doi: 10.3389 / fdata.2022.893760
收到:2022年3月10日;接受:2022年6月6日;
发表:2022年7月08年。
编辑:
杨杨美国西北大学版权©2022西维尔。这是一个开放分布式根据文章知识共享归属许可(CC)。使用、分发或复制在其他论坛是允许的,提供了原始作者(年代)和著作权人(s)认为,最初发表在这个期刊引用,按照公认的学术实践。没有使用、分发或复制是不符合这些条件的允许。
*通信:丹尼尔·k·斯维尔daniel-sewell@uiowa.edu