跳转到主要内容

原始研究的文章

前面。大数据,08年2022年7月
秒。大数据网络
卷5 - 2022 | https://doi.org/10.3389/fdata.2022.893760

Network-Informed约束分裂合并测试作业

  • 生物统计学、爱荷华大学爱荷华市,IA,美国

频繁的通用测试在一个有限的人口是一种有效的方法来防止大型传染病疫情。然而,当目标群体有很多成分,这种策略可以成本高昂。减轻资源负担的一个方法是将多个独立的测试分组为一个单元,以确定在个体层面进一步测试是必要的。这种方法,称为一组测试或集中测试,找到了已获得了高度的关注最低成本集中战略。现有的方法,然而,假设独立或非常简单的依赖个体之间的结构。这种假设忽视了一个事实:传染病的上下文中有一个底层传输网络连接的人。我们开发一个受限的分裂的层次聚类算法,分配个人池基于个体之间的联系模式。在基于真实网络的模拟研究中,我们将展示使用我们建议的方法的好处相比,随机分配,即使网络是不完全测量并有高度的missingness数据。

1。介绍

沉默蔓延的传染病传播发生前症状发生在那些无症状或那些不被感染的疾病。这是一个当前COVID-19流感大流行的定义特征,区分SARS-CoV-2,说,2003年冠流行(发怒,2020)。很多研究显示COVID-19无症状的50%或更高版本(奥兰托波尔,2020;萨顿et al ., 2020;Almadhi et al ., 2021),甚至当症状出现,病毒传染峰值发生前的症状(他et al ., 2020年)。研究人员注意到,即使是隔离100%的症状病例在症状出现的时候感染控制是不够的Moghadas et al ., 2020),他指出,“当前战略,仅仅依靠感染症状出现的识别需要紧急评估”(发怒,辛格,2020)。

有两种传统方法抑制沉默蔓延的影响。首先是接触者追踪,已知的情况下被要求列举他们的最近联系人,这些联系人随后要求遵守隔离程序。然而,存在很多这种策略失败的机会。社会学研究早就表明,个人(上下文)的已知的情况下,可能会忘记一些联系人,甚至一些最重要的(凯尔沃兹和伯纳德,1976年,1977年,1979年;伯纳德et al ., 1979,1982年;弗里曼et al ., 1987)。此外,它可能很难接触这些人,甚至应该联系,这些人可以选择忽略部分或全部隔离协议。事实上,研究表明,隔离接触已知情况下的成功率不到20% (雷诺兹et al ., 2008;Bharti et al ., 2020)。

第二种策略控制无声的传播是实现常规普遍筛查,在感兴趣的一些有限的人口,每个人都是定期测试,以检测病例在症状出现前。这是一个非常有效的策略,但测试的频率往往要高(Larremore et al ., 2021)。这地方非常大的资源负担那些负责提供这么多测试,仍然看到COVID-19大流行(发怒,2020)。

池测试方法,在某些情况下可以大大缓解这种资源负担(Abdalhamid et al ., 2020;Pilcher et al ., 2020;Wacharapluesadee et al ., 2020)。COVID-19大流行,一些国家已经实施了集中测试,如中国、德国、以色列、泰国(Mandavilli 2020)。在美国,一些组织也实现集中测试,包括内布拉斯加州公共卫生实验室(石头,2020)、杜克大学(丹尼et al ., 2020),石溪大学(纽约州立大学石溪分校,2020年)和加州大学圣地亚哥分校健康(Elkalla 2020)。

一般来说,集中测试是组合多个个体的行为测试,以确定个体层面的测试是必要的。池测试的分析是第一次正式的工作多尔夫曼(1943),它已经被称为多尔夫曼两阶段过程。这是一个简单的方法,一定数量的样品池和测试;结果诊断测试应负,没有进行更多的测试,如果积极的,所有个人组成随后测试。其他集中测试策略包括4格过程(4格,1957)以及分层方法(黑色et al ., 2015;Malinovsky et al ., 2020)。工作也在做推广这些程序的上下文异构被感染的概率是已知的(例如,黄1975),包括前面提到的一些研究。由于两级多尔夫曼的简单性和广泛使用过程(Hughes-Oliver 2006),我们将关注这池测试策略。

上述方法都依赖于假设的独立样本。在某些情况下这可能是合理的,但在传染病的背景下,这种假设只能证明如果这些被测试是完全独立。如果,例如,学校,工作场所,或公共卫生部门正在测试一组个体相互作用,这种假设是严重违反了。这种独立性假设是放松的一项研究Lendle et al。(2012),但即使在这里假设个体在特定的集群,可交换的测试,在不同的集群是独立的个体。这可能适用于某些设置(例如中的示例Lendle et al。(2012)的研究在每个测量多个t细胞反应,因此复合对称相关结构是合理的),但显然不是与任何现实的传输网络。在最近的一项研究中,西维尔(在媒体)开发了一种利用网络信息的方法,以提高集中测试效率。然而,提出了模拟退火算法的计算非常繁琐和不可行,原因是大型网络媒介。本研究的目的是开发一个算法,可以提高两级多尔夫曼过程的效率利用底层的信息传输网络。

本文的其余部分如下。章节2.1,2.2描述了目标函数和算法。2.3节描述了数据分析和仿真研究。第三节从这个研究结果报道,第四节提供了一个讨论。

2。方法

2.1。客观的

它一直被公认的诊断检测错误(即。,thesensitivity and specificity do not both equal 1), it should not be the goal to only minimize the expected number of tests. Rather, the expected number of correct classifications ought to be accounted for as well.Malinovsky et al。(2016)提出正确使用的预期数量的比例分类个人预期数量的测试,然后导出这个量的情况下独立的个体。对于更一般的设置,我们的目标函数是下面,但首先,我们需要引入一些符号。

让<我>y= 1,如果<我>我th个人被感染,否则为0<我>我=1,2,…<我>N,在那里<我>N是个人参与的数量集中测试。让<我>Z∈{1,2,…<我>P}表示的<我>P池个人<我>我属于,我们<米ath> p { 1<米o> , , N } 是属于个人的集合<我>pth池,每个的大小<我>K(=<我>N/<我>P)。让<我>T表示和指导测试的总数<我>C正确分类的总数。最后,让<我>p表示疾病的患病率,让<我>年代p和<我>年代e分别表示测试的特异性和敏感性。

关于网络,让<我>一个表示<我>N×<我>N邻接矩阵,<我>一个ij= 1如果有演员之间的边缘<我>我和<我>j,否则为0。让<米ath> N 表示的邻居<我>我,也就是说,{<我>j:<我>一个ij= 1}。

预期的数量的测试<我>N个人对于一个给定的池分配向量<我>Z可以显示等于多少

<米o mathsize="10.5pt" mathcolor="black" stretchy="false"> ( T<米o mathsize="10.5pt" mathcolor="black" stretchy="false"> | Z<米o mathsize="10.5pt" mathcolor="black" stretchy="false"> ) = P<米o mathsize="10.5pt" mathcolor="black"> + n<米sub> 年代<米我米athsize="10.5pt" mathcolor="black"> e K<米o mathsize="10.5pt" mathcolor="black" stretchy="false"> ( 年代<米我米athsize="10.5pt" mathcolor="black"> p + 年代<米我米athsize="10.5pt" mathcolor="black"> e 1<米o mathsize="10.5pt" mathcolor="black" stretchy="false"> ) p<米o mathsize="10.5pt" mathcolor="black"> = 1 p <米o mathsize="10.5pt" mathcolor="black" stretchy="false"> ( y <米我米athsize="10.5pt" mathcolor="black"> p <米我米athsize="10.5pt" mathcolor="black"> K = 0<米o mathsize="10.5pt" mathcolor="black" stretchy="false"> ) , ( 1<米o mathsize="10.5pt" mathcolor="black" stretchy="false"> )

在哪里是<我>米×1的向量。预期的数量的正确分类<我>Z可以显示等于多少

<米o mathsize="10.5pt" mathcolor="black" stretchy="false"> ( C<米o mathsize="10.5pt" mathcolor="black" stretchy="false"> | Z<米o mathsize="10.5pt" mathcolor="black" stretchy="false"> ) = n<米subsup> 年代<米我米athsize="10.5pt" mathcolor="black"> e<米n米athsize="10.5pt" mathcolor="black"> 2 + N<米o mathsize="10.5pt" mathcolor="black" stretchy="false"> ( 1<米o mathsize="10.5pt" mathcolor="black"> − p<米o mathsize="10.5pt" mathcolor="black" stretchy="false"> ) ( 年代<米我米athsize="10.5pt" mathcolor="black"> e 年代<米我米athsize="10.5pt" mathcolor="black"> p + 1<米o mathsize="10.5pt" mathcolor="black"> − 年代<米我米athsize="10.5pt" mathcolor="black"> e 年代<米我米athsize="10.5pt" mathcolor="black"> e<米n米athsize="10.5pt" mathcolor="black"> 2 ) + K<米o mathsize="10.5pt" mathcolor="black" stretchy="false"> ( 1<米o mathsize="10.5pt" mathcolor="black"> − 年代<米我米athsize="10.5pt" mathcolor="black"> p ) ( 年代<米我米athsize="10.5pt" mathcolor="black"> p + 年代<米我米athsize="10.5pt" mathcolor="black"> e 1<米o mathsize="10.5pt" mathcolor="black" stretchy="false"> ) p<米o mathsize="10.5pt" mathcolor="black"> = 1 p <米o mathsize="10.5pt" mathcolor="black" stretchy="false"> ( y<米o mathsize="10.5pt" mathcolor="black"> ′ <米我米athsize="10.5pt" mathcolor="black"> p <米row> K<米我米athsize="10.5pt" mathcolor="black"> p = 0<米o mathsize="10.5pt" mathcolor="black" stretchy="false"> ) ( 2<米o mathsize="10.5pt" mathcolor="black" stretchy="false"> )

然后定义为目标函数

<米row> ( Z ) : = <米row> ( C<米o mathsize="10.5pt" mathcolor="black"> | Z ) <米row> ( T<米o mathsize="10.5pt" mathcolor="black"> | Z ) ( 3<米o mathsize="10.5pt" mathcolor="black" stretchy="false"> )

在很少的情况下将的数量<米ath> <米o stretchy="false"> ( y <米我>p <米row> K<米我>p = 0<米o stretchy="false"> ) ,因此<我>问(<我>Z),在一个封闭的形式。然而,鉴于任意模拟器<我>F的数据集y(例如,一个基于网络的区划的或基于代理模型),我们可以使用蒙特卡罗近似获得任意概率的精确估计。

2.2。限制分裂池作业

的个人的具体分配池影响目标函数是通过的概率池没有感染者。的分子<我>问(<我>Z)是最大化和分母是最小化最大化<米ath> p<米o> = 1 p <米o stretchy="false"> ( y <米我>p <米row> K<米我>p = 0<米o stretchy="false"> ) 。伸缩式这个量在以下方式,虽然很简单,有些启示我们的目的:

p<米o mathsize="10.5pt" mathcolor="black"> = 1 P ( y <米我米athsize="10.5pt" mathcolor="black"> p K<米我米athsize="10.5pt" mathcolor="black"> p = 0<米o mathsize="10.5pt" mathcolor="black" stretchy="false"> ) = p<米o mathsize="10.5pt" mathcolor="black"> = 1 P ( <米o mathsize="10.5pt" mathcolor="black" stretchy="false"> ( y<米row> <米row> p<米n米athsize="10.5pt" mathcolor="black"> 1 = 0<米o mathsize="10.5pt" mathcolor="black" stretchy="false"> ) k<米o mathsize="10.5pt" mathcolor="black"> = 2 K ( y<米row> <米row> p<米我米athsize="10.5pt" mathcolor="black"> k = 0<米o mathsize="10.5pt" mathcolor="black" stretchy="false"> | y<米row> <米row> p<米n米athsize="10.5pt" mathcolor="black"> 1 = = y<米row> <米row> p<米o mathsize="10.5pt" mathcolor="black" stretchy="false"> ( k<米o mathsize="10.5pt" mathcolor="black"> − 1<米o mathsize="10.5pt" mathcolor="black" stretchy="false"> ) = 0<米o mathsize="10.5pt" mathcolor="black" stretchy="false"> ) ] , ( 4<米o mathsize="10.5pt" mathcolor="black" stretchy="false"> )

的子序列<米ath> { p<米我>k } k<米o> = 1 K 由<我>K的成员<米ath> p

在传染病的上下文中,我们觉得这是非常合理的假设如下:

年代<米n米athsize="10.5pt" mathcolor="black"> 1 , 年代<米n米athsize="10.5pt" mathcolor="black"> 2 { 1<米o mathsize="10.5pt" mathcolor="black"> , , N<米o mathsize="10.5pt" mathcolor="black"> } { <米o mathsize="10.5pt" mathcolor="black"> } 这样 | 年代<米n米athsize="10.5pt" mathcolor="black"> 1 | = | 年代<米n米athsize="10.5pt" mathcolor="black"> 2 | , 如果 | 年代<米n米athsize="10.5pt" mathcolor="black"> 1 N<米我米athsize="10.5pt" mathcolor="black"> 我 | > | 年代<米n米athsize="10.5pt" mathcolor="black"> 2 N<米我米athsize="10.5pt" mathcolor="black"> 我 | 然后 <米o mathsize="10.5pt" mathcolor="black" stretchy="true"> ( y<米我米athsize="10.5pt" mathcolor="black"> 我 = 0<米o mathsize="10.5pt" mathcolor="black"> | { y<米我米athsize="10.5pt" mathcolor="black"> j = 0<米o mathsize="10.5pt" mathcolor="black"> , j<米o mathsize="10.5pt" mathcolor="black"> ∈ 年代<米n米athsize="10.5pt" mathcolor="black"> 1 } ) > <米o mathsize="10.5pt" mathcolor="black" stretchy="true"> ( y<米我米athsize="10.5pt" mathcolor="black"> 我 = 0<米o mathsize="10.5pt" mathcolor="black"> | { y<米我米athsize="10.5pt" mathcolor="black"> j = 0<米o mathsize="10.5pt" mathcolor="black"> , j<米o mathsize="10.5pt" mathcolor="black"> ∈ 年代<米n米athsize="10.5pt" mathcolor="black"> 2 } ) ( 5<米o mathsize="10.5pt" mathcolor="black" stretchy="false"> )

换句话说,我们更相信一个人不是感染如果我们知道他们的邻居也不是感染比如果我们知道相同数量的non-neighbors不受感染。作为一个例子,考虑以下autologistic演员属性模型(ALAAM) (知更鸟et al ., 2001),由:

<米row> ( y ) = 1 ϕ<米row> ( θ ) 经验值 { θ 1 y N + θ 2 2 y 一个<米style mathvariant="bold"> y } ,

控制的整体流行疾病通过参数θ1通过θ和邻居之间的传播能力2,ϕ(θ)是一个常数涉及正常化θ:=(θ12)。不失一般性,考虑<米ath> <米o stretchy="true"> ( y<米n>1 = 0<米o stretchy="false"> | { y<米我>j = 0<米o> , j<米o> ∈ 年代<米o> } ) 对于一些设置<米ath> 年代 : = { 2<米o> , 3<米o> , , 年代 } 。这个数量等于

<米o mathsize="10.5pt" mathcolor="black" stretchy="false"> ( y<米n米athsize="10.5pt" mathcolor="black"> 1 = 0<米o mathsize="10.5pt" mathcolor="black"> | { y<米我米athsize="10.5pt" mathcolor="black"> j = 0<米o mathsize="10.5pt" mathcolor="black"> , j<米o mathsize="10.5pt" mathcolor="black"> ∈ 年代<米o mathsize="10.5pt" mathcolor="black"> } ) = ( 1<米o mathsize="10.5pt" mathcolor="black"> + { y<米我米athsize="10.5pt" mathcolor="black"> j , j<米o mathsize="10.5pt" mathcolor="black"> > 年代<米o mathsize="10.5pt" mathcolor="black"> } 经验值 { θ<米n米athsize="10.5pt" mathcolor="black"> 1 j<米o mathsize="10.5pt" mathcolor="black"> > 年代 y<米我米athsize="10.5pt" mathcolor="black"> j + θ<米n米athsize="10.5pt" mathcolor="black"> 2 ( j<米o mathsize="10.5pt" mathcolor="black"> > 年代 y<米我米athsize="10.5pt" mathcolor="black"> j 一个<米row> 1<米我米athsize="10.5pt" mathcolor="black"> j + 年代<米o mathsize="10.5pt" mathcolor="black"> < j<米o mathsize="10.5pt" mathcolor="black"> < k y<米我米athsize="10.5pt" mathcolor="black"> j y<米我米athsize="10.5pt" mathcolor="black"> k 一个<米row> j<米我米athsize="10.5pt" mathcolor="black"> k ) } { y<米我米athsize="10.5pt" mathcolor="black"> j , j<米o mathsize="10.5pt" mathcolor="black"> > 年代<米o mathsize="10.5pt" mathcolor="black"> } 经验值 { θ<米n米athsize="10.5pt" mathcolor="black"> 1 j<米o mathsize="10.5pt" mathcolor="black"> > 年代 y<米我米athsize="10.5pt" mathcolor="black"> j + θ<米n米athsize="10.5pt" mathcolor="black"> 2 年代<米o mathsize="10.5pt" mathcolor="black"> < j<米o mathsize="10.5pt" mathcolor="black"> < k y<米我米athsize="10.5pt" mathcolor="black"> j y<米我米athsize="10.5pt" mathcolor="black"> k 一个<米row> j<米我米athsize="10.5pt" mathcolor="black"> k } e<米row> θ<米n米athsize="10.5pt" mathcolor="black"> 1 ] 1

从这可以看出,演员1的比例越高的边缘属于集<米ath> 年代 ,因此量越小<米ath> j<米o> > 年代 y j 一个 1<米我>j ,条件概率越大<我>y1= 0。

温和的假设下方程(5),可以看出通过方程(4)<我>问(<我>Z)是最大化当边缘连接个人在同一池。我们希望减少边缘连接的边界集个体在不同的池。为此,我们从光谱聚类开始,自然适合这种类型的问题(指的是,例如,冯Luxburg 2007)。然而,我们不能简单地适用<我>k——或者其他简单的聚类算法拉普拉斯算子矩阵的特征值,因为我们的池大小都是固定的<我>K。因此,我们建议使用约束分裂聚类方法基于戴安娜(MacNaughton-Smith et al ., 1964;考夫曼和Rousseeuw, 1990年)。

我们建议的方法首先计算拉普拉斯算子矩阵,<我>l:=<我>D−<我>一个,在那里<我>D是演员的度的对角矩阵以及对角线元素(例如,<米ath> D <米我>我 : = j 一个 <米我>j ),找到相对应的特征向量<我>P最小的特征值。然后我们计算之间的距离<我>N个人和个人分配到第一个池<我>我11谁有最大的平均距离。为<我>k=2,…<我>K,我们发现个人<我>我1<我>k谁有最大的区别那些不属于池的平均距离和平均距离<我>k−1个人目前分配到池中。我们删除这些人(<我>我11、…<我>我1<我>K),然后重复这一池2<我>P−1,最后迭代分割最后2<我>K个人到最后两个池。下面给出算法的细节算法1

算法1
www.雷竞技rebatfrontiersin.org

算法1。分裂的池分配过程。

在几乎所有情况下,然而,池的大小<我>K将相对较小(如<我>K∈(100]),当然也不会成长<我>N,也就是说,<米ath> P<米o> = O ( N ) 。这产生一个计算成本<米ath> O ( N 3 ) 这对大型网络太高。因此,在这种情况下,我们建议更换从获得的距离<我>P特征值在算法1测地线距离,只有成本<米ath> O ( N 2 ) 计算(纽曼,2010)。我们会参考这个修改算法2

2.3。添加健康数据分析

2.3.1。网络数据

国家青少年健康纵向调查(添加健康)收集的信息从一个代表性的青少年在7到12年级跨越144所学校(喜怒无常,1999)。这项研究是友谊网络在学生中,我们将作为一个代理的学生最容易传播。通过的84所学校的数据是可用的Rnetworkdata(Almquist 2014),网络规模从25到2587名学生。对于我们的分析,我们集中在两个网络,一个拥有495年演员和2675年边,其他演员和2587 12969边缘。

网络调查数据经常被用于传染病模型(黄平君et al ., 2019)。类似于接触日记显示相当好的关系长期接触测量传感器设备(例如,Smieszek et al ., 2014;Leecaster et al ., 2016),在看高中的一项研究数据在法国长时间接触都是代表在友谊网络调查中,和“接触网络的总体结构[…]是正确地捕捉到[…](自述)友谊”(Mastrandrea et al ., 2015)。而自我报告的友谊数据可能不是足够精确的在所有情况下,在学校的学生至少有合理的证据表明,最有可能采取行动的长期接触密切接触传播的疾病非常近似的自我报告的友谊。

评估我们的方法更大的网络,我们创建了一个合成网络在以下现实的拓扑方法。我们一个指数随机图模型(ERGM)基于社交圈子依赖的假设在每个网络上面描述的84学校。更具体地说,每个ERGM适合使用以下术语:#边缘,# 2星,#三角形,几何加权扁共享合作伙伴和几何加权dyadwise共享合作伙伴。前三个条件符合马尔可夫依赖关系,社交圈子的后两个依赖项(醉汉et al ., 2012)。然后我们进行了固定效应分析,每个系数建模为一个函数的网络日志的大小。使用这些系数,然后生成一个网络规模10000演员,有13800个边缘。的两个网络规模495年和2675年,这给了我们一个第三网络分析,我们将把这些网络称为AH495, AH2587和ERGM10000分别。

2.3.2。仿真框架

评估<我>问(<我>Z),我们使用了一个基于网络的susceptible-infectious-susceptible (SIS)模型作为我们的模拟器<我>F(指的是,例如,艾伦et al ., 2008)。在大多数现实的传染病汇集测试可以实现上下文,有更多的知识的疾病的患病率比其他方面的疾病传播。因此,我们限制了SIS模型,流行是在一个小范围内;下面给出的仿真结果,我们选择0.025±0.0075。因此,为了获得样本<我>F来估计<我>问(<我>Z我们反复执行以下步骤,直到所需的模拟数据集得到的数量:

1。画出SIS传输参数的均匀分布。

2。吸引新的<我>y,<我>我=1,…,<我>N从SIS模型。

3所示。如果<米ath> 1 N y ( 0<米o> 。 025年<米o> - - - - - - 0<米o> 。 0075年<米o> , 0<米o> 。 025年<米o> + 0<米o> 。 0075年 ] 接受y,否则拒绝。

与<我>问(<我>Z)估计<我>通过从这些从蒙特卡洛<我>F,我们可以选择最优的池的大小<我>K

然后,我们扩大了我们的研究,以确定的效果不完美的底层网络的知识,以及不同的漏报率的效果。我们复制两个常见的网络调查工具模拟数据。首先,我们模拟开放式反应与不完美的召回率。这<我>部分回忆战略假定每个人会“忘记”给定边缘概率为0.25。第二,我们模拟一个<我>nominate-n设计,每个被提名<我>n他们的边缘。在我们的模拟中,我们设置<我>n=5。为了解决情况说明,我们模拟“观察”网络<我>通过部分召回和nominate-5策略5,10,或20%的网络成员未能提供响应。对于每一个配置,我们模拟250网络和估计<我>问(<我>Z)为每个。

3所示。结果

的值<我>问(<我>Z)<我>K从2到20中显示图1。的最优池大小AH495、AH2587 ERGM10000 10, 9日和10日,分别。dashed-dotted红线代表的平均价值<我>问50岁以上的随机分配池<我>K。结果算法1基于拉普拉斯算子给出了固体蓝线,并从算法2基于测地线距离冲绿色;ERGM10000这不是可行的使用算法1。很明显,有一个性能之间的差异可以忽略不计算法1和计算效率更高算法2算法。利用网络通知具体池作业控制随机池分配池大小<我>K,除了很小的池大小大大增加预期的每个测试的正确分类数。

图1
www.雷竞技rebatfrontiersin.org

图1。目标函数的值<我>问(<我>Z)(垂直轴)与池的大小<我>K(水平轴)(一)AH495,(B)AH2587,(C)ERGM10000。的值<我>问给出了使用算法1基于拉普拉斯算子的特征向量,算法2基于测地距离,使用随机池作业。

图2提供了网络扰动的结果通过引入missingness由于调查设计和漏报率。作为参考,使用oracle的结果算法1算法2提出了一条垂直线,随机池分配的结果。所有结果对应于最优<我>K鉴于以上。没有明确的模式优势当比较两个调查设计,nominate-5和部分召回。虽然结果有所恶化情况说明加息,这些减少非常边际相比随机池不利用网络信息的任务。

图2
www.雷竞技rebatfrontiersin.org

图2。结果从missingness引入(一)AH495,(B)AH2587或(C)ERGM10000网络通过模拟两个常见的网络调查工具和不同水平的情况。水平轴对应<我>问(<我>Z),垂直线显示50个随机池的平均分配或结果的基础上,真正的底层网络。

当我们的算法运行在个人电脑的英特尔(R) (TM)核心i7 - 9850 h CPU 2.60 ghz处理器,我们提供的计算时间表1。这些结果表明,我们的方法能够真正地适用于大型组织。

表1
www.雷竞技rebatfrontiersin.org

表1。计算时间以秒为单位算法1、2

4所示。讨论

常规普遍筛查可以在感染控制起着重要的作用。实施这一策略的成本,然而,很多组织可以遥不可及。池测试,只测试个人应该池阳性导致更少的进行整体测试,从而降低资源负担一个更易于管理的水平。

在现存的文献汇集测试是巨大的,旨在寻找最优的算法池大小忽略了一个事实,那就是在传染病的背景下有一个潜在的传输网络,使个人汇集不是独立的。我们已经表明,利用底层网络,汇集测试提供的成本节约可以进一步增加。

在真实的应用程序中,真正的潜在联系网络,导致传输事件当然是未知的。然而,我们已经表明,使用容易实现调查工具收集的联系信息可以提供足够的信息网络来产生结果,几乎相当于当真正的网络。此外,我们的方法是健壮的高漏报率。

数据可用性声明

公开的数据集进行分析。这些数据可以在这里找到:https://github.com/Z-co/networkdata

作者的贡献

作者证实了这项工作的唯一贡献者和已批准出版。

资金

这项研究是由美国疾病控制和预防中心(5 U01 CK000531-02) MInD-Healthcare项目的一部分。

的利益冲突

作者说,这项研究是在没有进行任何商业或金融关系可能被视为一个潜在的利益冲突。

出版商的注意

本文表达的所有索赔仅代表作者,不一定代表的附属组织,或出版商、编辑和审稿人。任何产品,可以评估在这篇文章中,或声称,可能是由其制造商,不保证或认可的出版商。

引用

Abdalhamid B。,Bilder, C. R., McCutchen, E. L., Hinrichs, S. H., Koepsell, S. A., and Iwen, P. C. (2020). Assessment of specimen pooling to conserve sars cov-2 testing resources.<我>点。j .中国。病理学研究。153年,715 - 718。doi: 10.1093 / ajcp / aqaa064

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

艾伦,L。,Bauch, C., Castillo-Chavez, C., Earn, D., Feng, Z., Lewis, M., et al. (2008).<我>数学流行病学。海德堡;柏林:施普林格。

谷歌学术搜索

Almadhi, m·A。,一个bdulrahman, A., Sharaf, S. A., AlSaad, D., Stevenson, N. J., Atkin, S. L., et al. (2021). The high prevalence of asymptomatic SARS-CoV-2 infection reveals the silent spread of covid-19.<我>我nt。j .传染性说。105年,656 - 661。doi: 10.1016 / j.ijid.2021.02.100

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

Almquist, z . w . (2014)。<我>networkdata:林弗里曼的网络数据收集。0.01 R包版本。

谷歌学术搜索

伯纳德·h·R。,凯尔沃兹,p D。,和年代ailer, L. (1979). Informant accuracy in social network data iv: a comparison of clique-level structure in behavioral and cognitive network data.<我>年代oc。网络2,191 - 218。0378 - 8733 . doi: 10.1016 / (79) 90014 - 5

CrossRef全文|谷歌学术搜索

伯纳德·h·R。,凯尔沃兹,p D。,和年代ailer, L. (1982). Informant accuracy in social-network data v: an experimental attempt to predict actual communication from recall data.<我>年代oc。科学。Res。11日,30 - 66。doi: 10.1016 / 0049 - 089 x (82) 90006 - 0

CrossRef全文|谷歌学术搜索

Bharti, N。,Exten, C., and Oliver-Veronesi, R. E. (2020). Lessons from campus outbreak management using test, trace, and isolate efforts.<我>点。j .感染。控制49岁,849 - 851。doi: 10.1016 / j.ajic.2020.11.008

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

黑色,m . S。,Bilder, C. R., and Tebbs, J. M. (2015). Optimal retesting configurations for hierarchical group testing.<我>j。r . Stat。Soc。64年,693 - 710。doi: 10.1111 / rssc.12097

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

丹尼,t . N。,一个ndrews, L., Bonsignori, M., Cavanaugh, K., Datto, M. B., Deckard, A., et al. (2020). Implementation of a pooled surveillance testing program for asymptomatic SARS-CoV-2 infections on a college campus – duke university, durham, north carolina, august 2-october 11, 2020.<我>病态。致命的工作。代表。69年,1743年。doi: 10.15585 / mmwr.mm6946e1

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

多尔夫曼,r (1943)。缺陷检测的大量人口的成员。<我>安。数学。统计。14日,436 - 440。doi: 10.1214 /中耳炎/ 1177731363

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

Elkalla, m (2020)。<我>Ucsd的健康开始Covid-19池测试。网上:https://www.10news.com/news/coronavirus/ucsd-health-begins-covid-19-pool-testing(2022年2月22日通过)。

谷歌学术搜索

弗里曼,l . C。,Romney, A. K., and Freeman, S. C. (1987). Cognitive structure and informant accuracy.<我>点。Anthropol。89年,310 - 325。doi: 10.1525 / aa.1987.89.2.02a00020

CrossRef全文|谷歌学术搜索

他,X。,lau, E. H., Wu, P., Deng, X., Wang, J., Hao, X., et al. (2020). Author correction: temporal dynamics in viral shedding and transmissibility of covid-19.<我>地中海Nat。。26日,1491 - 1493。doi: 10.1038 / s41591 - 020 - 1016 - z

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

黄平君,T。,Coletti, P., Melegaro, A., Wallinga, J., Grijalva, C. G., Edmunds, J. W., et al. (2019). A systematic review of social contact surveys to inform transmission models of close-contact infections.<我>流行病学723 - 736年。doi: 10.1097 / EDE.0000000000001047

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

发怒,h . v . (2020)。控制covid-19盲目流行:沉默在缺乏快速传播病毒筛查。<我>中国。感染。说。73年,e3053-e3054。doi: 10.1093 / cid / ciaa1251

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

发怒,h V。,和年代我ngh, A. (2020). Asymptomatic transmission during the coronavirus disease 2019 pandemic and implications for public health strategies.<我>中国。感染。说。71年,2752 - 2756。doi: 10.1093 / cid / ciaa654

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

Hughes-Oliver, j . m . (2006)。<我>池实验血液筛查和药物发现。纽约,纽约州:激飞纽约。

谷歌学术搜索

黄,f . k . (1975)。广义二项组测试问题。<我>j。统计协会。。70年,923 - 926。doi: 10.1080 / 01621459.1975.10480324

CrossRef全文|谷歌学术搜索

考夫曼L。,和Rousseeuw, P. J. (1990). “Finding groups in data: an introduction to cluster analysis,” in<我>威利系列在概率论与数理统计。应用概率统计(纽约:威利)。

谷歌学术搜索

凯尔沃兹,p D。,和伯纳德·h·R。(1976). Informant accuracy in social network data.<我>嗡嗡声。器官。35岁,269 - 286。doi: 10.17730 / humo.35.3.10215j2m359266n2

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

凯尔沃兹,p D。,和伯纳德·h·R。(1977). Informant accuracy in social network data ii.<我>嗡嗡声。Commun。Res。4,3-18。doi: 10.1111 / j.1468-2958.1977.tb00591.x

CrossRef全文|谷歌学术搜索

凯尔沃兹,p D。,和伯纳德·h·R。(1979). Informant accuracy in social network data iii: a comparison of triadic structure in behavioral and cognitive data.<我>年代oc。网络2,19-46。0378 - 8733 . doi: 10.1016 / (79) 90009 - 1

CrossRef全文|谷歌学术搜索

Larremore, d . B。怀尔德,B。莱斯特E。,年代hehata, S., Burke, J. M., Hay, J. A., et al. (2021). Test sensitivity is secondary to frequency and turnaround time for covid-19 screening.<我>科学。阿德。7,abd5393。doi: 10.1126 / sciadv.abd5393

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

Leecaster, M。,Toth, D. J. A., Pettey, W. B. P., Rainey, J. J., Gao, H., Uzicanin, A., et al. (2016). Estimates of social contact in a middle school based on self-report and wireless sensor data.<我>《公共科学图书馆•综合》11日,e0153690。doi: 10.1371 / journal.pone.0153690

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

Lendle, s D。,Hudgens, M. G., and Qaqish, B. F. (2012). Group testing for case identification with correlated responses.<我>生物识别技术68年,532 - 540。doi: 10.1111 / j.1541-0420.2011.01674.x

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

酒鬼,D。,Koskinen, J., and Robins, G. (2012). Exponential<我>社交网络的随机图模型:理论、方法和应用。社会科学的结构分析。剑桥:剑桥大学出版社。

谷歌学术搜索

MacNaughton-Smith, P。威廉姆斯,w . T。,戴尔,m . B。,和Mockett, L. G. (1964). Dissimilarity analysis: a new technique of hierarchical sub-division.<我>自然202年,1034 - 1035。doi: 10.1038 / 2021034 a0

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

Malinovsky Y。,一个lbert, P. S., and Roy, A. (2016). Reader reaction: a note on the evaluation of group testing algorithms in the presence of misclassification.<我>生物识别技术72年,299 - 302。doi: 10.1111 / biom.12385

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

Malinovsky Y。哈伯,G。,和一个lbert, P. S. (2020). An optimal design for hierarchical generalized group testing.<我>j。r . Stat。Soc。C69年,607 - 621。doi: 10.1111 / rssc.12409

CrossRef全文|谷歌学术搜索

Mandavilli, a (2020)。<我>联邦官员转向一个新的测试策略感染。网上:https://www.nytimes.com/2020/07/01/health/coronavirus-pooled-testing.html

谷歌学术搜索

Mastrandrea, R。Fournet, J。,和Barrat, A. (2015). Contact patterns in a high school: a comparison between data collected using wearable sensors, contact diaries and friendship surveys.<我>《公共科学图书馆•综合》10,e0136497。doi: 10.1371 / journal.pone.0136497

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

Moghadas, s M。Shoukat,。,F我tzpatrick, M. C., Wells, C. R., Sah, P., Pandey, A., et al. (2020). Projecting hospital utilization during the covid-19 outbreaks in the united states.<我>Proc。国家的。学会科学。美国。117年,9122 - 9126。doi: 10.1073 / pnas.2004064117

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

喜怒无常,j . w . (1999)。<我>青少年社会关系的结构:建模的友谊在动态社会设置。网上:https://www.proquest.com/openview/3b0fe11b37f19311a088cfa2b4322c75/1?pq-origsite=gscholar&cbl=18750&diss=y

谷歌学术搜索

纽曼,m (2010)。<我>网络:介绍。牛津:牛津大学出版社。

谷歌学术搜索

奥兰,d . P。,和Topol, E. J. (2020). Prevalence of asymptomatic SARS-CoV-2 infection.<我>安。内部地中海。173年,362 - 367。doi: 10.7326 / m20 - 3012

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

Pilcher c, D。,Westreich, D., and Hudgens, M. G. (2020). Group testing for severe acute respiratory syndrome- coronavirus 2 to enable rapid scale-up of testing and real-time surveillance of incidence.<我>j。感染。说。222年,903 - 909。doi: 10.1093 / infdis / jiaa378

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

雷诺兹,D。浏览完,J。,Deamond, S., Moran, M., Gold, W., and Styra, R. (2008). Understanding, compliance and psychological impact of the sars quarantine experience.<我>论文。感染。136年,997 - 1007。doi: 10.1017 / S0950268807009156

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

知更鸟,G。,Pattison, P., and Elliott, P. (2001). Network models for social influence processes.<我>心理测量学66年,161 - 189。doi: 10.1007 / BF02294834

CrossRef全文|谷歌学术搜索

休厄尔·d·k(新闻)。利用网络结构来提高集中测试效率。

谷歌学术搜索

Smieszek, T。,Barclay, V. C., Seeni, I., Rainey, J. J., Gao, H., Uzicanin, A., et al. (2014). How should social mixing be measured: comparing web-based survey and sensor-based methods.<我>BMC感染。说。14日,136年。doi: 10.1186 / 1471-2334-14-136

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

4格,a (1957)。缺陷检测的大量人口的成员。<我>安。数学。统计。28日,1033 - 1036。doi: 10.1214 /中耳炎/ 1177706807

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

石头,a (2020)。<我>内布拉斯加州公共卫生实验室开始池测试COVID-19样本。网上:https://www.ketv.com/article/nebraska-public-health-lab-begins-pool-testing-covid-19-samples/31934880

谷歌学术搜索

萨顿,D。,Fuchs, K., DAlton, M., and Goffman, D. (2020). Universal screening for SARS-CoV-2 in women admitted for delivery.<我>心血管病。j .地中海。382年,2163 - 2164。doi: 10.1056 / NEJMc2009316

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

纽约州立大学石溪分校。(2020)。<我>总理Malatras和石溪大学总统Mcinnis宣布与纽约州立大学上州医科大学合作推出COVID-19集中监测测试。网上:https://www.suny.edu/suny-news/press-releases/09-2020/9-24-20/stony-brook-pooled-testing.html(2022年2月22日通过)。

谷歌学术搜索

冯Luxburg, (2007)。谱聚类的教程。<我>年代tat。第一版。17日,395 - 416。doi: 10.1007 / s11222 - 007 - 9033 - z

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

Wacharapluesadee, S。Kaewpom, T。Ampoot, W。佳,S。,Khamhang, W., Worachotsueptrakun, K., et al. (2020). Evaluating the efficiency of specimen pooling for pcr-based detection of covid-19.<我>j。地中海性研究。。92年,2193 - 2199。doi: 10.1002 / jmv.26005

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

关键词:组织测试、传染病、网络分析、分裂聚类、流行病学

引用:西维尔DK (2022) Network-Informed约束分裂汇集测试作业。<我>前面。大数据5:893760。doi: 10.3389 / fdata.2022.893760

收到:2022年3月10日;接受:2022年6月6日;
发表:2022年7月08年。

编辑:

杨杨美国西北大学

审核:

Josh内含子美国锡拉丘兹大学,
益气李美国锡拉丘兹大学,

版权©2022西维尔。这是一个开放分布式根据文章知识共享归属许可(CC)。使用、分发或复制在其他论坛是允许的,提供了原始作者(年代)和著作权人(s)认为,最初发表在这个期刊引用,按照公认的学术实践。没有使用、分发或复制是不符合这些条件的允许。

*通信:丹尼尔·k·斯维尔daniel-sewell@uiowa.edu

下载