编辑:可伸缩的网络一代&分析
- 1计算机科学与软件工程系,迈阿密大学,牛津大学,哦,美国
- 2Biocomplexity研究所,美国弗吉尼亚州夏洛茨维尔的弗吉尼亚大学
- 3数学学院,牛津大学,英国牛津大学
- 4电气工程系、电子和信息、卡塔尼亚大学意大利卡塔尼亚
编辑的研究课题
可伸缩的网络一代&分析
网络模型一直是用来测试理论合成数据集或提供模拟。与不断增长的可用性的硬件如图形处理单元(gpu),有一个范式转变生成网络模型的实例通过算法,有效地利用分布式计算资源。一个熟悉的方法来描述网络模型的实例(例如,集群或平均距离)是提供一个封闭的形式分析,因此使用图论来演示的行为模型。的爆炸机器学习研究的经典问题的描述实例模型已经被改造成一个预测问题,涉及到大量的网络培训实例。分析师已经习惯检查网络通过寻找“嫌犯”,如高的节点介数或亲密中心。但是今天的工具箱里充满了成百上千的节点中心算法,因此分析人士的一个主要问题选择指标这将提供一个丰富的数据在一个合理的时间内回答。可伸缩性是这些多个转换见证了网络的核心科学研究,从一代或分析大规模网络的生产机器学习的大量的网络。在这个特殊的问题,15作者为指导网络科研社区提出了切实可行的解决方案,解决共同关心的可伸缩性。
大规模的网络一代提出的创新实践阿拉姆和Perumalla。作者生产发电机,可以实现任意度分布,从而使它特别灵活的工具等常见任务生成等价随机网络(例如,在实证测试属性的存在网络)或创建一个合成的人口。最重要的是,发电机可以实现利率超过每秒500亿边缘通过其高利用率的一个现代GPU。通过创建第一个基于gpu的算法来生成与一个给定的网络度分布,这项工作也是一个网络科学社区的邀请去探索许多潜在的扩展,如使用多个gpu(在同一台机器上和/或通过一个互连网络)及时意识到更大的网络。
建立一个网络发电机往往伴随着实例的描述基于发电机的参数。这个任务可以艰苦发电机明显简单的规则会导致一旦这些高度复杂的实例规则反复应用,尤其是在存在特性转化或分岔。提供的新方法的基础Murase et al。包括创建大量的实例从发电机和使用它们作为机器学习模型训练数据,然后能够预测实例的特征参数值。这个创意用途深层神经网络应用于一个新的发电机,相结合机制,往往是发现在单独的发电机三者关闭等亲同种抗原的交互,终止和链接。
为了充分地覆盖机器学习在网络科学研究的巨大潜力,的工作Murase et al。由两个研究补充。艾迪加等。也训练有素的机器学习算法基于模型参数进行预测,但预测关注动态属性(入侵物种传播)。研究因此说明了机器学习的有用性在研究典型的网络结构和功能的问题。另一个方面是代表的工作大好,关注链接预测。在这种情况下,机器学习可以预测网络元素的存在而不是属性(无论是静态或动态)的整个网络。这项工作还让读者想起这个特殊问题,机器学习在网络科学可以涉及不同类型的数据。事实上,研究表明自然语言处理(NLP)技术的价值,因为他们比network-theoretic模型在预测经验数据。
分析实证大规模网络数据的能力是一个关键问题弗洛伊德和Giabbanelli18的研究考察了运行时当代节点中心措施基于网络的属性(例如,小世界、无标度、随机)。研究依赖于一个精心设计的过程生成网络的不同属性,有一个类似的密度,因此隔离性质的影响到运行时的中心算法。强调了网络一代的重要性,这是一个反复出现的主题在研究这个特殊的问题。研究还指出,潜在的利用gpu加速计算节点中心的一种手段,因此回到gpu加速的第一篇论文。这个例子中,其中,提醒读者,这个特殊问题的文章肯定可以独立阅读,但未来创新可能会实现当考虑在一起。事实上,这个特殊的问题是丰富的多样性的文章,由他们统一集中在可伸缩性,但方法通过不同的方法。我们因此希望这种组合的共享目标和不同的技能组合将提供一个研究团体的灵感,促进成果的思想交流。
作者的贡献
PG写了这篇社论。所有作者批准提交的版本。
的利益冲突
作者声明,这项研究是在没有进行任何商业或财务关系可能被视为一个潜在的利益冲突。
出版商的注意
本文表达的所有索赔仅代表作者,不一定代表的附属组织,或出版商、编辑和审稿人。任何产品,可以评估在这篇文章中,或声称,可能是由其制造商,不保证或认可的出版商。
关键词:大数据分析,图表采矿、网络分析、网络仿真,可扩展的算法
引用:Giabbanelli PJ, Swarup S, R和Mangioni Lambiotte G(2022)编辑:可伸缩的网络一代&分析。前面。大数据5:984256。doi: 10.3389 / fdata.2022.984256
收到:2022年7月1日;接受:2022年7月14日;
发表:2022年7月25日。
编辑和审核:Nitesh诉拉美国圣母大学
版权©2022 Giabbanelli、Swarup Lambiotte Mangioni。这是一个开放分布式根据文章知识共享归属许可(CC)。使用、分发或复制在其他论坛是允许的,提供了原始作者(年代)和著作权人(s)认为,最初发表在这个期刊引用,按照公认的学术实践。没有使用、分发或复制是不符合这些条件的允许。
*通信:菲利普j . Giabbanelligiabbapj@miamioh.edu