Temporal Link Prediction: A Survey时间链路预测综述

摘要:
关键词:动态网络·临时网络·链接预览1下图显示了时变网络的三种常见表示形式,有助于捕获网络的动态快照:网络表示为一系列静态网络,每个步骤一个。从时间步骤1到时间步骤t,我们如何预测下一个时间步骤Gt+1网络2.3时间链路预测评估指标Areundercurve:AUC被广泛用作链路预测评估指示符。扩展时间链预测以纳入归因网络将是未来一项有前途的任务。

Keywords:Dynamic networks · Temporal networks · Link prediction

1 介绍

下图表示时变网络的三种常见表示,它们有助于捕获网络的动态

  • 快照:网络被表示为一系列静态网络,每一步一个。
  • 接触序列:如果交互持续时间可以忽略不计,则将网络表示为三个一组(i, j, t),其中i和j为实体,t为交互时间。
  • 区间图:若交互持续时间不可忽略,T(e)={(t1, t1 1),…,(tn,t n)},边缘e处于活动状态。

Temporal Link Prediction: A Survey时间链路预测综述第1张

 2 背景

2.1 静态网络的链路预测

大多数算法都是将静态网络在特定时间段内进行预测,从而忽略了网络的时间特性。在静态网络中,链路预测是对网络中某一时刻缺少的链路进行预测,以获得网络的全貌。

2.2 Temporal Link Prediction: Problem Definition时间链路预测定义

让G = (V, E)是一个动态的网络,V是顶点的集合和每条边(u, V)휖E代表u和V之间的联系的快照G表示为G1, G2,……从时间步骤1到t,我们如何预测下一个时间步骤Gt+1的网络

Temporal Link Prediction: A Survey时间链路预测综述第2张

2.3 时间链路预测的评估指标

(1)Area under curve(AUC):AUC 被广泛的用来作为链路预测评估指标。这个度量可以解释为随机选择的缺失链路比随机选择的不存在的链路获得更高的分数的概率,前提是所有未观察到的链路的排名。此度量的值在 0 和 1 之间。在 n 个独立比较中,如果缺失的链接有 n′ 得分较高,n′′相同,则 AUC 得分计算如下:
Temporal Link Prediction: A Survey时间链路预测综述第3张
 
(2)Mean average precision(MAP):此度量是平均精度(AP)的扩展,其中计算所有 AP 的平均值以获得MAP 分数。它估计每个节点的精度并计算所有节点的平均值。计算如下:
Temporal Link Prediction: A Survey时间链路预测综述第4张
(3)Area under precision recall(AUPR):AUPR 与召回反精确性密谋。它被认为是解决不平衡分类问题的一种更为相关的措施。
Temporal Link Prediction: A Survey时间链路预测综述第5张
(4)F1-score:F1-score (F-score or F-measure) 是测试准确性的衡量标准。它同时考虑了测试的精确度和召回率来计算分数。该指标计算如下:
Temporal Link Prediction: A Survey时间链路预测综述第6张 3 时间链路预测技术

(1)矩阵分解(Matrix Factorization)

大致步骤:
  • 动态网络以矩阵形式表示(例如:邻接矩阵);
  • 各种低阶近似算法被用来表征和提取动态网络的基本特征;
  • 引入了几个参数以有效地捕获时间信息和网络属性;
  • 执行基于潜在特征的获得的时间链路预测。

Temporal Link Prediction: A Survey时间链路预测综述第7张

 (2)概率方法(Probabilistic Approaches) 

大致步骤:
  • 动态网络表示为定期间隔的快照序列;
  • 最大似然方法或概率分布(如联合概率分布,伯纳利分布等)用于推断未来链接的可能性。

Temporal Link Prediction: A Survey时间链路预测综述第8张

 (3)光谱聚类(Spectral Clustering)

大致步骤:
  • 动态网络以拉普拉斯矩阵的形式表示为一系列快照;
  • 图谱和图拉普拉斯图的低秩逼近形成了链路预测的基本特征;
  • 时间序列预测模型和线性系统模型等几种模型用于预测未来时间的特征向量;
  • 执行基于预测的特征向量执行链路预测。

Temporal Link Prediction: A Survey时间链路预测综述第9张

 (4)时间序列(Time Series)

大致步骤:
  • 动态网络表示为不同时间段的快照序列;
  • 对于网络中的每对节点,都基于各种节点相似性度量来构建时间序列;
  • 使用时间序列预测模型以预测未来时间段的时间序列得分;
  • 执行基于预测分数执行链路预测。

Temporal Link Prediction: A Survey时间链路预测综述第10张

(5)深度学习(Deep learning)

(5.1) 基于嵌入的时态链路预测(Embedding‑Based Temporal Link Prediction) 
 
大致步骤:
  • 为了捕获时间方面,将动态网络表示为快照序列或联系序列或间隔图;
  • 通过保留所有网络属性,使用各种基于深度学习的技术以将网络嵌入到低维向量空间中;
  • 可以预测未来一段时间的嵌入情况,从而确定该时间的网络结构;
  • 执行基于预测嵌入的时间链路预测。

Temporal Link Prediction: A Survey时间链路预测综述第11张

(5.2) 基于受限玻尔兹曼机(RBM)(Restricted Boltzmann Machine (RBM) Based) 

大致步骤:
  • 动态网络以固定间隔的快照序列表示;
  • 基于对动态网络结构的观察序列,可以对结合了时间和邻近信息的 RBM 模型进行训练;
  • 计算邻居连接的概率以执行时间链路预测。 

Temporal Link Prediction: A Survey时间链路预测综述第12张

(6) 其他方法

4、未来方向

矩阵分解技术结合了动态网络的线性特征。 为了提高预测精度,可以进行进一步的改进以考虑时间网络的非线性变化的复杂模式。 大多数概率方法采用最大似然方法。 与费时的最大似然方法相反,概率多层模型可以扩展为包含无向动态网络。 与其使用像FIR滤波器之类的单一线性系统模型,不如扩展基于频谱聚类的技术来部署分布式滤波器以捕获不同用户的潜在特征,这将更好。 时间序列可以有效地捕获网络的演变模式。 但是,计算保留所有网络属性的时间序列分数仍然是一项艰巨的任务。 此外,传统的时间序列预测技术无法捕获网络的非耳式变化时间模式。 因此,通过结合网络的非线性变化的时间模式来预测未来分数的有效时间序列预测方法可以提高时间链路预测的准确性。 嵌入技术通过保留所有网络属性,在将网络映射到低维空间中表现出出色的性能。 从嵌入中构造的时间序列得分将有效地捕获网络的不断发展的本质。 此外,在此时间序列上部署有效的时间序列预测模型将提高时间链接预测的准确性。

本文讨论的时间链路预测技术是在网络中的节点在所有时间段内保持相同的假设下进行的。 但是,在现实世界的异构网络中,节点和边都随时间增加或删除。 如何扩展时间链路预测技术以合并异构网络仍然是一个悬而未决的问题。 此外,绝大多数现实世界网络都与一组丰富的节点属性相关联,并且它们的属性值也有所不同。 扩展时间链路预测以合并归因网络将是未来的一项有前途的任务。 可以在现有系统中进行进一步的改进以减少计算复杂度,从而提高性能。

免责声明:文章转载自《Temporal Link Prediction: A Survey时间链路预测综述》仅用于学习参考。如对内容有疑问,请及时联系本站处理。

上篇h5解决移动端上滑卡顿问题解决fiddler无法抓取本地部署项目的请求问题下篇

宿迁高防,2C2G15M,22元/月;香港BGP,2C5G5M,25元/月 雨云优惠码:MjYwNzM=

相关文章

时间序列八: 以NASA之名: 卡尔曼滤波器

以NASA之名: 卡尔曼滤波器 'That's one small step for man,one giant leap for mankind.' — Neil Alden Armstron 目录 以NASA之名: 卡尔曼滤波器 引言 荣耀骑士 卡尔曼滤波器* 参考文献: 引言 二十世纪的阿波罗登月计划在人类历史上是浓墨重彩的一笔, 是人类...

Prometheus介绍及二进制部署(一)

一、Prometheus是什么 Prometheus是什么Prometheus(普罗米修斯)是一个最初在SoundCloud上构建的监控系统。自2012年成为社区开源项目,拥有非常活跃的开发人员和用户社区。为强调开源及独立维护,Prometheus于2016年加入云原生云计算基金会(CNCF),成为继Kubernetes之后的第二个托管项目。 https:...

ggplot2绘图入门系列之五:时间序列(完)

ggplot2包也能对时间序列数据绘图,但在处理上需要有些注意的地方。下面我们以上证指数为例进行作图,首先利用quantmod包从yahoo数据源获取从1997年以来的数据,存于变量SSEC中,抽取收盘数字,然后分别提取时间数据和指数数值,绘图结果如下图。 1 library(quantmod) 2 library(ggplot2) 3 getSymbol...

【时间序列】-航空数据预测

学习预测时序数据,如有侵权,请联系删除。 主要参考: A comprehensive beginner’s guide to create a Time Series Forecast (with Codes in Python)   目的: 翻译学习文章编写方式 学习解决时间序列问题的基本步骤   介绍 时间序列(从现在开始称为TS)被认为是数据科学...

python代写用广义加性模型GAM进行时间序列分析

原文:http://tecdat.cn/?p=4130 每当你发现一个与时间对应的趋势时,你就会看到一个时间序列。研究金融市场表现和天气预报的事实上的选择,时间序列是最普遍的分析技术之一,因为它与时间有着不可分割的关系 - 我们总是有兴趣预测未来。 时间相关模型一种直观的预测方法是参考最近的时间点。今天的股价可能会比昨天的价格更接近五年前的价格。因此,在...

时间序列预测——深度好文,ARIMA是最难用的(数据预处理过程不适合工业应用),线性回归模型简单适用,预测趋势很不错,xgboost的话,不太适合趋势预测,如果数据平稳也可以使用。

补充:https://bmcbioinformatics.biomedcentral.com/articles/10.1186/1471-2105-15-276 如果用arima的话,还不如使用随机森林。。。   原文地址:https://medium.com/open-machine-learning-course/open-machine-learni...