|
数据集介绍:
多维网络由各种类型的交互组成,可用于研究异构交互中的共享社区。
节点数量:15088 边数:5574249
数据集信息:
包括6个文件:
1. nodes.csv
- 它是所有用户的文件。该文件作为该数据集中所有用户的字典。这对快速参考很有用。它包含数据集中使用的所有节点标识。
2. [1-5] -edges.csv
- 它们是交互的csv格式。每个csv文件代表一种交互类型。它由三列组成,前两个代表用户ID,最后一个代表交互强度。下面是一个例子:
1,58,3 用户1和58之间的交互强度是3.
我们的网络是对称的,所以我们只显示一次交互。也就是说,如果1,58,3已经存在,则不会显示出1,3,5。
属性信息:
这是从YouTube上检索的数据集,YouTube是一个视频共享网站,用户之间进行各种互动。特别是,我们抓取了30,522个用户配置文件。对于每个用户,我们都会抓取他/她的联系人,订阅和收藏的视频。为避免样本选择偏倚,我们选择100个最近上传的视频作为种子集。该爬行总共达到848,003个用户和1,299,642个视频。但是,并非所有用户都共享各种信息。删除这些用户后,我们有15,088个活动用户配置文件。
基于抓取的信息,我们构建了1588个用户之间的5个不同的交互。具体来说,它们是:
1.1588个用户之间的联系网络;
2. 848,003(不包括15,088)联系人中两个用户之间共享朋友的数量;
3.两个用户之间共享订阅的数量;
4.两个用户之间的共享用户数量;
5.共享的优惠视频的数量。
下载地址:
|
|