ufi-large
اطلاعات دیتاست
این مجموعه داده شامل "حلقه ها(circles)" (یا "لیست دوستان") از فیس بوک است. داده های فیس بوک با استفاده از این برنامه Facebook app ،از شرکت کنندگان بررسی شده جمع آوری شده است. مجموعه داده ها شامل ویژگی های node (پروفایل)، حلقه ها و ego networks است.
فایل ها
عنوان | حجم |
facebook.tar.gz | 715 KB |
facebook_combined.txt.gz | 213.5 KB |
readme-Ego.txt | 834 B |
منبع (استناد)
- J. McAuley and J. Leskovec. Learning to Discover Social Circles in Ego Networks. NIPS, 2012.
آمارهای دیتاست
Nodes |
4039 |
Edges |
88234 |
Nodes in largest WCC |
4039 (1.000) |
Edges in largest WCC |
88234 (1.000) |
Nodes in largest SCC |
4039 (1.000) |
Edges in largest SCC |
88234 (1.000) |
Average clustering coefficient |
0.6055 |
Number of triangles |
1612010 |
Fraction of closed triangles |
0.2647 |
Diameter (longest shortest path) |
8 |
90-percentile effective diameter |
4.7 |
حلقه های اجتماعی : +google
اطلاعات دیتاست
این مجموعه داده شامل "حلقه ها" ازGoogle+ است. داده هایGoogle+ از کاربرانی جمع آوری شده است که به صورت دستی حلقه های خود را با استفاده از ویژگی «اشتراک حوزه(circle)» به اشتراک گذاشتند. dataset شامل ویژگی های گره (پروفایل)، حلقه ها و ego networks است.
فایل ها
عنوان | حجم |
gplus.tar.gz | 393.5 MB |
gplus_combined.txt.gz | 380.4 MB |
readme-Ego_2.txt | 834 B |
منبع(استناد)
- McAuley and J. Leskovec. Learning to Discover Social Circles in Ego Networks. NIPS, 2012.
آمارهای دیتاست
Nodes |
107614 |
Edges |
13673453 |
Nodes in largest WCC |
107614 (1.000) |
Edges in largest WCC |
13673453 (1.000) |
Nodes in largest SCC |
69501 (0.646) |
Edges in largest SCC |
9168660 (0.671) |
Average clustering coefficient |
0.4901 |
Number of triangles |
1073677742 |
Fraction of closed triangles |
0.6552 |
Diameter (longest shortest path) |
6 |
90-percentile effective diameter |
3 |
حلقه های اجتماعی : توئیتر
اطلاعات دیتاست
این مجموعه داده شامل "حلقه ها" (یا "لیست ها") از توییتر است. اطلاعات توییتر از منابع عمومی گرفته شده است. مجموعه داده شامل ویژگی های گره (پروفایل)، حلقه ها و ego networks است.
فایل ها
عنوان | حجم |
readme-Ego.txt | 834 B |
twitter_combined.txt.gz | 10.1 MB |
twitter.tar.gz | 21.3 MB |
منبع(استناد)
- McAuley and J. Leskovec. Learning to Discover Social Circles in Ego Networks. NIPS, 2012.
آمارهای دیتاست
Nodes |
81306 |
Edges |
1768149 |
Nodes in largest WCC |
81306 (1.000) |
Edges in largest WCC |
1768149 (1.000) |
Nodes in largest SCC |
68413 (0.841) |
Edges in largest SCC |
1685163 (0.953) |
Average clustering coefficient |
0.5653 |
Number of triangles |
13082506 |
Fraction of closed triangles |
0.06415 |
Diameter (longest shortest path) |
7 |
90-percentile effective diameter |
4.5 |
شبکه اجتماعی Epinions
اطلاعات دیتاست
یک شبکه اجتماعی آنلاین who-trust-whom است که به مصرف کنندگان کالا اجازه می دهد رتبه بندی، نظرات، عقاید و بررسی کامل محصول را به سایت Epinions.com. ارسال کنند. اعضای سایت می توانند تصمیم بگیرند آیا به هم اعتماد کنند یا خیر.
فایل ها
عنوان | حجم |
soc-Epinions1.txt.gz | 1.6 MB |
منبع(استناد)
- M. Richardson and R. Agrawal and P. Domingos. Trust Management for the Semantic Web. ISWC, 2003.
آمارهای دیتاست
Nodes |
75879 |
Edges |
508837 |
Nodes in largest WCC |
75877 (1.000) |
Edges in largest WCC |
508836 (1.000) |
Nodes in largest SCC |
32223 (0.425) |
Edges in largest SCC |
443506 (0.872) |
Average clustering coefficient |
0.1378 |
Number of triangles |
1624481 |
Fraction of closed triangles |
0.0229 |
Diameter (longest shortest path) |
14 |
90-percentile effective diameter |
5 |
شبکه اجتماعی LiveJournal
اطلاعات دیتاست
LiveJournal یک اجتماع آنلاین آزاد با بیش از 10 میلیون کاربر؛ بخش قابل توجهی از این اعضا بسیار فعال هستند. (به عنوان مثال، حدود 300،000 مطلب خود را در هر دوره 24 ساعته به روز رسانی می کنند.) LiveJournal اجازه می دهد تا اعضای مجلات، وبلاگ های فردی و گروهی را حفظ کنند و این به افراد اجازه می دهد که اعلام کنند اعضای دیگر دوستشان هستند.
فایل ها
عنوان | حجم |
soc-LiveJournal1.txt.gz | 247.6 MB |
منبع(استناد)
- Backstrom, D. Huttenlocher, J. Kleinberg, X. Lan. Group Formation in Large Social Networks: Membership, Growth, and Evolution. KDD, 2006.
- Leskovec, K. Lang, A. Dasgupta, M. Mahoney. Community Structure in Large Networks: Natural Cluster Sizes and the Absence of Large Well-Defined Clusters. Internet Mathematics 6(1) 29--123, 2009.
آمارهای دیتاست
Nodes |
4847571 |
Edges |
68993773 |
Nodes in largest WCC |
4843953 (0.999) |
Edges in largest WCC |
68983820 (1.000) |
Nodes in largest SCC |
3828682 (0.790) |
Edges in largest SCC |
65825429 (0.954) |
Average clustering coefficient |
0.2742 |
Number of triangles |
285730264 |
Fraction of closed triangles |
0.04266 |
Diameter (longest shortest path) |
16 |
90-percentile effective diameter |
6.5 |
شبکه اجتماعی Pokec
اطلاعات دیتاست
Pokec محبوب ترین شبکه اجتماعی در اسلواکی است. محبوبیت این شبکه حتی پس از ورود فیس بوک نیز تغییر نکرده است. Pokec بیش از 10 سال است که ارائه شده و بیش از 1.6 میلیون نفر را به یکدیگر متصل می کند. مجموعه داده ها حاوی اطلاعات ناشناس از کل شبکه است. اطلاعات پروفایل شامل جنسیت، سن، سرگرمی، علاقه و غیره می شود. داده های پروفایل به زبان اسلواکی هستند.
فایل ها
عنوان | حجم |
soc-pokec-profiles.txt.gz | 415.3 MB |
soc-pokec-readme.txt | 3.9 KB |
soc-pokec-relationships.txt.gz | 126.3 MB |
منبع(استناد)
- Takac, M. Zabovsky. Data Analysis in Public Social Networks, International Scientific Conference & International Workshop Present Day Trends of Innovations, May 2012 Lomza, Poland.
آمارهای دیتاست
Nodes |
1632803 |
Edges |
30622564 |
Nodes in largest WCC |
1632803 (1.000) |
Edges in largest WCC |
30622564 (1.000) |
Nodes in largest SCC |
1304537 (0.799) |
Edges in largest SCC |
29183655 (0.953) |
Average clustering coefficient |
0.1094 |
Number of triangles |
32557458 |
Fraction of closed triangles |
0.01611 |
Diameter (longest shortest path) |
11 |
90-percentile effective diameter |
5.2 |
شبکه اجتماعی Slashdot، نوامبر 2008
اطلاعات دیتاست
Slashdot یک وبگاه خبری مرتبط با فناوری است که مالک آن شرکت گیکنت است. در سال 2002 ویژگی Slashdot Zoo را معرفی کرد که به کاربران اجازه می داد تا یکدیگر را به عنوان دوستان یا دشمنان برچسب گذاری کنند. این شبکه شامل لینک های دوست/طرفدار (friend/foe) بین کاربران Slashdot است.
فایل ها
عنوان | حجم |
soc-Slashdot0811.txt.gz | 3 MB |
منبع(استناد)
- Leskovec, K. Lang, A. Dasgupta, M. Mahoney. Community Structure in Large Networks: Natural Cluster Sizes and the Absence of Large Well-Defined Clusters. Internet Mathematics 6(1) 29--123, 2009.
آمارهای دیتاست
Nodes |
77360 |
Edges |
905468 |
Nodes in largest WCC |
77360 (1.000) |
Edges in largest WCC |
905468 (1.000) |
Nodes in largest SCC |
70355 (0.909) |
Edges in largest SCC |
888662 (0.981) |
Average clustering coefficient |
0.0555 |
Number of triangles |
551724 |
Fraction of closed triangles |
0.008184 |
Diameter (longest shortest path) |
10 |
90-percentile effective diameter |
4.7 |
شبکه اجتماعی Slashdot، فوریه 2009
اطلاعات دیتاست
Slashdot یک وبگاه خبری مرتبط با فناوری است که مالک آن شرکت گیکنت است. در سال 2002 ویژگی Slashdot Zoo را معرفی کرد که به کاربران اجازه می داد تا یکدیگر را به عنوان دوستان یا دشمنان برچسب گذاری کنند. این شبکه شامل لینک های دوست/طرفدار (friend/foe) بین کاربران Slashdot است. این شبکه درفوریه 2009 به دست آمد.
فایل ها
عنوان | حجم |
soc-Slashdot0902.txt.gz | 3.1 MB |
منبع(استناد)
- Leskovec, K. Lang, A. Dasgupta, M. Mahoney. Community Structure in Large Networks: Natural Cluster Sizes and the Absence of Large Well-Defined Clusters. Internet Mathematics 6(1) 29--123, 2009.
آمارهای دیتاست
Nodes |
82168 |
Edges |
948464 |
Nodes in largest WCC |
82168 (1.000) |
Edges in largest WCC |
948464 (1.000) |
Nodes in largest SCC |
71307 (0.868) |
Edges in largest SCC |
912381 (0.962) |
Average clustering coefficient |
0.0603 |
Number of triangles |
602592 |
Fraction of closed triangles |
0.008168 |
Diameter (longest shortest path) |
11 |
90-percentile effective diameter |
4.7 |
شبکه رای گیری ویکی پدیا
اطلاعات دیتاست
فایل ها
عنوان | حجم |
wiki-Vote.txt.gz | 283.5 KB |
منبع(استناد)
- Leskovec, D. Huttenlocher, J. Kleinberg. Signed Networks in Social Media. CHI 2010.
- Leskovec, D. Huttenlocher, J. Kleinberg. Predicting Positive and Negative Links in Online Social Networks. WWW 2010.
آمارهای دیتاست
Nodes |
7115 |
Edges |
103689 |
Nodes in largest WCC |
7066 (0.993) |
Edges in largest WCC |
103663 (1.000) |
Nodes in largest SCC |
1300 (0.183) |
Edges in largest SCC |
39456 (0.381) |
Average clustering coefficient |
0.1409 |
Number of triangles |
608389 |
Fraction of closed triangles |
0.04564 |
Diameter (longest shortest path) |
7 |
90-percentile effective diameter |
3.8 |
درخواست ویکی پدیا برای مدیر (با متن)
اطلاعات دیتاست
در ویرایشگر ویکی پدیا برای تبدیل شدن به یک مدیر، یک درخواست برای مدیریت(RfA) باید توسط یک نامزد یا یکی دیگر از اعضای جامعه ارسال شود. پس از آن، هر عضو ویکی پدیا ممکن است رای مثبت ، ممتنع یا مخالف بدهد. پس از تصویب فرآیند RfA در سال 2003 از اواسط ماه مه سال 2013، همه رای ها تجزیه و تحلیل شد.
فایل ها
عنوان | حجم |
wiki-RfA.txt.gz | 14.3 MB |
منبع(استناد)
- Robert West, Hristo S. Paskov, Jure Leskovec, and Christopher Potts: Exploiting Social Network Structure for Person-to-Person Sentiment Analysis. Transactions of the Association for Computational Linguistics, 2(Oct):297–310, 2014.
آمارهای دیتاست
Nodes |
10,835 |
Edges |
159,388 |
Triangles |
956,428 |
شبکه اعتماد Bitcoin OTC
اطلاعات دیتاست
این who-trusts-whom (چه کسی به چه کسی اعتماد دارد) است، شبکه ای از افرادی که با استفاده از Bitcoin در پلت فرم Bitcoin OTC تجارت می کنند. از آنجا که کاربران بیت کوین ناشناس هستند، نیاز به نگهداری سابقه کاربران برای جلوگیری از معاملات با کاربران متقلب و مخاطره آمیز وجود دارد. اعضای Bitcoin OTC، اعضای دیگر را در یک مقیاس منفی10 (مجموع عدم اعتماد) تا مثبت 10 (مجموع اعتماد) در مراحل 1. امتیاز دهی می کنند. این نخستین شبکه ای است که برای تحقیق در نظر گرفته شده است.
فایل ها
عنوان | حجم |
soc-sign-bitcoinotc.csv.gz | 388 KB |
منبع(استناد)
- Kumar, F. Spezzano, V.S. Subrahmanian, C. Faloutsos. Edge Weight Prediction in Weighted Signed Networks. IEEE International Conference on Data Mining (ICDM), 2016.
آمارهای دیتاست
|
|
Edges |
35,592 |
Range of edge weight |
-10 to +10 |
Percentage of positive edges |
89% |
شبکه اعتماد Bitcoin Alpha
اطلاعات دیتاست
این who-trusts-whom (چه کسی به چه کسی اعتماد دارد) است، شبکه ای از افرادی که با استفاده از Bitcoin در پلت فرم Bitcoin Alpha تجارت می کنند. از آنجا که کاربران بیت کوین ناشناس هستند، نیاز به نگهداری سابقه کاربران برای جلوگیری از معاملات با کاربران متقلب و مخاطره آمیز وجود دارد. اعضای Bitcoin Alpha ، اعضای دیگر را در یک مقیاس منفی10 (مجموع عدم اعتماد) تا مثبت 10 (مجموع اعتماد) در مراحل 1. امتیاز دهی می کنند. این نخستین شبکه ای است که برای تحقیق در نظر گرفته شده است.
فایل ها
عنوان | حجم |
soc-sign-bitcoinalpha.csv.gz | 146 KB |
منبع(استناد)
- Kumar, F. Spezzano, V.S. Subrahmanian, C. Faloutsos. Edge Weight Prediction in Weighted Signed Networks. IEEE International Conference on Data Mining (ICDM), 2016.
آمارهای دیتاست
|
|
Edges |
24,186 |
Range of edge weight |
-10 to +10 |
Percentage of positive edges |
93% |