مسیرهای ناوبری Wikispeedia
اطلاعات دیتاست
فایل ها
عنوان | حجم |
wikispeedia_articles_html.tar.gz | 754 MB |
wikispeedia_articles_plaintext.tar.gz | 34 MB |
wikispeedia_paths-and-graph.tar.gz | 9.4 MB |
منبع (استناد)
- Robert West and Jure Leskovec: Human Wayfinding in Information Networks.21st International World Wide Web Conference (WWW),
- Robert West, Joelle Pineau, and Doina Precup: Wikispeedia: An Online Game for Inferring Semantic Distances between Concepts.21st International Joint Conference on Artificial Intelligence (IJCAI),
آمارهای دیتاست
Finished paths |
51,318 |
Unfinished paths |
24,875 |
Articles |
4,604 |
Links |
119,882 |
شبکه رای گیری ویکی پدیا
اطلاعات دیتاست
فایل ها
عنوان | حجم |
wiki-Vote.txt.gz | 284 KB |
منبع(استناد)
- Leskovec, D. Huttenlocher, J. Kleinberg. Signed Networks in Social Media. CHI 2010.
- Leskovec, D. Huttenlocher, J. Kleinberg. Predicting Positive and Negative Links in Online Social Networks. WWW 2010.
آمارهای دیتاست
Nodes |
7115 |
Edges |
103689 |
Nodes in largest WCC |
7066 (0.993) |
Edges in largest WCC |
103663 (1.000) |
Nodes in largest SCC |
1300 (0.183) |
Edges in largest SCC |
39456 (0.381) |
Average clustering coefficient |
0.1409 |
Number of triangles |
608389 |
Fraction of closed triangles |
0.04564 |
Diameter (longest shortest path) |
7 |
90-percentile effective diameter |
3.8 |
شبکه گفتگوی ویکی پدیا
اطلاعات دیتاست
فایل ها
عنوان | حجم |
wiki-Talk.txt.gz | 16.16 MB |
منبع(استناد)
- Leskovec, D. Huttenlocher, J. Kleinberg. Signed Networks in Social Media. CHI 2010.
- Leskovec, D. Huttenlocher, J. Kleinberg. Predicting Positive and Negative Links in Online Social Networks. WWW 2010.
آمارهای دیتاست
Nodes |
2394385 |
Edges |
5021410 |
Nodes in largest WCC |
2388953 (0.998) |
Edges in largest WCC |
5018445 (0.999) |
Nodes in largest SCC |
111881 (0.047) |
Edges in largest SCC |
1477893 (0.294) |
Average clustering coefficient |
0.0526 |
Number of triangles |
9203519 |
Fraction of closed triangles |
0.001112 |
Diameter (longest shortest path) |
9 |
90-percentile effective diameter |
4 |
اطلاعات انتخابات مدیر ویکی پدیا
اطلاعات دیتاست
ویکی پدیا یک دائره المعارف رایگان است که توسط همکاری داوطلبان در سراسر جهان نوشته شده است. بخش کوچکی از همکاران ویکیپدیا، مدیران هستند که کاربرانی هستند که دسترسی به ویژگی های فنی اضافه ای دارند که به نگهداری کمک می کنند. برای اینکه یک کاربر تبدیل به یک مدیر شود، یک درخواست برای مدیریت (RfA) صادر می شود و جامعه ویکی پدیا از طریق یک بحث عمومی یا رای گیری تصمیم می گیرد که چه کسی برای ارتقاء به مدیریت انتخاب شود.
فایل ها
عنوان | حجم |
wikiElec.ElecBs3.txt.gz | 1 MB |
منبع(استناد)
- Leskovec, D. Huttenlocher, J. Kleinberg. Signed Networks in Social Media. CHI 2010.
- Leskovec, D. Huttenlocher, J. Kleinberg. Predicting Positive and Negative Links in Online Social Networks. WWW 2010.
فرمت دیتاست
T: time election was closed
U: user id (and screen name) of editor that is being considered for promotion
N: user id (and screen name) of the nominator
V: vote(1:support, 0:neutral, -1:oppose) user_id time screen_name
درخواست های ویکی پدیا برای مدیر (با متن)
اطلاعات دیتاست
در ویرایشگر ویکی پدیا برای تبدیل شدن به یک مدیر، یک درخواست برای مدیریت(RfA) باید توسط یک نامزد یا یکی دیگر از اعضای جامعه ارسال شود. پس از آن، هر عضو ویکی پدیا ممکن است رای مثبت یا خنثی یا مخالف می دهد. پس از تصویب فرآیند RfA در سال 2003 از اواسط ماه مه سال 2013، همه رای ها را تجزیه و تحلیل شد.
فایل ها
عنوان | حجم |
wiki-RfA.txt.gz | 14 MB |
منبع(استناد)
- Robert West, Hristo S. Paskov, Jure Leskovec, and Christopher Potts: Exploiting Social Network Structure for Person-to-Person Sentiment Analysis.Transactions of the Association for Computational Linguistics, 2(Oct):297–310, 2014.
آمارهای دیتاست
Nodes |
10,835 |
Edges |
159,388 |
Triangles |
956,428 |
تاریخ ویرایش کامل ویکی پدیا(تا ژانویه 2008)
اطلاعات دیتاست
داده ها شامل تاریخ کامل ویرایش (همه اصلاحات، همه صفحات) تمام ویکیپدیا از زمان تأسیس آن تا ژانویه 2008 است.
دو بخش از مجموعه داده وجود دارد:
- تاریخ ویرایش کامل ویکیپدیا
- ویرایش تاریخچه ویکی پدیا (تهیه شده توسط Gueorgi Kossinets)
تاریخچه ویرایش کامل Wikipedia
عنوان | حجم |
enwiki-20080103-pages-meta-history.xml.7z | 17.3 GB |
منبع(استناد)
- Leskovec, D. Huttenlocher, J. Kleinberg. Governance in Social Media: A case study of the Wikipedia promotion process. AAAI International Conference on Weblogs and Social Media (ICWSM '10), 2010.
- Kossinets. Processed Wikipedia Edit History. Stanford large network dataset collection.
فایل ها
عنوان | حجم |
enwiki-20080103.main.bz2 | 8.1 GB |
enwiki-20080103.talk.bz2 | 665 MB |
enwiki-20080103.user.bz2 | 684 MB |
enwiki-20080103.user_talk.bz2 | 800 MB |
enwiki-20080103.wikipedia.bz2 | 3.1 GB |
enwiki-20080103.wikipedia_talk.bz2 | 125 MB |
کلاهبرداری از ویکی پدیا
اطلاعات دیتاست
ویکی پدیا بیش از 35 میلیون مقاله در بیش از 290 زبان دارد. با این حال، تمام مقالات واقعی نیستند. مقالات محرمانه مقالات کاملا ساختگی است که برای گمراه کردن مردم ایجاد شده است. در مقاله ای که در زیر آورده شده است، تمام مواردی را که واقعا در مورد نسخه های انگلیسی ویکی پدیا وجود دارد، بررسی شده است. اکثر آنها به طور دائمی از تاریخچه نسخه ویکیپدیا حذف شده اند، بنابراین دسترسی به این اطلاعات تحت یک توافقنامه محرمانه صورت گرفته است.
منبع(استناد)
- Srijan Kumar, Robert West, and Jure Leskovec: Disinformation on the Web: Impact, Characteristics, and Detection of Wikipedia Hoaxes.Proceedings of the International Conference on the World Wide Web, 2016.
فایل ها
عنوان | حجم |
wiki-hoaxes.zip | 1 MB |