مجموعه داده CiteSeer
دیتاست CiteSeer یک دیتاست گرافی (مرتبط با شبکه های عصبی گرافی) از جنس دیتاستهای شبکهی ارجاعات مقالات است که در مقاله ی “Revisiting Semi-Supervised Learning with Graph Embeddings” مورد استفاده قرار گرفته است. در این دیتاست، گرهها نماینده سندها هستند و یالها نماینده پیوندهای ارجاعی بین آنها هستند. همچنین، این دیتاست شامل سه بخش train، validation و test میباشد که به صورت ماسک باینری تعیین شدهاند.
در جدو زیر تعداد کلاسها و ویژگی ها و یالها آورده شده است:
Name | #nodes | #edges | #features | #classes |
---|---|---|---|---|
CiteSeer | 3,327 | 9,104 | 3,703 | 6 |
مجموعه داه ی CiteSeer و مجموعه داده Cora هر دو شامل مقالات علمی و ارجاع های بین آنها هستند. با این حال، چند تفاوت اصلی بین این دو وجود دارد.
یک تفاوت اصلی این است که Cora شامل گروه محدودی از مقالات در زمینه یادگیری ماشین است، در حالی که CiteSeer شامل مقالات علمی در تمام حوزههای علمی است.
دیدگاهتان را بنویسید