اخبار و رویدادها
تولید خلاصه خط سیر زمانی رخدادهای خبری در توئیتر
تولید خلاصه خط سیر زمانی رخدادهای خبری در توئیتر
فراگیری شبکه اجتماعی برخط، توسعهی بیسابقهای را در سالهای اخیر شاهد بوده است. همزمان که سرویسهای شبکه اجتماعی به صورت تصاعدی در بخشهای مختلف جامعه نفوذ میکنند، ارزش اطلاعاتی که توسط چنین سیستمهایی تولید میشود، به طرز فوقالعادهای افزایش مییابد. در واقع، تعاملات و ارتباطات در رسانه اجتماعی غالباً رخدادهای دنیای واقعی را بازتاب میدهند. در این میان توییتر با نزدیک به 600 میلیون کاربر، محبوبترین سایت سرویسدهندهی خدمات ریزبلاگی است و روزانه بیش از 300 میلیون توییت منتشر میکند. علاوه بر اشتراک اطلاعات، کاربران برای کسب اطلاعات دربارهی اخبار و رخدادهای بلادرنگ نیز به توییتر مراجعه میکنند، به طوریکه موتور جستجوی توییتر روزانه پاسخگوی بیش از 2.1 میلیارد پرسوجو است.
از سوی دیگر حجم و سرعت بالای تولید وانتشار اطلاعات در این شبکه موجب شده تا بار سنگین اطلاعات، فرایند پردازش آن را برای کاربران دشوار و گاه غیرممکن سازد. بنابراین روشهای خودکاری برای سازماندهی و خلاصهسازی خطسیر زمانی رخدادهای خبری لازم است تا کاربران توییتر راحتتر به اطلاعات مرتبط و کلیدی که در میان توییتها پخش شده است، دسترسی پیدا کنند.
از سوی دیگر، ذات ناهمگون توییتها، محدودیت در طول پستها و افزونگی زیاد در جریان توییتها، مسألهی ارائهی یک تصویر کلی از مهمترین رخدادهای خبری و ارتباط میان این رخدادها به صورت ساختیافته را با چالش روبرو کرده است. هدف ما در این پژوهش این است که تصویر جامعی از مهمترین رویدادهای مربوط به یک موضوع خبری، به همراه ارتباط میان آنها را به صورت شفاف در اختیار کاربر قرار دهیم. این تصویر جامع، کاربر را به خوبی در میان موضوعات خبری و رخدادهای مرتبط هدایت کرده و ارتباطات نهفته میان آنها را، بویژه دربارهی موضوعات خبری پیچیده و اخبار حاشیهای، روشن میسازد.
در این پیشنهاد پژوهشی، مسألهی تولید خودکار خلاصهی خط سِیر زمانی رخدادهای خبری در توییتر مورد بررسی قرار میگیرد. بازیابی توییتهای مرتبط با پرسش کاربر در گام اول، ساختن سِیرزمانی رویدادهای مرتبط با پرسش کاربر از روی توییتهای بازیابی شده با در نظر گرفتن دورههای زمانی انفجارگونهی رخداد در گام دوم، و تولید خلاصهای از توییتهای مربوط به هر رویداد شناسایی شده در گام سوم از مهمترین زیرمسألههای این پژوهش هستند که در راستای طولی هم مطرح شده و گامهای اصلی حل یک مسألهی بزرگتر یعنی همان تولید خودکار خلاصهی سِیرزمانی رخدادهای خبری در توییتر را تشکیل میدهند. اگرچه تلاشهای اندکی در تولید خلاصهی ساختیافته از سِیرزمانی یک رخداد در توییتر صورت گرفته و برخی ازین گامها به صورت مستقل مورد بررسی قرار گرفتهاند، اما محدودیتها و کمبودهایی در هر کدام از آنها به چشم میخورد. هر گام به نوبه خود با چالشهای خاصی روبرو است که در این پژوهش در صدد هستیم تا این چالشها را رفع کنیم.
رویکرد انتخابی در این پژوهش، اجرای یک فرایند 3-مرحلهای برای حل مسألهی تولید خلاصهی سِیرزمانی رخدادها در توییتر است. در مرحلهی اول، توییتهای مرتبط با پرسش کاربر را بازیابی کرده و از تکنیک گسترش پرسش اولیه برای بهبود دقت بازیابی بهره میبریم. در مرحلهی دوم، مسألهی ساختن خطِزمانی روی توییتهای بازیابی شده توسط مسألهی بهینهسازی فرموله و حل میشود. سِیرزمانی ساخته شده هم پیوستگی زمانی داشته و هم وابستگی محتوا در آن لحاظ شده است. در مرحلهی سوم، خلاصهای از توییتهای مربوط به هر رویداد شناسایی شده، تولید میشود.
کلمات کلیدی: شبکه های اجتماعی، توییتر، خط سیر زمانی، خلاصه سازی اخبار
ارائه دهنده پروژه
![]() نازنین دهقانی پست الکترونیک: nazids [at] gmail.com عضو فعال |
استاد راهنما
![]() مسعود اسدپور استادیار اتاق: ساختمان جدید، 720 تلفن: 61114951 پست الکترونیکی: asadpour [AT] ut.ac.ir |