اخبار و رویدادها

تولید خلاصه خط سیر زمانی رخدادهای خبری در توئیتر

تولید خلاصه خط سیر زمانی رخدادهای خبری در توئیتر


فراگیری شبکه اجتماعی برخط، توسعه­ی بی­سابقه­ای را در سال­های اخیر شاهد بوده است. هم­زمان که سرویس­های شبکه اجتماعی به صورت تصاعدی در بخش­های مختلف جامعه نفوذ می­کنند، ارزش اطلاعاتی که توسط چنین سیستم­هایی تولید می­شود، به طرز فوق­العاده­ای افزایش می­یابد. در واقع، تعاملات و ارتباطات در رسانه اجتماعی غالباً رخدادهای دنیای واقعی را بازتاب می­دهند. در این میان توییتر با نزدیک به 600 میلیون کاربر، محبوب­ترین سایت سرویس­دهنده­ی خدمات ریزبلاگی است و روزانه بیش از 300 میلیون توییت منتشر می­کند. علاوه بر اشتراک اطلاعات، کاربران برای کسب اطلاعات درباره­ی اخبار و رخدادهای بلادرنگ نیز به توییتر مراجعه می­کنند، به طوریکه موتور جستجوی توییتر روزانه پاسخگوی بیش از 2.1 میلیارد پرس­و­جو است.

از سوی دیگر حجم و سرعت بالای تولید وانتشار اطلاعات در این شبکه موجب شده تا بار سنگین اطلاعات، فرایند پردازش آن را برای کاربران دشوار و گاه غیرممکن سازد. بنابراین روش­های خودکاری برای سازماندهی و خلاصه­سازی خط­سیر ­زمانی رخدادهای خبری لازم است تا کاربران توییتر راحت­تر به اطلاعات مرتبط و کلیدی که در میان توییت­ها پخش شده است، دسترسی پیدا کنند.

از سوی دیگر، ذات ناهمگون توییت­ها، محدودیت در طول پست­ها و افزونگی زیاد در جریان توییت­ها، مسأله­ی ارائه­ی یک تصویر کلی از مهم­ترین رخدادهای خبری و ارتباط میان این رخدادها به صورت ساخت­یافته را با چالش روبرو کرده است. هدف ما در این پژوهش این است که تصویر جامعی از مهم­ترین رویدادهای مربوط به یک موضوع خبری، به همراه ارتباط میان آن­ها را به صورت شفاف در اختیار کاربر قرار دهیم. این تصویر جامع، کاربر را به خوبی در میان موضوعات خبری و رخدادهای مرتبط هدایت کرده و ارتباطات نهفته میان آن­ها را، بویژه درباره­ی موضوعات خبری پیچیده و اخبار حاشیه­ای، روشن می­سازد.

در این پیشنهاد پژوهشی، مسأله­ی تولید خودکار خلاصه­ی خط­ سِیر زمانی رخدادهای خبری در توییتر مورد بررسی قرار می­گیرد. بازیابی توییت­های مرتبط با پرسش کاربر در گام اول، ساختن سِیرزمانی رویدادهای مرتبط با پرسش کاربر از روی توییت­های بازیابی شده با در نظر گرفتن دوره­های زمانی انفجارگونه­ی رخداد در گام دوم، و تولید خلاصه­ای از توییت­های مربوط به هر رویداد شناسایی شده در گام سوم از مهم­ترین زیرمسأله­های این پژوهش هستند که در راستای طولی هم مطرح شده و گام­های اصلی حل یک مسأله­ی بزرگتر یعنی همان تولید خودکار خلاصه­ی سِیرزمانی رخدادهای خبری در توییتر را تشکیل می­دهند. اگرچه تلاش­های اندکی در تولید خلاصه­ی ساخت­یافته از سِیرزمانی یک رخداد در توییتر صورت گرفته و برخی ازین گام­ها به صورت مستقل مورد بررسی قرار گرفته­اند، اما محدودیت­ها و کمبودهایی در هر کدام از آن­ها به چشم می­خورد. هر گام به نوبه خود با چالش­های خاصی روبرو است که در این پژوهش در صدد هستیم تا این چالش­ها را رفع کنیم.

رویکرد انتخابی در این پژوهش، اجرای یک فرایند 3-مرحله­ای برای حل مسأله­ی تولید خلاصه­ی سِیرزمانی رخدادها در توییتر است. در مرحله­ی اول، توییت­های مرتبط با پرسش کاربر را بازیابی کرده و از تکنیک گسترش پرسش اولیه برای بهبود دقت بازیابی بهره می­بریم. در مرحله­ی دوم، مسأله­ی ساختن خطِ­زمانی روی توییت­های بازیابی شده توسط مسأله­ی بهینه­سازی فرموله و حل می­شود. سِیرزمانی ساخته شده هم پیوستگی زمانی داشته و هم وابستگی محتوا در آن لحاظ شده است. در مرحله­ی سوم، خلاصه­ای از توییت­های مربوط به هر رویداد شناسایی شده، تولید می­شود.

 

کلمات کلیدی: شبکه ­های اجتماعی، توییتر، خط­ سیر ­زمانی، خلاصه­ سازی اخبار

 

 

 

ارائه دهنده پروژه

نازنین دهقانی
پست الکترونیک: nazids [at] gmail.com
عضو فعال
 

استاد راهنما

مسعود اسدپور
استادیار
اتاق: ساختمان جدید، 720
تلفن: 61114951
پست الکترونیکی: asadpour [AT] ut.ac.ir

 

آدرس کوتاه :