ارائه مدلی مبتنی بر ویژگی های زمانی برای تشخیص شایعات فاری در شبکه اجتماعی توییتر
امروزه با پیشرفت فناوری و رشد چشم گیر شبکه های اجتماعی برخط، بسیاری از مردم جهت اطلاع از آخرین اخبار روز به این دسته از رسانه ها رجوع می کنند. این شبکه ها با تسهیل در ایجاد و انتشار پیام ها، امکان پخش شایعات را افزایش داده و در نتیجه اخبار حاصل از آن ها، از اعتبار کمتری نسبت به رسانه های سنتی برخوردار شده است. تشخیص خودکار شایعات از میان پیام های منتشر شده در شبکه های اجتماعی برخط، نیازی است که در سال های اخیر مطرح شده و بسیاری از دانشمندان در تلاش بوده اند تا راه حلی برای آن ارایه دهند. بنابراین ارایه روش هایی برای تشخیص شایعات، بیشتر از گذشته مورد توجه قرار گرفته است. در این مقاله، روشی برای تشخیص شایعات فارسی در شبکه اجتماعی توییتر ارایه می شود. روش ارایه شده ابتدا کل پیام های مجموعه داده را پردازش و پیام های مشابه را خوشه بندی می کند و برچسب اکثریت پیام ها در هر خوشه را به عنوان برچسب آن خوشه در نظر می گیرد. سپس یکسری ویژگی از این خوشه ها استخراج می شود. در این مقاله، برای اولین بار ویژگی های مربوط به زمان در این مسیله استفاده شده است. با استفاده از این خوشه های برچسب خورده و ویژگی های استخراج شده یک مدل درخت تصمیم آموزش داده می شود. مدل حاصل نهایتا قابلیت این را دارد که شایعه بودن خوشه پیام های منتشر شده در شبکه اجتماعی توییتر را تشخیص دهد. ارزیابی های انجام شده نشان می دهد که این مدل قادر است شایعه بودن خوشه پیام های شامل پنج پیام یا بیشتر را با دقت و فراخوانی 847/0 و 866/0 تشخیص دهد.