شناسایی عناوین محتوای متنی منتشرشده در شبکه اجتماعی توئیتر
با رشد روز افزون شبکههای اجتماعی، میل به تحلیل محتوای منتشرشده برای مقاصد گوناگون افزایش یافته است. یک دسته از عمده فعالیتهایی که در این حوزه انجام میشود شناسایی و دستهبندی محتواهای تولیدشده است. این موضوع به معنی گروهبندی مطالب منتشرشده در دستههایی با موضوعات مشابه و ارایه برچسبهای پیشنهادی برای هر دسته میباشد. در این مقاله، الگوریتم جدیدی برای دستهبندی محتوای متنی شبکه اجتماعی توییتر ارایه شده است. در این الگوریتم ابتدا هر متن، پیشپردازش شده و سپس یک گراف ارتباطات جدید مبتنی بر محتوای متنهای منتشرشده ساخته میشود. این گراف وزندار و بیجهت است و روی آن با استفاده از دو روش بدون ناظر، تشکلهای مختلف شناسایی میشوند. برای ارزیابی، دادههای متنی ارسالشده از شهر واشینگتن در یک بازه زمانی، با API جمعآوری و الگوریتمهای ارایهشده روی آن اعمال شده است. برای بررسی دقت، نتایج حاصل با دو الگوریتم کلاسیک K-means و LDA بر اساس معیار اطلاعات متقابل نرمالشده، مقایسه شده است که نشاندهنده دقت مناسب الگوریتم پیشنهادی است.
- حق عضویت دریافتی صرف حمایت از نشریات عضو و نگهداری، تکمیل و توسعه مگیران میشود.
- پرداخت حق اشتراک و دانلود مقالات اجازه بازنشر آن در سایر رسانههای چاپی و دیجیتال را به کاربر نمیدهد.