ارائه شبکه پیچیده بدون مقیاس با الگوی ترکیب لایه ای زبان فارسی
پژوهش حاضر روشی را برای بررسی الگوهای ترکیب و ساختار توپولوژیکی زبان فارسی پیشنهاد کرده، و روش بهبودیافته متن فارسی را در قالب گراف شبکه همزمان در چارچوب نظریه شبکه پیچیده بررسی می کند.
یک مدل تهی با اندازه مشابه، با توجه به گراف تصادفی اردوش- رینی، برای مقایسه با شبکه فارسی تولید می شود. مقایسه براساس طول مسیر متوسط، ضریب خوشه بندی و سلسله مراتب هر دو شبکه است. از تجزیه و تحلیل این ویژگی های کلیدی، مشاهده می شود که گراف شبکه فارسی با شبکه تصادفی متفاوت است. طول مسیر متوسط کوچک تر و ضریب خوشه بندی بالا نیز تاثیر مدل جهانی کوچک را در زبان فارسی تایید می کند.
برای اولین بار، متن فارسی با موفقیت به شبکه پیچیده تبدیل شد. یک مجموعه باز و بدون حاشیه بیش از دو میلیون کلمه، با استفاده از رویکرد جنگل تصادفی ساخته شده است.
شبکه حاصل طراحی شده، با مدل کیسه بایگرام شامل 3256 گره و 79705 لبه می باشد. علاوه بر این، برخلاف شبکه تصادفی که تنها یک جامعه وجود دارد، 12 اجتماع در شبکه فارسی شناسایی شده است. واقعیت های آماری نشان می دهد که شبکه فارسی یک شبکه بدون مقیاس با الگوی ترکیب لایه ای است.
- حق عضویت دریافتی صرف حمایت از نشریات عضو و نگهداری، تکمیل و توسعه مگیران میشود.
- پرداخت حق اشتراک و دانلود مقالات اجازه بازنشر آن در سایر رسانههای چاپی و دیجیتال را به کاربر نمیدهد.