جستجو در مقالات منتشر شده


2 نتیجه برای مدل‌سازی موضوعی

علی منصوری، فاطمه زرمهر، حسین کارشناس،
دوره 7، شماره 1 - ( 3-1399 )
چکیده

زمینه و هدف : در این پژوهش چهار روش متن‌کاوی بررسی میشود و بر درک و شناسایی خصوصیات و محدودیت‌های آن‌ها در کشف موضوع تمرکز میکند. این چهار روش عبارت‌اند از 1) تجزیه‌وتحلیل معنایی پنهان(LSA) 2) تحلیل معنایی پنهان احتمالاتی(PLSA)، 3) تخصیص دیریکله پنهان(LDA) و 4) مدل‌سازی موضوعی همبسته(CTM).
روش پژوهش: پژوهش حاضر از نوع کتابخانه‌ای است که در آن، ادبیات حوزه متن‌کاوی و مدل‌سازی موضوعی مرور و تحلیل شده است.
یافته‌ها: تجزیه‌وتحلیل معنایی پنهان می‌تواند برای تشخیص موضوعات خاص و منحصربه‌فرد در مدارکی که تنها به یک موضوع پرداخته‌اند استفاده شود. سه روش دیگر متن‌کاوی، بر موضوعات و گرایش کلی متن متمرکز هستند. تحلیل معنایی پنهان احتمالاتی  برای مدارکی که به یک موضوع پرداخته‌اند قابل‌استفاده است اما برخلاف تجزیه‌وتحلیل معنایی پنهان ، این روش در کشف موضوعات و مضامین کلی متن کاربرد دارد. درحالی‌که تخصیص دیریکله پنهان  در مورد مدارکی که به چندین موضوع پرداخته‌اند کاربرد بیشتری دارد. روش مدل‌سازی موضوعی همبسته  می‌تواند در تشخیص ارتباط بین دسته‌های موضوعی مختلف استفاده شود.
نتیجه‌گیری: رویکردهای متن‌کاوی به خاطر بهره‌گیری از تحلیل معنایی در کشف و استخراج موضوع متون مناسب است
نصرت ریاحی نیا، فرزانه شادان‌پور، کیوان برنا، غلامعلی منتظر،
دوره 9، شماره 3 - ( 7-1401 )
چکیده

زمینه و هدف: هدف این پژوهش، بررسی نتایج استخراج خودکار کلیدواژه از فهرست مندرجات کتاب‌های الکترونیکی فارسی حوزۀ علوم  با استفاده از مدل‌سازی موضوعی ال. دی. اِی.،  سنجش شباهت‌ کلیدواژه‌های خروجی با کلیدواژه‌های استاندارد و ارزیابی کاربران از کلیدواژه‌های استخراج‌شده به‌صورت ماشینی است.
روش پژوهش: این پژوهش کاربردی، از نوع پژوهش‌های متن‌کاوی و به جنبۀ روش‌های مورداستفاده در آن پژوهش آمیخته است. از مدل‌سازی موضوعی ال. دی. اِی.  برای  استخراج کلیدواژه از فهرست‌های مندرجات کتاب‌ها استفاده‌شده‌ و نتایج کاربرد مدل با دو روش سنجش کسینوس شباهت و پژوهش کیفی توسط کاربران مورد ارزیابی قرار گرفته است.
یافته‌ها: فهرست‌های مندرجات مورد بررسی با میانگین پیراسته  ۲۶۰.۰۲ کلمه از متون با طول متوسط  محسوب می‌شوند و  حدود ۲۰ درصد از کلمات  آن‌ها را  ایست‌واژه‌ها تشکیل داده‌اند. میان کلیدواژه‌های استاندارد سرعنوانی و کلیدواژه‌های خروجی مدل ال. دی. اِی.  کسینوس شباهت، ۰.۰۹۳۲، بسیار پایین به دست آمد. توافق کامل کاربران نشان داد کلیدواژه‌های خروجی  مدل موضوعی ال. دی. اِی.  حوزه موضوعی کل پیکره را نشان می‌دهند، اما ازنظر کاربران به ترتیب کلیدواژه‌های سرعنوانی استاندارد، کلیدواژه‌های مستخرج از مدل در زیرحوزه‌های موضوعی و کلیدواژه‌های مستخرج از مدل با کل پیکره در توصیف موضوعات هر تک مدرک موفق‌اند.  
نتیجه‌گیری: کلیدواژه‌های به‌دست‌آمده از مدل موضوعی ال. دی. اِی.  را می‌توان در مجموعه‌های ناشناخته به‌منظور استخراج محتوای موضوعی ناآشکار کل مجموعه به کار برد، اما برای ربط دقیق  موضوع به  مدرک در پیکره‌های بزرگ با موضوعات  ناهمگن و متنوع، نمی‌توان از این روش استفاده کرد. این روش در رویه‌های رسمی توصیف موضوعی تک‌تک مدارک به‌صورت مستقل می‌تواند به‌عنوان یک سیستم پیشنهاددهنده کلیدواژه به نیروی انسانی نمایه‌ساز به کار گرفته  شود.
 


صفحه 1 از 1     

کلیه حقوق این وب سایت متعلق به تعامل انسان و اطلاعات می باشد.

طراحی و برنامه نویسی : یکتاوب افزار شرق

© 2024 CC BY-NC 4.0 | Human Information Interaction

Designed & Developed by : Yektaweb