CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)
عنوان
مقاله

دسته بندی موضوعی متون فارسی بر اساس روش آنالیز معنایی پنهان احتمالاتی بهبود یافته

اعتبار موردنیاز: ۱ | تعداد صفحات: ۷ | تعداد نمایش خلاصه: ۲۶۷۶ | نظرات: ۰
سال انتشار: ۱۳۸۵
کد COI مقاله: ACCSI12_283
زبان مقاله: فارسی
فایل PDF حاوی متن کامل این مقاله در حال حاضر در سایت موجود نمی‌باشد.

راهنمای دانلود فایل کامل این مقاله

متن کامل این مقاله منتشر نشده و درپایگاه سیویلیکا موجود نمی باشد.

منبع مقالات سیویلیکا دبیرخانه کنفرانسها است. برخی از دبیرخانه ها اقدام به انتشار اصل مقاله نمی نمایند. به منظور تکمیل بانک مقالات موجود، چکیده این مقالات در سایت درج می شوند ولی به دلیل عدم انتشار اصل مقاله، امکان ارائه آن وجود ندارد.

خرید و دانلود PDF مقاله

اصل مقاله (فول تکست) فوق منتشر نشده و یا در سایت موجود نیست و امکان خرید آن فراهم نمی باشد

مشخصات نویسندگان مقاله دسته بندی موضوعی متون فارسی بر اساس روش آنالیز معنایی پنهان احتمالاتی بهبود یافته

  طاهره امامی آزادی - دانشجوی کارشناسی ارشد مهندسی پزشکی، بیوالکتریک– دانشگاه صنعتی امیرکبیر
  فرشاد الماس گنج - استادیار دانشکده مهندسی پزشکی – دانشگاه صنعتی امیرکبیر

چکیده مقاله:

با توجه به رشد روزافزون حجم متون و لزوم دستیابی مناسب و استخراج اطلاعات از آنها، دسته بندی بدون سرپرست متون اهمیت زیادی پیدا کرده است. روش« آنالیز معنایی پنهان احتمالاتی » (PLSA) یکی از روشهایی است که در سالهای اخیر در دستهبندی ،متون مورد توجه قرار گرفته است. روشPLSA که بر پایة « آنالیز معنایی پنهان » یا (LSA) است، دارای زیربنای آماری محکمی بوده و در زمینههای مختلف کار با متون عملکرد بسیار خوبی داشته است. در این مقاله روشPLSA به منظور بیان مناسب متون در فضای کاهش بعد یافتة معنایی و نیز دسته بندی متون مورد استفاده قرار گرفت و روشی برای بهبود مدل PLSA با حذف متغیرهای پنهان نامناسب در حین تعلیم پیشنهاد شد. آزمایشات بر روی تعدادی متن فارسی شامل ۶ موضوع کلی و دارای برچسب موضوعی که از پیرة متنی« فار سدات » انتخاب شده بودند، صورت گرفت. با استفاده از روش PLSA به همراه الگوریتم سادهk-means به ۸۷,۲۳ % بیشتر از روش۶,۰۹ % صحت دستهبندی دست یافتیم که LSA در کنار مدل k-meansبود. همچنین توانستیم با استفاده از روشPLSAبهبود یافتة پیشنهادی صحت دستهبندی را نسبت به روش PLSA ، ۳,۷۵ % افزایش دهیم.

کلیدواژه‌ها:

دسته بندی متون-آنالیز معنایی پنهان-آنالیز معنایی پنهان احتمالاتی-متغیر پنهان

کد مقاله/لینک ثابت به این مقاله

برای لینک دهی به این مقاله، می توانید از لینک زیر استفاده نمایید. این لینک همیشه ثابت است و به عنوان سند ثبت مقاله در مرجع سیویلیکا مورد استفاده قرار میگیرد:
https://www.civilica.com/Paper-ACCSI12-ACCSI12_283.html
کد COI مقاله: ACCSI12_283

نحوه استناد به مقاله:

در صورتی که می خواهید در اثر پژوهشی خود به این مقاله ارجاع دهید، به سادگی می توانید از عبارت زیر در بخش منابع و مراجع استفاده نمایید:
امامی آزادی, طاهره و فرشاد الماس گنج، ۱۳۸۵، دسته بندی موضوعی متون فارسی بر اساس روش آنالیز معنایی پنهان احتمالاتی بهبود یافته، دوازدهمین کنفرانس سالانه انجمن کامپیوتر ایران، تهران، دانشگاه شهید بهشتی، https://www.civilica.com/Paper-ACCSI12-ACCSI12_283.html

در داخل متن نیز هر جا که به عبارت و یا دستاوردی از این مقاله اشاره شود پس از ذکر مطلب، در داخل پارانتز، مشخصات زیر نوشته می شود.
برای بار اول: (امامی آزادی, طاهره و فرشاد الماس گنج، ۱۳۸۵)
برای بار دوم به بعد: (امامی آزادی و الماس گنج، ۱۳۸۵)
برای آشنایی کامل با نحوه مرجع نویسی لطفا بخش راهنمای سیویلیکا (مرجع دهی) را ملاحظه نمایید.

کدام مقالات به این منبع استناد نموده اند


بر اساس سیستم تحلیلی استنادات مقالات، تاکنون برای نگارش ۱ مقاله استفاده شده است.

علم سنجی و رتبه بندی مقاله

مشخصات مرکز تولید کننده این مقاله به صورت زیر است:
نوع مرکز: دانشگاه دولتی
تعداد مقالات: ۱۷۰۴۶
در بخش علم سنجی پایگاه سیویلیکا می توانید رتبه بندی علمی مراکز دانشگاهی و پژوهشی کشور را بر اساس آمار مقالات نمایه شده مشاهده نمایید.

مدیریت اطلاعات پژوهشی

اطلاعات استنادی این مقاله را به نرم افزارهای مدیریت اطلاعات علمی و استنادی ارسال نمایید و در تحقیقات خود از آن استفاده نمایید.

مقالات مرتبط جدید

شبکه تبلیغات علمی کشور

به اشتراک گذاری این صفحه

اطلاعات بیشتر درباره COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.
کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.