دسته بندی متون فارسی با استفاده از یادگیری نیمه نظارت شده

محسن طاهری نیا

دسته بندی متون فارسی با استفاده از یادگیری نیمه نظارت شده

محل انتشار: چهارمین کنفرانس مهندسی برق و الکترونیک ایران

سال انتشار: 1391

نوع سند: مقاله کنفرانسی

زبان: فارسی

مشاهده: 2,365

فایل این مقاله در 7 صفحه با فرمت PDF قابل دریافت می باشد

دریافت فایل کامل مقاله

صدور گواهی نمایه سازی
من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

https://civilica.com/doc/164226

شناسه ملی سند علمی:

ICEEE04_148

تاریخ نمایه سازی: 6 مهر 1391

چکیده مقاله:

امروزه با توجه به حجم و رشد روز افزون متون فارسی، دسته بندی اتوماتیک اسناد و متون از ارزش بزرگ عملی برخوردار و به طور فزاینده، زمینه ی مهمی برای تحقیق است. در این نوشتار به بررسی یکی از روش های یادگیری هوشمند به نام یادگیری نیمه نظارت شده در دسته بندی متون فارسی خواهیم پرداخت. بسیاری از روش های یادگیری هوشمندانه مانند یادگیری نظارت شده، فقط بر روی داده های آموزشی برچسب دار تکیه می کنند، در شرایط یکه بدست آوردن این داده های آموزشی دارای برچسب بسیار پرهزینه است. حال آنکه حجم زیادی از داده های بدون برچسب به سرعت زیاد و با هزینه ی کم در دسترس هستند. در مقابل روش هایی مانند روش یادگیری بدون نظارت فقط بر روی داده های بدون برچسب تکیه می کنند. در ادامه به بررسی روش یادگیری نیمه نظارت شده که ما بین روش های یادگیری نظارت شده و یادگیری بدون نظارت قرار دارد و از ترکیبی از مثال های آموزشی برچسب دار و بدون برچسب برای یادگیری استفاده می کند پرداخته و از این تکنیک برای دسته بندی متون فارسی استفاده می کنیم.

کلیدواژه ها:

دسته بندی متون فارسی ، یادگیری نیمه نظارت شده ، تئوری بیز ، الگوریتم EM

نویسندگان

محسن طاهری نیا

دانشجوی کارشناسی ارشد دانشکده برق و کامپیوتر، دانشگاه صنعتی اصفهان

مراجع و منابع این مقاله:

لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :

طبقه بندی خودکار متون فارسی [مقاله کنفرانسی]
ایوب باقری، حامد فرزانه فر، محمد حسین سرایی، محمدرضا احمدزاده ... [مقاله کنفرانسی]
ارائه روشی جدید در طبقه بندی متون فارسی با استفاده از دانش معنایی [مقاله کنفرانسی]
O. Chapelle, B. Scholkopf, and A. Zien, Eds., Sem i-Supervised ...
Zhu, X. and A.B. Goldberg, "Introduction _ Sem i-Supervised Learning". ...
th Iranian _ _ _ (ICEEE2012) _ ...
X. Zhu, _ :Sem i-Supervised learning literature survey, ; Computer ...
M. F. Balcan and A. Blum, "A discriminati, model for ...
M. W. Berry, Survey of Text Mining: Retrieval, ...
Supervised text classification using partitioned EM, " in Database Systems ...
K. Nigam, A. K. Mccallum, S. Thrun, and T. M. ...
R. Ghani, "Combining labeled and unlabeled data for text classification ...
T. Mitchell, ،:The role of unlabeled data in supervised learning" ...
Kenan. Text Classification by a Neural Network. Proceedings of the ...
_ _ _ e-mail". Inf. [12] Soucy, P., Mineau, G.W. ...
_ in _ _ 23rd [13] Joachims, _ Categorization with ...
Support Vector Machines: Learning with Many Relevant Features. Machine Learning: ...
M. Arabsorkhi, M. Shamsfard, "Unsupervised Discovery of Persian Morphemes, " ...
A. Astorino, E. Gorgone, M. Gaudioso, and D. Pallaschke, "Data ...
C. Rosenberg, M. Hebert, and H. Schneiderman, of object ...
(WACV/M OTION 05) - Volume 1.Washington, DC, USA: IEEE Computer ...
Sci., 2007. 177(10): p. 2167-2187. ...
D. Ikeda, H. Takamura, and M. Okumura, blog ...

نمایش کامل مراجع