مقایسه ی خوشه بندی متن های یک پیکره ی موازی فارسی - انگلیسی
سال انتشار: 1393
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 677
فایل این مقاله در 6 صفحه با فرمت PDF قابل دریافت می باشد
- صدور گواهی نمایه سازی
- من نویسنده این مقاله هستم
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
COMPUTER01_197
تاریخ نمایه سازی: 22 مهر 1394
چکیده مقاله:
خوشه بندی متن در زمینه های مختلف پردازش زبان طبیعی کاربردهای فراوان دارد. تاکنون پژوهش های مختلفی در این زمینه برای استاد زبان های مختلف، از جلمه فارسی و انگلیسی، انجام شده است. هدف این پژوهش مقایسه ی خوشه بندی متن های هم طراز فارسی و انگلیسی می باشد. در این پژوهش پس از استخراج پردازهای ویژگی با روشی یکسان از جلمه های هم طراز دو زبان فارسی و انگلیسی ، و اعمال روش PCA به این بردارها، با استفاده از روش K - میانگین خوشه بندی انجام شده است. نتایج حاصل از مقایسه ی خوشه های این دو زبان نشان داد که تفاوت های میان دو زبان فارسی و انگلیسی بر کیفیت خوشه بندی متن ها تاثیر می گذارد. در این آزمایش ها خوشه های حاصل از هیچ یک از زیان های فارسی و انگلیسی بر دیگری برتری کامل نداشتند. این امر نشان می دهد که باید بهترین روش خوشه بندی متناسب با ویژگی های هر زبان اتخاذ شود و روشی که برای یک زیان مناسب است. الزاماً برای زبانی دیگر نیز انتخاب مناسبی نمی باشد.
کلیدواژه ها:
نویسندگان
عاطفه خزاعی
دانشجوی دکتری مهندسی کامپیوتر، دانشگاه یزد، یزد، ایران
محمد قاسم زاده
عضو هیئت علمی دانشگاه یزد، یزد، ایران
مراجع و منابع این مقاله:
لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :