بررسی نقش برچسبزنی کلمات در نمایهسازی و دقت بازیابی برای اسناد و پرسوجوهای فارسی
محل انتشار: دومین کنفرانس داده کاوی ایران
سال انتشار: 1387
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 1,760
متن کامل این مقاله منتشر نشده است و فقط به صورت چکیده یا چکیده مبسوط در پایگاه موجود می باشد.
توضیح: معمولا کلیه مقالاتی که کمتر از ۵ صفحه باشند در پایگاه سیویلیکا اصل مقاله (فول تکست) محسوب نمی شوند و فقط کاربران عضو بدون کسر اعتبار می توانند فایل آنها را دریافت نمایند.
- صدور گواهی نمایه سازی
- من نویسنده این مقاله هستم
این مقاله در بخشهای موضوعی زیر دسته بندی شده است:
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
IDMC02_048
تاریخ نمایه سازی: 14 فروردین 1388
چکیده مقاله:
بررسی تاثیر برچسبزنی کلمات و تعیین ادات سخن بر کارایی و دقت بازیابی و همچنین حجم نمایه سیست م های بازیابی اطلاعات یکی از مباحث داغ در زمینه پردازش زبانهای طبیعی میباشد. تحقیقات گوناگونی تاکنون در زبان انگلیسی جهت بررسی نقشِ ادات سخن و اهمیت آن در حجمِ نمایه و دقت بازیابی صورت گرفته است. در این نوشتار برآنیم تا با برچسبزنی خودکار اسناد پیکره همشهری، بعنوان بزرگترین پیکره استاندارد فارسی، نقش هر یک از ادات سخن را در حجمِ نمایه و همچنین دقت بازیابی بررسی نماییم. برای این منظور ابتدا پیکره همشهری برچسبگذاری شده و سپس از پیکره برچسبگذاری شده جهت تعیین نقش هر برچسب در بازیابی اسناد و پرسوجوهای فارسی استفاده شده است. نتیجه این تحقیق، زمینهساز بسیاری از پژوهشها در حوزه- ی بازیابی اطلاعات فارسی با رویکرد زبانشناسی خواهد بود
کلیدواژه ها:
نویسندگان