بررسی نقش برچسبزنی کلمات در نمایهسازی و دقت بازیابی برای اسناد و پرسوجوهای فارسی

سال انتشار: 1387
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 1,760

متن کامل این مقاله منتشر نشده است و فقط به صورت چکیده یا چکیده مبسوط در پایگاه موجود می باشد.
توضیح: معمولا کلیه مقالاتی که کمتر از ۵ صفحه باشند در پایگاه سیویلیکا اصل مقاله (فول تکست) محسوب نمی شوند و فقط کاربران عضو بدون کسر اعتبار می توانند فایل آنها را دریافت نمایند.

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

IDMC02_048

تاریخ نمایه سازی: 14 فروردین 1388

چکیده مقاله:

بررسی تاثیر برچسبزنی کلمات و تعیین ادات سخن بر کارایی و دقت بازیابی و همچنین حجم نمایه سیست م های بازیابی اطلاعات یکی از مباحث داغ در زمینه پردازش زبانهای طبیعی میباشد. تحقیقات گوناگونی تاکنون در زبان انگلیسی جهت بررسی نقشِ ادات سخن و اهمیت آن در حجمِ نمایه و دقت بازیابی صورت گرفته است. در این نوشتار برآنیم تا با برچسبزنی خودکار اسناد پیکره همشهری، بعنوان بزرگترین پیکره استاندارد فارسی، نقش هر یک از ادات سخن را در حجمِ نمایه و همچنین دقت بازیابی بررسی نماییم. برای این منظور ابتدا پیکره همشهری برچسبگذاری شده و سپس از پیکره برچسبگذاری شده جهت تعیین نقش هر برچسب در بازیابی اسناد و پرسوجوهای فارسی استفاده شده است. نتیجه این تحقیق، زمینهساز بسیاری از پژوهشها در حوزه- ی بازیابی اطلاعات فارسی با رویکرد زبانشناسی خواهد بود