CIVILICA We Respect the Science
ناشر تخصصی کنفرانسهای ایران
عنوان
مقاله

بهبود بازیابی اطلاعات بر اساس تشابه معنایی کلمات کلیدی با استفاده از رتبه دهی مبتنی بر گراف

اعتبار موردنیاز : ۱ | تعداد صفحات: ۸ | تعداد نمایش خلاصه: ۲۷۱ | نظرات: ۰
سال انتشار: ۱۳۹۴
کد COI مقاله: ICTCK02_007
زبان مقاله: فارسی
حجم فایل: ۶۳۱.۲۶ کیلوبایت (فایل این مقاله در ۸ صفحه با فرمت PDF قابل دریافت می باشد)

راهنمای دانلود فایل کامل این مقاله

اگر در مجموعه سیویلیکا عضو نیستید، به راحتی می توانید از طریق فرم روبرو اصل این مقاله را خریداری نمایید.
با عضویت در سیویلیکا می توانید اصل مقالات را با حداقل ۳۳ درصد تخفیف (دو سوم قیمت خرید تک مقاله) دریافت نمایید. برای عضویت در سیویلیکا به صفحه ثبت نام مراجعه نمایید. در صورتی که دارای نام کاربری در مجموعه سیویلیکا هستید، ابتدا از قسمت بالای صفحه با نام کاربری خود وارد شده و سپس به این صفحه مراجعه نمایید.
لطفا قبل از اقدام به خرید اینترنتی این مقاله، ابتدا تعداد صفحات مقاله را در بالای این صفحه کنترل نمایید.
برای راهنمایی کاملتر راهنمای سایت را مطالعه کنید.

خرید و دانلود فایل مقاله

با استفاده از پرداخت اینترنتی بسیار سریع و ساده می توانید اصل این مقاله را که دارای ۸ صفحه است در اختیار داشته باشید.

قیمت این مقاله : ۳,۰۰۰ تومان

آدرس ایمیل خود را در کادر زیر وارد نمایید:

مشخصات نویسندگان مقاله بهبود بازیابی اطلاعات بر اساس تشابه معنایی کلمات کلیدی با استفاده از رتبه دهی مبتنی بر گراف

  مهناز قادری فریز - دانشکده مهندسی کامپیوتر ، گروه نرم افزار ، دانشگاه آزاد اسلامی ، زاهدان
    مجید وفایی جهان - استادیار ،گروه نرم افزار، دانشگاه آزاد اسلامی ، مشهد

چکیده مقاله:

کلمات کلیدی در اسناد متنی ، کلماتی از متن اسناد هستند که بیشترین بار مفهومی متن را به همراه داشته و نیز یکنسخه فشرده متن محسوب می شود در نتیجه نیاز به روش های استخراج خودکار کلمات کلیدی را به شدت افزایشداده اخیراً روش های رتبه بندی مبتنی بر گراف کاربرد موفقی در حوزه وب داشته یک مشکل عمده اکثر این روش هاتأکید بیش از حد بر پارامترهم جواری کلمات در ایجاد و وزندهی یال های گراف متنی و صرف نظر از شاخص های آماریشده است . در این پژوهش برانیم شباهت معنایی کلمات کلیدی را به صورت فرمت پیچیده تری از متغیر TF-IDF (روش وزندهی کلاسیک) به عنوان شاخص آماری بیان کنیم. با تعریف متغیر (W(ij که بیانگر ترتیب کاهنده از احتمال ارتباطشان با کوئری کاربر است و یک روش مشخص به عنوان رتبه بندی احتمال ؛ الگوریتم معروف BM25 است ، در این پژوهش اطلاعات آماری روش رتبه بندی احتمال ارتباط کلمات کلیدی، از جمله تعداد اسناد مشابه و اسناد کل مجموعه در وزندهی گراف استفاده شده است.هدف در این مقاله این است که شباهت معنایی m سند با سند مورد نظر (d(0 بررسی کنیم با رتبه بندی کلمات کلیدی مشترک میان اسناد ، اسنادی که دارای کلمات کلیدی با بالاترین اولویت اند شبیه ترین اسناد به (d(0 اند. مقایسه نتایج روش جدید با روش های قبلی افزایش دقت 93 % در اسناد استخراج شده مشابه (d(0 را نشان می دهد.

کلیدواژه‌ها:

اطلاعات آماری ، رتبه دهی مبتنی بر گراف ، کلمه کلیدی ، کلمات کلیدی استخراجی

کد مقاله/لینک ثابت به این مقاله

برای لینک دهی به این مقاله، می توانید از لینک زیر استفاده نمایید. این لینک همیشه ثابت است و به عنوان سند ثبت مقاله در مرجع سیویلیکا مورد استفاده قرار میگیرد:
https://www.civilica.com/Paper-ICTCK02-ICTCK02_007.html
کد COI مقاله: ICTCK02_007

نحوه استناد به مقاله:

در صورتی که می خواهید در اثر پژوهشی خود به این مقاله ارجاع دهید، به سادگی می توانید از عبارت زیر در بخش منابع و مراجع استفاده نمایید:
قادری فریز, مهناز و مجید وفایی جهان، ۱۳۹۴، بهبود بازیابی اطلاعات بر اساس تشابه معنایی کلمات کلیدی با استفاده از رتبه دهی مبتنی بر گراف، دومین کنگره بین المللی فن آوری، ارتباطات و دانشICTCK2015، مشهد، دانشگاه آزاد اسلامی واحد مشهد، https://www.civilica.com/Paper-ICTCK02-ICTCK02_007.html

در داخل متن نیز هر جا که به عبارت و یا دستاوردی از این مقاله اشاره شود پس از ذکر مطلب، در داخل پارانتز، مشخصات زیر نوشته می شود.
برای بار اول: (قادری فریز, مهناز و مجید وفایی جهان، ۱۳۹۴)
برای بار دوم به بعد: (قادری فریز و وفایی جهان، ۱۳۹۴)
برای آشنایی کامل با نحوه مرجع نویسی لطفا بخش راهنمای سیویلیکا (مرجع دهی) را ملاحظه نمایید.

مراجع و منابع این مقاله:

لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :

  • S.Brin, L.Page, " the Anatomy of a large-scale hypertext Web ...
  • R.Blane , C.Lioma, _ walk Term wieghting for information Retrieval" ...
  • E.Frank., Paynter , W. Gordon., Witten , H. Ian _ ...
  • extraction given more linguistic knowledge" EMNLP03 Proceedings of the Conference ...
  • A.Hulth, " Combining Machine Learning and for ...
  • Automatic Keyword Extraction Ph.D thesis Department of Computer and Systems ...
  • P _ Turney, "learning algoritms for keyphrase extraction ", informaion ...
  • overheads", in proceeding of the Twenty - First Annual Internati ...
  • R.Mihalcea, P.Traau, " TextRank" : Bringing order into texts _ ...
  • learning for web pages ranking algorithms", Applied Soft Computing, 13, ...
  • Pagerank", in proceeding of the Eleventh Int'I world wide web ...
  • Balazs Csanad Csaji a, b, Raphal M. Jungers c, d, ...
  • conference _ World Wide Web, ۲۰۰۵. ناصر گرامی نیا "ارایه ...
  • کلمات کلیدی اسناد متنی با استفاده از رتبه دهی مبتنی ... (مقاله ژورنالی)
  • علم سنجی و رتبه بندی مقاله

    مشخصات مرکز تولید کننده این مقاله به صورت زیر است:
    نوع مرکز: دانشگاه آزاد
    تعداد مقالات: ۴۲۸۱
    در بخش علم سنجی پایگاه سیویلیکا می توانید رتبه بندی علمی مراکز دانشگاهی و پژوهشی کشور را بر اساس آمار مقالات نمایه شده مشاهده نمایید.

    مدیریت اطلاعات پژوهشی

    اطلاعات استنادی این مقاله را به نرم افزارهای مدیریت اطلاعات علمی و استنادی ارسال نمایید و در تحقیقات خود از آن استفاده نمایید.

    مقالات پیشنهادی مرتبط

    مقالات مرتبط جدید

    شبکه تبلیغات علمی کشور

    به اشتراک گذاری این صفحه

    اطلاعات بیشتر درباره COI

    COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.
    کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.