بکارگیری پیکره های زبانی در طراحی یک سامانه بازیابی اطلاعات دوزبانه

سال انتشار: 1396
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 810

فایل این مقاله در 6 صفحه با فرمت PDF قابل دریافت می باشد

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

CSCG02_214

تاریخ نمایه سازی: 7 اسفند 1396

چکیده مقاله:

داده های بزرگ به تکنولوژی های فوق العاده ای برای پردازش داده های عظیم در مجموعه های بزرگ نیازمند است تا بتواند در زمانی معقول پاسخگوی نیازها و اهداف تحلیل و پردازش داده ها باشد. این داده ها نحوه کار سازمانها و افراد را تحت تاثیر قرار میدهد. پردازش زبان های طبیعی یکی از زیرشاخه های بااهمیت در حوزه ی گسترده ی علوم رایانه، هوش مصنوعی و نیز دانش زبان شناسی محاسباتی است که به تعامل بین کامپیوتر و زبان های طبیعی میپردازد. بازیابی اطلاعات مبحث مهمی در پردازش زبان های طبیعی به شمار میرود. فرآیندی که کاربر، واژه یا اصطلاحی را به یک زبان جست و جو کند و نتایج آن را به زبان دیگری دریافت کند، بازیابی اطلاعات بین زبانی نام دارد. به دلیل حجم کم اطلاعات به زبان فارسی، کاربران فارسی زبان مشکلات عمده ای در ا ستفاده از امکان بازیابی مو ضوعات مورد نظر شان دارند. در این مقاله ابتدا مروری بر داده های عظیم و روش MapReduce شده ا ست. سپس روشهای بازیابی اطلاعات معرفی شده و رو شی برای بازیابی اطلاعات دو زبانه با ا ستفاده از مترجم دو زبانه انگلیسی- فار سی، به طور خاص مورد بررسی قرار گرفته است. نتایج، اهمیت ایجاد روشهای پردازش زبان بر روی دادههای بزرگ به خصوص در حوزه بازیابی اطلاعات را نشان میدهند.

کلیدواژه ها:

داده های حجیم ، پردازش زبان طبیعی ، بازیابی اطلاعات ، بازیابی اطلاعات بین زبانی

نویسندگان

زینب مهرنهاد

دانشجوی دکترا، دانشگاه یزد، ایران

محمد قاسم زاده

دانشیار، دانشگاه یزد، ایران

امین نظارات

استادیار، دانشگاه پیام نور یزد، ایران