بیست و هشتمین کنفرانس بین المللی انجمن کامپیوتر ایران تهیە دادگان و مدل پایه برای گفتگوگر با قابلیت استخراج اطلاعات

سال انتشار: 1401
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 301

فایل این مقاله در 7 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

CSICC28_024

تاریخ نمایه سازی: 27 اسفند 1401

چکیده مقاله:

گفتگو گر در چت بات یکی از اجزای اصلی در هوشمند سازی تعامل انسان و رایانه به شمار آمده و در سال های اخیر پژوهش های زیادی در این زمینه شکل گرفته است.در این مقاله،گفتگوگری فارسی پیشنهاد شده است که می تواند با کاربر حول مسائل روزمره گفتگو کره و اطلاعات شخصی همچون نام فرد،سن،شغل،تعداد فرزندان و ... را استخراج نماید.بنابراین ،سیستم باید حداقل سوال مستقیم را مطرح کرده و در عوض،خود را ترغیب به بیان اطلاعات نماید.اطلاعات استخراج شده از این گفتگو می تواند در گام بعد در سیستم هایی همچون توصیه گرها مورد استفاده قرار گیرد.برای این منظور،مجموعه داده ای به روش خزش،ترجمه بخشی از پیکره پرسوناچت و همچنین راه اندازی سامانه ای بر خط جمع آوری شد و بعد از برچسب زنی،با مدلی مبتنی بر برت،پایه ای برای توسعه واحد درک معنا قرار گرفت.با افزونه سازی نیمه خودکار این داده ها برای سه شکاف پر تکرار نام،شغل و سرگرمی ،عملکرد مدل برای شکاف بر اساس F۱ به ۸۱٪ و بر حسب دقت هم برای تعیین موضوع کلی گفته به ۱/۹۰٪ رسید.در واحد تولید پاسخ هم با آموزش مدل دنباله به دنباله بر روی تمام داده ها،سرگشتگی بر روی مجموعه آزمون به ۸۱/۱ و ROUGE – ۱ به ۷/۰ رسید

نویسندگان

پگاه صفری

دانشجوی دکتری هوش مصنوعی و رباتیکز ، دانشکده برق و کامپیوتر ، دانشگاه شهید بهشتی، تهران

مهرنوش شمس فرد

دانشیار، گروه هوش مصنوعی ، رباتیک و رایانش شناختی، دانشگاه شهید بهشتی ، تهران