ایجاد گراف دانش فارسی چند دامنه ای

سال انتشار: 1396
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 1,253

فایل این مقاله در 19 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

ITMANC05_004

تاریخ نمایه سازی: 29 فروردین 1397

چکیده مقاله:

گراف دانش، مجموعه بزرگی از موجودیت های به هم مرتبط و غنی شده به وسیله برچسب گذاری معنایی است. این ابزار قدرتمند که امروزه در محیط دانشگاه و صنعت به طور گستردهای مورد استفاده قرار میگیرد کاربردهای فراوانی در زمینه موتورهای جستجو، پردازش زبان طبیعی، متن کاوی، سامانه های پرسش وپاسخ و بازیابی اطلاعات دارد. در این پژوهش، گراف دانش فارسی چند دامنه ای متشکل از بیش از 400 هزار موجودیت و 6/5 میلیون رابطه ارایه میگردد. داده های این پایگاه دانش پویا، برگرفته از مقاله های ویکی پدیای فارسی و اطلاعات ساختیافته آن مانند جعبه های اطلاعاتی است. بر اساس استاندارد وب معنایی، مدل دادهای گراف دانش فارسی به صورت RDF پیاده سازی شده است بنابراین داده ها به صورت سهتایی در پایگاه دانش ذخیره شده و میتوان از طریق زبان SPARQL پرس وجوهای معنایی را بیان نمود. بر اساس هستانشناسی DBpedia، یک هستان شناسی مطابق موجودیت های گراف دانش فارسی توسعه داده شده که از طریق آن بیش از 7000 نگاشت میان الگوها و خصیصههای ویکیپدیا با هستانشناسی برقرار شده است. در حال حاضر اطلاعات متنوعی به صورت ساختیافته راجع به اشخاص مشهور، مکانهای مهم، سازمانها و شرکتها، آثار ادبی و هنری، گونه های زیستی شامل گیاهان و حیوانات، رویدادها، زیست شناسی، اخترشناسی در این گراف قابل دسترسی است . با توجه به آینده اینترنت و وب معنایی که یک پایگاه دانش جهانی پیچیده و بسیار بزرگ خواهد بود، گراف دانش فارسی میتواند نقش مهمی را در تبیین و توسعه این فناوری نوظهور داشته باشد.

نویسندگان

سیدمحمدباقر سجادی

دانشجوی دکتری، دانشکده کامپیوتر، دانشگاه آزاد تهران مرکز

بهروز مینایی بیدگلی

دانشیار، دانشکده کامپیوتر، دانشگاه علم و صنعت

مجید عسگری بیدهندی

دانشجوی دکتری، دانشکده کامپیوتر، دانشگاه علم و صنعت

علی هادیان

دانشجوی دکتری، دانشکده کامپیوتر، دانشگاه علم و صنعت