یک روش آماری مبتنی بر پیکره برای جداسازی واژههای به هم چسبیده

محسن مشکی; مرتضی آنالویی

ورود

جستجوی پیشرفته استعلام پایان نامه

مقالات فارسی ISI کنفرانسها ژورنالها

یک روش آماری مبتنی بر پیکره برای جداسازی واژههای به هم چسبیده

محل انتشار: دومین کنگره مشترک سیستمهای فازی و هوشمند ایران

سال انتشار: 1387

نوع سند: مقاله کنفرانسی

زبان: فارسی

مشاهده: 682

متن کامل این مقاله منتشر نشده است و فقط به صورت چکیده یا چکیده مبسوط در پایگاه موجود می باشد.
توضیح: معمولا کلیه مقالاتی که کمتر از ۵ صفحه باشند در پایگاه سیویلیکا اصل مقاله (فول تکست) محسوب نمی شوند و فقط کاربران عضو بدون کسر اعتبار می توانند فایل آنها را دریافت نمایند.

صدور گواهی نمایه سازی
من نویسنده این مقاله هستم

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

صنعت اتصال > چسب و رزین

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

https://civilica.com/doc/204044

شناسه ملی سند علمی:

FJCFIS02_335

تاریخ نمایه سازی: 26 تیر 1392

چکیده مقاله:

در این مقاله، یک روش آماری مبتنی بر پیکره برای شناسایی واژههای به هم چسبیده معرفی شد. این روش، با استفاده از معیاراحتمال شرطی متقارن تعیین میکند که آیا یک عنصر متنی، یک واژهی کامل است یا مجموعهای از واژههای به هم چسبیده است. روشپیشنهادی روی یک مجموعهی 18000 تایی از اخبار ورزشی مورد آزمایش قرار گرفت و نتایج قابل قبولی را نشان داد. به ازای هر دوآستانهی 0,001 و 0,0001 تعداد نمونههایی که به درستی از هم جدا شدند به کل نمونههای جداشده نسبت قابل قبولی (بیش از 80 درصد در مورد نمونههای جداشده به دو بخش) را نشان داد.

کلیدواژه ها:

پیکرهی متنی ، تعیین مرز واژهها ، باهمآیی ، احتمال شرطی متقارن

نویسندگان

محسن مشکی

دانشکده مهندسی کامپیوتر دانشگاه علم و صنعت ایران

مرتضی آنالویی

صدور گواهی نمایه سازی
من نویسنده این مقاله هستم

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

صنعت اتصال > چسب و رزین

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

https://civilica.com/doc/204044

شناسه ملی سند علمی:

FJCFIS02_335

تاریخ نمایه سازی: 26 تیر 1392

نحوه استناد به مقاله:

در صورتی که می خواهید در اثر پژوهشی خود به این مقاله ارجاع دهید، به سادگی می توانید از عبارت زیر در بخش منابع و مراجع استفاده نمایید:

مشکی، محسن و آنالویی، مرتضی،1387،یک روش آماری مبتنی بر پیکره برای جداسازی واژههای به هم چسبیده،دومین کنگره مشترک سیستمهای فازی و هوشمند ایران،اصفهان،https://civilica.com/doc/204044

در داخل متن نیز هر جا که به عبارت و یا دستاوردی از این مقاله اشاره شود پس از ذکر مطلب، در داخل پارانتز، مشخصات زیر نوشته می شود.
برای بار اول: (1387، مشکی، محسن؛ مرتضی آنالویی)
برای بار دوم به بعد: (1387، مشکی؛ آنالویی)
برای آشنایی کامل با نحوه مرجع نویسی لطفا بخش راهنمای سیویلیکا (مرجع دهی) را ملاحظه نمایید.

کدام مقالات به این منبع استناد نموده اند

مروری بر روش های خلاصه سازی خودکار متون(1394)

بر اساس سیستم تحلیلی استنادات مقالات، تاکنون برای نگارش 1 مقاله استفاده شده است.

علم سنجی و رتبه بندی مقاله

مشخصات مرکز تولید کننده این مقاله به صورت زیر است:

رتبه علمی دانشگاه علم و صنعت ایران

نوع مرکز: دانشگاه دولتی

تعداد مقالات: 26,594

در بخش علم سنجی پایگاه سیویلیکا می توانید رتبه بندی علمی مراکز دانشگاهی و پژوهشی کشور را بر اساس آمار مقالات نمایه شده مشاهده نمایید.