بررسی وکشف رونوشت های نزدیک انجمن های وب

سال انتشار: 1392
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 701

فایل این مقاله در 8 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

NCCEB01_038

تاریخ نمایه سازی: 18 خرداد 1393

چکیده مقاله:

فن آوری های انجمن جستجوی فعلی قادر به شناسایی دنباله ها در مندرجات نزدیک به رونوشت (تکرار) و گروه بندی این دنباه ها در نتایج جستجو نمیباشند. در نتیجه کاربران انجمن با نتایج جستجوی رونوشت شده بار زیادی بر دوش دارند که ترجیح می دهند دنباله های جدید بدون سعی در یافتن آنچه موجود است، ایجاد کنند. بنابراین در این مقاله ما دلایل معمول را که منجر به رونوشت و ایجاد الگوریتم کشف رونوشت جدید برای دنباله های انجمن میشود را شناسایی می کنیم. این الگوریتم با استفاده از یک پژوهش بزرگ از انجمن در دنیای واقعی که بیش از یک میلیون کاربر را به خدمت گرفته است،کامل می شود. ما این کار را با الگوریتم های فعلی مشابه برای کشف رونوشت ها در صفحات وب مورد مقلیسه قرار می دهیم. نتایج اولیه ی ما نشان میدهد که ما به طور چشمگیری این الگوریتم ها را به کار گرفته ایم و ما موفق به گروه بندی دنباله های انجمن با دقت 74 درصد شده ایم.

نویسندگان

حسن نادری

استادیار دانشگاه علم وصنعت

مراجع و منابع این مقاله:

لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :
  • . Alexander Loser K. Muthmann, W. M. Barczy nski. Nearduplicate ...
  • . R. Kern M. Strohmaier, C. Korner. Understanding why ...
  • from an empirical study. pages 1-11, 2012. ...
  • M. Potthast and B. Stein. :New issues in near- duplicate ...
  • G. S. Manku, A.J. A. D. Sarma: TDetecting NearDuplicates for ...
  • Pamulaparty, _ Rao, D.M.S., and Rao, D.C.V.G.: :A Survey on ...
  • نمایش کامل مراجع