CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)
عنوان
مقاله

خوشه بندی متون فارسی به کمک الگوریتم K-means

اعتبار موردنیاز PDF: ۱ | تعداد صفحات: ۷ | تعداد نمایش خلاصه: ۲۰۲۴ | نظرات: ۰
سال انتشار: ۱۳۹۲
کد COI مقاله: EIAICC02_027
زبان مقاله: فارسی
حجم فایل: ۶۴۹.۸۳ کیلوبایت (فایل این مقاله در ۷ صفحه با فرمت PDF قابل دریافت می باشد)

راهنمای دانلود فایل کامل این مقاله

متن کامل این مقاله دارای ۷ صفحه در فرمت PDF قابل خریداری است. شما می توانید از طریق بخش روبرو فایل PDF این مقاله را با پرداخت اینترنتی ۳۰,۰۰۰ ریال بلافاصله دریافت فرمایید
قبل از اقدام به دریافت یا خرید مقاله، حتما به فرمت مقاله و تعداد صفحات مقاله دقت کامل را مبذول فرمایید.
علاوه بر خرید تک مقاله، می توانید با عضویت در سیویلیکا مقالات را به صورت اعتباری دریافت و ۲۰ تا ۳۰ درصد کمتر برای دریافت مقالات بپردازید. اعضای سیویلیکا می توانند صفحات تخصصی شخصی روی این مجموعه ایجاد نمایند.
برای راهنمایی کاملتر راهنمای سایت را مطالعه کنید.

خرید و دانلود فایل PDF مقاله

با استفاده از پرداخت اینترنتی بسیار سریع و ساده می توانید اصل این مقاله را که دارای ۷ صفحه است به صورت فایل PDF در اختیار داشته باشید.
آدرس ایمیل خود را در کادر زیر وارد نمایید:

مشخصات نویسندگان مقاله خوشه بندی متون فارسی به کمک الگوریتم K-means

پرویز کدخدایی - کارشناس ارشد کامپیوتر-هوش مصنوعی-گروه کامپیوتر
عرفان شمس - کارشناس ارشد کامپیوتر نرم افزار- گروه کامپیوتر

چکیده مقاله:

بهره گیری از قدرت فرآیند داده کاوی جهت شناسایی الگوها و مدل ها و نیز ارتباط عناصر مختلف در پایگاه داده جهت کشف دانش نهفته در داده ها و نهایتا تبدیل داده به اطلاعات، روز به روز ضروری تر می شود. داده کاوی مجموعه روش هایی است کهبه کمک آن ها به صورت خودکار اطلاعات پیشگویانه از پایگاه داده های بزرگ استخراج می شود. سپس از این اطلاعات برای به وجود آوردن اطلاعات بهتر و در نتیجه اخذ تصمیمات مفیدتر استفاده می شود. در این مقاله سعی شده است از روش خوشه بندی توصیفی برای خوشه بندی و دسته بندی متون فارسی استفاده شود. برای نمونه مجموعه ای از متون فارسی که از روی سایت های خبریموجود در وب جمع آوری شده است، برای انجام این تحقیق بکار می رود. این متون در ابتدا بوسیله از بین بردن علائم نقطه گذاری وکلمات بی فایده، پیش پردازش می شوند. در خوشه بندی برای نمایش هر متن از یک بردار ویژگی استفاده می شود که شامل کلماتشاخص و میزان تکرار آن کمات در متن می باشد. اصول خوشه بندی بر پایه فرضیات آماری استوار است که متونی که در خوشه یکسانی قرار می گیرند، ویژگی های مشابهی دارند. برای خوشه بندی متن جدید، ابتدا بردار ویژگی آن متن ساخته شده، سپس با بردارهای ویژگی خوشه ها مقایسه می شود. در صورتی که خوشه جدید تشخیص داده شد به لیست خوشه ها اضافه میگردد و در غیر این صورت رشد خوشه متوقف می گردد

کلیدواژه‌ها:

خوشه بندی متن ، داده کاوی توصیفی ، زبان فارسی/K-means

کد مقاله/لینک ثابت به این مقاله

برای لینک دهی به این مقاله، می توانید از لینک زیر استفاده نمایید. این لینک همیشه ثابت است و به عنوان سند ثبت مقاله در مرجع سیویلیکا مورد استفاده قرار میگیرد:
https://www.civilica.com/Paper-EIAICC02-EIAICC02_027.html
کد COI مقاله: EIAICC02_027

نحوه استناد به مقاله:

در صورتی که می خواهید در اثر پژوهشی خود به این مقاله ارجاع دهید، به سادگی می توانید از عبارت زیر در بخش منابع و مراجع استفاده نمایید:
کدخدایی, پرویز و عرفان شمس، ۱۳۹۲، خوشه بندی متون فارسی به کمک الگوریتم K-means، دومین کنفرانس ملی توسعه کاربردهای صنعتی اطلاعات، ارتباطات و محاسبات، تبریز، https://www.civilica.com/Paper-EIAICC02-EIAICC02_027.html

در داخل متن نیز هر جا که به عبارت و یا دستاوردی از این مقاله اشاره شود پس از ذکر مطلب، در داخل پارانتز، مشخصات زیر نوشته می شود.
برای بار اول: (کدخدایی, پرویز و عرفان شمس، ۱۳۹۲)
برای بار دوم به بعد: (کدخدایی و شمس، ۱۳۹۲)
برای آشنایی کامل با نحوه مرجع نویسی لطفا بخش راهنمای سیویلیکا (مرجع دهی) را ملاحظه نمایید.

مراجع و منابع این مقاله:

لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :

  • . Dtanie T Larose, Discovery Knowledge in Data: An _ ...
  • . Chen, M., Data Mining:an overview from Data base_ _ ...
  • . Bramer, M.A, Knowledge Disccvery aud_Data _ the institution of ...
  • . Hair, Joseph F., Multivariate Data Anaysis, 20 05, prentice ...
  • Sebastiani , Fabrizio (2002). "Machine _ automated_ _ _ , ...
  • . Usama Fayyad; Gregory P iatetsky- Shapiro ; and Padhraic ...
  • . M.Kantardzic, _ CGncepts_ Modeles. Mthodsaud Algcrithms , IEEE Press, ...
  • . John Wiley & Sons, Eigding Gcoups in_Data:an Introduction to ...
  • . Michael J.A Berry, Gordan S. LinoffWiley = Data Mining ...
  • . Daniel T.Larose, ph.D, Wiley Interscience. Discoverv Knowledge in Data. ...
  • Rung -Ching Chen , Chung-Hsun Hsieh."Neb page classification based on ...
  • 4] Y.Li, S.c.K. Shiu, S .K. Pal., J.N _ K. ...
  • مدیریت اطلاعات پژوهشی

    اطلاعات استنادی این مقاله را به نرم افزارهای مدیریت اطلاعات علمی و استنادی ارسال نمایید و در تحقیقات خود از آن استفاده نمایید.

    مقالات پیشنهادی مرتبط

    مقالات مرتبط جدید

    شبکه تبلیغات علمی کشور

    به اشتراک گذاری این صفحه

    اطلاعات بیشتر درباره COI

    COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.
    کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.