CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)
عنوان
مقاله

یک روش استخراج اتوماتیک داده از وب بر مبنای آنترولوژی

اعتبار موردنیاز: ۱ | تعداد صفحات: ۸ | تعداد نمایش خلاصه: ۱۷۹۹ | نظرات: ۰
سال انتشار: ۱۳۸۶
کد COI مقاله: IDMC01_029
زبان مقاله: فارسی
فایل PDF حاوی متن کامل این مقاله در حال حاضر در سایت موجود نمی‌باشد.

راهنمای دانلود فایل کامل این مقاله

متن کامل این مقاله منتشر نشده و درپایگاه سیویلیکا موجود نمی باشد.

منبع مقالات سیویلیکا دبیرخانه کنفرانسها است. برخی از دبیرخانه ها اقدام به انتشار اصل مقاله نمی نمایند. به منظور تکمیل بانک مقالات موجود، چکیده این مقالات در سایت درج می شوند ولی به دلیل عدم انتشار اصل مقاله، امکان ارائه آن وجود ندارد.

خرید و دانلود PDF مقاله

اصل مقاله (فول تکست) فوق منتشر نشده و یا در سایت موجود نیست و امکان خرید آن فراهم نمی باشد

مشخصات نویسندگان مقاله یک روش استخراج اتوماتیک داده از وب بر مبنای آنترولوژی

  بهرام امینی - مدرس گروه کامپیوتر، دانشگاه آزاد اسلامی واحد نجف آباد، دانشکده فنی و
  حسن ابوالحسنی - استادیار، دانشگاه صنعتی شریف، دانشکده مهندسی کامپیوتر

چکیده مقاله:

روشهای متعددی برای استخراج داده از صفحات وب مطرح شده است که نوعا بدلیل وابستگی به ساختار گرامری متن صفحات، دارای پیچیدگی و نقاط ضعف مخصوص به خود هستند. اخیرا رویکرد استفاده از آنتولوژی وب معنایی مطرح شده که در مراحل اولیه خود می باشد. در این مقاله یک روش مبتنی بر آنتولوژی برای استخراج داده از صفحات وب پیشنهاد شده است. این روش با استفاده از مفاهیم موجود در آنتولوژی دامنه پژوهش در علوم کامپیوتر و تکنیکهای پردازش زبان طبیعی، داده های موجود در صفحات وب را به فرم ساخت یافته و قابل پرس و جو استخراج می نماید. روش ما انعطاف پذیر و مستقل از گرامر متن صفحات وب بوده و مشکلات ناش از تغییر ساختار صفحات وب را بطور قابل توجهی برطرف نموده است. نتایج حاصل از استخراج داده نشان میدهد که این روش با دقت بالایی آیتم های داده را شناسایی و استخراج می نماید.

کلیدواژه‌ها:

آنتولوژی ، وب معنایی ، استخراج داده ، وب

کد مقاله/لینک ثابت به این مقاله

برای لینک دهی به این مقاله، می توانید از لینک زیر استفاده نمایید. این لینک همیشه ثابت است و به عنوان سند ثبت مقاله در مرجع سیویلیکا مورد استفاده قرار میگیرد:
https://www.civilica.com/Paper-IDMC01-IDMC01_029.html
کد COI مقاله: IDMC01_029

نحوه استناد به مقاله:

در صورتی که می خواهید در اثر پژوهشی خود به این مقاله ارجاع دهید، به سادگی می توانید از عبارت زیر در بخش منابع و مراجع استفاده نمایید:
امینی, بهرام و حسن ابوالحسنی، ۱۳۸۶، یک روش استخراج اتوماتیک داده از وب بر مبنای آنترولوژی، اولین کنفرانس داده کاوی ایران، تهران، دانشگاه صنعتی امیرکبیر، موسسه پژوهشی داده پردازان گیتا، https://www.civilica.com/Paper-IDMC01-IDMC01_029.html

در داخل متن نیز هر جا که به عبارت و یا دستاوردی از این مقاله اشاره شود پس از ذکر مطلب، در داخل پارانتز، مشخصات زیر نوشته می شود.
برای بار اول: (امینی, بهرام و حسن ابوالحسنی، ۱۳۸۶)
برای بار دوم به بعد: (امینی و ابوالحسنی، ۱۳۸۶)
برای آشنایی کامل با نحوه مرجع نویسی لطفا بخش راهنمای سیویلیکا (مرجع دهی) را ملاحظه نمایید.

علم سنجی و رتبه بندی مقاله

مشخصات مرکز تولید کننده این مقاله به صورت زیر است:
نوع مرکز:
تعداد مقالات: ۹۲۸۶
در بخش علم سنجی پایگاه سیویلیکا می توانید رتبه بندی علمی مراکز دانشگاهی و پژوهشی کشور را بر اساس آمار مقالات نمایه شده مشاهده نمایید.

مدیریت اطلاعات پژوهشی

اطلاعات استنادی این مقاله را به نرم افزارهای مدیریت اطلاعات علمی و استنادی ارسال نمایید و در تحقیقات خود از آن استفاده نمایید.

شبکه تبلیغات علمی کشور

به اشتراک گذاری این صفحه

اطلاعات بیشتر درباره COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.
کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.