روشی هوشمند برای تشخیص جنسیت صدای گوینده مبتنی بر شبکه عصبی MLP
محل انتشار: سومین کنفرانس سیستم های تصمیم گیری هوشمند
سال انتشار: 1397
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 485
فایل این مقاله در 5 صفحه با فرمت PDF قابل دریافت می باشد
- صدور گواهی نمایه سازی
- من نویسنده این مقاله هستم
این مقاله در بخشهای موضوعی زیر دسته بندی شده است:
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
IDS03_117
تاریخ نمایه سازی: 31 اردیبهشت 1398
چکیده مقاله:
مطالعات پزشکی نشان می دهد که ساختار سیستم صوتی آقایان بزرگ تر از سیستم صوتی خانم ها می باشد. از آنجایی که بسیاری از ویژگی های صوتی ناشی از اندازه و شکل اندام گویایی است پس این تفاوت مطمینا باید (حداقل) در یک ویژگی صوتی تاثیر بگذارد. یکی از این تاثیرها روی تفاوت فرکانسی است. فرکانس گفتار خانم ها و آقایان یکسان نیست. بنابراین اگر فرکانس پایه گفتار را در صوت تشخیص بدهیم بنابر محدوده فرکانسی گفتار قادر به تشخیص جنسیت گوینده هستیم که با روش های مختلفی می توان این فرکانس پایه را بدست آورد. در این مقاله، هدف شناسایی جنسیت گوینده از طریق واکه ها بر مبنای فرمنت و موج انتروپی wavelet و طبقه بندی بر اساس شبکه عصبی چند لایه ای رو به جلو می باشد. آزمایشات انجام شده نشان می دهد که این روش در مقایسه با الگوریتم های کلاسیک، دقت خوبی در شناسایی جنسیت گوینده دارد. یک نکته منحصر به فرد در این مقاله این است کهبرعکس کارهای گذشته، ویژگی ها از جملات و کلمات استخراج نمی گردند، بلکه برای این کار تنها از واکه ها استفاده می کنیم. مزیت استخراج ویژگی ها از واکه ها این است که هنگامی که فایل سخنرانی یا گفتار ناقص است و کلمات نیمه ثبت شده هستند، می توان از این روش برای شناسایی جنسیت گوینده استفاده کرد.
کلیدواژه ها:
نویسندگان
مینا اتحادی ابری
کارشناسی ارشد هوش مصنوعی، دانشگاه صنعتی امیرکبیر، دانشکده کامپیوتر