روشی هوشمند برای تشخیص جنسیت صدای گوینده مبتنی بر شبکه عصبی MLP

سال انتشار: 1397
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 485

فایل این مقاله در 5 صفحه با فرمت PDF قابل دریافت می باشد

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

IDS03_117

تاریخ نمایه سازی: 31 اردیبهشت 1398

چکیده مقاله:

مطالعات پزشکی نشان می دهد که ساختار سیستم صوتی آقایان بزرگ تر از سیستم صوتی خانم ها می باشد. از آنجایی که بسیاری از ویژگی های صوتی ناشی از اندازه و شکل اندام گویایی است پس این تفاوت مطمینا باید (حداقل) در یک ویژگی صوتی تاثیر بگذارد. یکی از این تاثیرها روی تفاوت فرکانسی است. فرکانس گفتار خانم ها و آقایان یکسان نیست. بنابراین اگر فرکانس پایه گفتار را در صوت تشخیص بدهیم بنابر محدوده فرکانسی گفتار قادر به تشخیص جنسیت گوینده هستیم که با روش های مختلفی می توان این فرکانس پایه را بدست آورد. در این مقاله، هدف شناسایی جنسیت گوینده از طریق واکه ها بر مبنای فرمنت و موج انتروپی wavelet و طبقه بندی بر اساس شبکه عصبی چند لایه ای رو به جلو می باشد. آزمایشات انجام شده نشان می دهد که این روش در مقایسه با الگوریتم های کلاسیک، دقت خوبی در شناسایی جنسیت گوینده دارد. یک نکته منحصر به فرد در این مقاله این است کهبرعکس کارهای گذشته، ویژگی ها از جملات و کلمات استخراج نمی گردند، بلکه برای این کار تنها از واکه ها استفاده می کنیم. مزیت استخراج ویژگی ها از واکه ها این است که هنگامی که فایل سخنرانی یا گفتار ناقص است و کلمات نیمه ثبت شده هستند، می توان از این روش برای شناسایی جنسیت گوینده استفاده کرد.

کلیدواژه ها:

تعیین جنسیت ، شبکه عصبی چند لایه ای رو به جلو ، MLP ، فرمنت ، واکه wavelet Entropy

نویسندگان

مینا اتحادی ابری

کارشناسی ارشد هوش مصنوعی، دانشگاه صنعتی امیرکبیر، دانشکده کامپیوتر