یک روش سریع برای تقطیع گفتار گویندگان بر اساس بسامد گام گفتار (RPSS)

بهروز عبدالعلی; حسین صامتی; محمد حسین قزل ایاغ

یک روش سریع برای تقطیع گفتار گویندگان بر اساس بسامد گام گفتار (RPSS)

محل انتشار: فصلنامه علوم و فناوری های پدافند نوین، دوره: 3، شماره: 1

سال انتشار: 1391

نوع سند: مقاله ژورنالی

زبان: فارسی

مشاهده: 366

فایل این مقاله در 10 صفحه با فرمت PDF قابل دریافت می باشد

دریافت فایل کامل مقاله

صدور گواهی نمایه سازی
من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

https://civilica.com/doc/934860

شناسه ملی سند علمی:

JR_ADST-3-1_004

تاریخ نمایه سازی: 9 مهر 1398

چکیده مقاله:

تقطیع و خوشه بندی گویندگان فرآیندی است که طی آن قطuه بندی و برچسب گذاری برای گفتار حاصل از یک جلسه که شامل چند گوینده است انجام می شود و دنباله صوتی به بخش هائی تقسیم می شود که هر بخش شامل فقط یک گوینده است و با برچسب گذاری مشخص می شود که هر بخش مربوط به کدام گوینده است. تشخیص فعالیت گفتاری، تقطیع گفتار و خوشه-بندی گویندگان، حداقل مراحل اصلی سامانه های تقطیع و خوشه بندی گفتار بر اساس گوینده محسوب می شوند. برای مرحله ی تقطیع روش های متعددی وجود دارد که تقطیع بر مبنای BIC یکی از روش های مرسوم است. این روش به دلیل محاسبات آماری آن، نیاز به زمان محاسبات طولانی دارد. هدف اصلی این مقاله ارائه ی روش تقطیع بر اساس بسامد گام گفتار است، که هم دارای دقتی در حد روش های مرسوم است و هم دارای سرعت محاسبات بالا است، به طوری که در مقایسه با تقطیع بر اساس BIC به طور میانگین دارای مزیت 4/2 برابری در سرعت و افزایش یک درصد در دقت است.

کلیدواژه ها:

تقطیع و خوشه بندی گویندگان ، تقطیع گفتار ، بسامد گام گفتار

نویسندگان

بهروز عبدالعلی

دانشگاه امام حسین

حسین صامتی

دانشگاه صنعتی شریف

محمد حسین قزل ایاغ

دانشگاه امام حسین