بررسی تاثیر انتقال گفتار از طریق اینترنت بر سیستم های تعیین هویت گوینده

محمدمهدی همایونپور; شاهرخ فرخی راد

بررسی تاثیر انتقال گفتار از طریق اینترنت بر سیستم های تعیین هویت گوینده

محل انتشار: دومین کنفرانس بین المللی فناوری اطلاعات و دانش

سال انتشار: 1384

نوع سند: مقاله کنفرانسی

زبان: فارسی

مشاهده: 1,407

فایل این مقاله در 6 صفحه با فرمت PDF قابل دریافت می باشد

دریافت فایل کامل مقاله

صدور گواهی نمایه سازی
من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

https://civilica.com/doc/44011

شناسه ملی سند علمی:

ICIKT02_046

تاریخ نمایه سازی: 12 دی 1386

چکیده مقاله:

به منظور انجام تعیین هویت گوینده از طریق اینترنت لازم است که داده های گفتاری از طریق اینترنت منتقل شوند. حین این انتقال ممکن است که بسته های داده گم شده و یا دچار خرابی شوند. همچنین از آنجا که میتوان گفتار انتقالی از طریق اینترنت را به منظور کاهش حجم اطلاعات و صرفه جویی در استفاده از ظرفیت اینترنت فشرده نمود، لذا لازم می گردد که تاثیر فشرده سازی و روشهای کدینگ بر راندمان تعیین هویت مورد بررسی قرار گیرند. در این مقاله با استفاده از پروتکل های انتقال رسانه ها روی شبکه اینترنت، یک دادگان گفتار اینترنتی شامل گفتار 50 گویند (37 مرد و 13 زن) را برای آموزش و آزمایش سیستم تعیین هویت گوینده ضبط نموده و آنگاه با استفاده از انواع ویژگی ها و دو نوع شبکه عصبی با نظارت LVQ و بی نظارت SOM مدل های گویندگان را اموزش داده و در مرحله ی آزمون با مقایسه گفتار گوینده با مدل های موجود، نزدیکترین گوینده به آن گفتار را مشخص نموده ایم. آزمایش های بسیاری برای بررسی تاثیر ناشی از عبور گفتار از روی خطوط اینترنت بر راندمان تعیین هویت گوینده صورت گرفت که از آن جمله می توان به تاثیر ناشی از خراب شدن بسته های داده، از بین رفتن بسته های داده و نیز فشرده سازی گفتار اشاره نمود. بطور خلاصه می توان گفت برای 50 گوینده با حدود 2 دقیقه گفتار برای آموزش و 5 ثانیه سیگنال گفتار آزمون به بازدهی تقریبا برابر 96% و 100% برای تعیین هویت گوینده، بازاء گفتار کد و کدگشایی شده به روش MPEG-Layer 3 و گفتار بدون فشرده سازی رسیده ایم.

کلیدواژه ها:

بازشناسی گوینده ، تعیین هویت گوینده ، شبکه های عصبی ، اینترنت ، کدینگ گفتار

نویسندگان

محمدمهدی همایونپور

دکترای مهندسی برق، آزمایشگاه سیستم های هوشمند صوتی و گفتاری، دانشکده

شاهرخ فرخی راد

کارشناسی ارشد مهندسی کامپیوتر، آزمایشگاه سیستم های هوشمند صوتی و گفت

مراجع و منابع این مقاله:

لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :

S.Furui, ،An Overview Of Speaker Recognition Technology? , Workshop On ...
J. Davidson, J. Peters, B. Gracely, Voice over IP Fundamentals ...
M.M. H Omayounpour _ G. Chollet, *Speaker Verification via Supervised ...
J.R. Deller, J.G. Poakis, J.H.L. Hansen, ،، Di screte-Time Processing ...
Y. Bennani, P. Gallinari, ،، C onnectionist Approach for Automatic ...
L. Fausett, ،، Fund amental of Neural Networks?, Printce-Hall, 1994. ...
R.H. Nielsen, ،، NeuroC omputing _ Addis son-Wesley, 1991. ...

نمایش کامل مراجع