دانشگاه آزاد اسلامی
واحد تهران جنوب
دانشکده تحصیلات تکمیلی
“M.Sc” پایان نامه برای دریافت درجه کارشناسی ارشد
مهندسی برق – الکترونیک
عنوان:
تعیین محدوده قطعات همخوان و سکوت به روش ترکیبی شبکه عصبی و ویولت
برای رعایت حریم خصوصی اسامی استاد راهنما،استاد مشاور و نگارنده درج نمی شود
تکه هایی از متن به عنوان نمونه :
(ممکن است هنگام انتقال از فایل اصلی به داخل سایت بعضی متون به هم بریزد یا بعضی نمادها و اشکال درج نشود ولی در فایل دانلودی همه چیز مرتب و کامل است)
چکیده:
یکی از کاربردهای نیازمند پردازش صحبت، تشخیص یا بازشناسی صحبت است. سامانه های تشخیص صحبت، دربرگیرنده محدوده وسیعی از کاربردها در سامانه های آموزشی، سامانه های پردازش واژه، کنترل کامپیوترها بوسیله صحبت و به طور خاص، سامانه های کنترلی برای افراد نابینا و معلول حرکتی هستند. در این میان، شناسایی واج های همخوان در یک سیگنال صحبت، به دلیل طبیعت ناپایدار، نامتناوب و نامنظم شان، همواره امری پیچیده بوده است. هدف ما در این پروژه، تعیین محدوده قطعات همخوان و سکوت و طبقه بندی آنها در سیگنال صحبت با استفاده از روش ترکیبی تبدیل ویولت گسسته (DWT) و شبکه عصبی Fuzzy ARTMAP، میباشد. استفاده از تبدیل ویولت (موجک)، محاسبات را کاراتر، آسانتر و امکان انجام کاربردهای بیدرنگ را فراهم می آورد. تبدیل ویولت به دلیل فراهم آوردن امکان تحلیل زمان – فرکانس و تحلیل چندتفکیکی برای پردازش سیگنال های ناپایدار، نظیر سیگنال صحبت، بسیار مناسب است. همچنین در این پروژه از شبکه عصبی Fuzzy ARTMAP به دلیل داشتن ساز و کار یادگیری سریع، پایدار و بازدهی بالا در کاربردهای طبقه بندی (به دلیل استفاده از تئوری فازی) استفاده کرده ایم.
مقدمه:
برای قطعه بندی سیگنال صحبت در مرتبه رویداد، از روش قطعه بندی اتوماتیک ارائه شده در مرجع استفاده شده است. در این روش، سه راهکار بر مبنای تغییرات آکوستیکی و طیفی سیگنال صحبت و نیز تغییرات بارز در داده های فرمنت، بکار گرفته شده اند. به این ترتیب، ابتدا سیگنال صحبت به سه دسته واکدار، بیواک و سکوت (V/U/S) طبقه بندی میشود. سپس با در نظر گرفتن همزمان تغییرات طیفی سیگنال در یک دوره کوتاه زمانی، تغییرات در دامنه و فرکانس فرمنتها و مشخصه های آکوستیکی، مرز میان رویدادها آشکارسازی میشود. در ادامه، با استفاده از تبدیل ویولت و یکسری تحلیل های زمانی و فرکانسی، مشخصه های مربوط به قطعات آشکارسازی شده سیگنال صحبت، استخراج میشود.
تبدیل فوریه معمولی، اطلاعات لحظه ای و گذرای سیگنال صحبت را از بین میبرد. همچنین تبدیل فوریه زمان کوتاه (STFT)، گرچه امکان تحلیل همزمان بهتری را در حوزه زمان – فرکانس فراهم می آورد، اما به علت عدم قابلیت تفکیک پذیری متغیر در حوزه زمان – فرکانس، اغلب برای تحلیل سیگنالهای صحبت، مناسب نمیباشد. تبدیل ویولت به دلیل دارا بودن قابلیت تفکیک پذیری متغیر، از پنجره های کوتاه در زمان (گسترده در فرکانس)، جهت بررسی رفتار گذرای سیگنال و از پنجره های بزرگ در زمان (متمرکز در فرکانس)، برای بررسی رفتار دراز مدت سیگنال، استفاده میکند. به همین خاطر، تبدیل ویولت، ابزاری نیرومند جهت تحلیل سیگنال های غیر ایستایی نظیر سیگنال صحبت محسوب میشود. در این پروژه، برای تعیین محدوده همخوان ها و سکوت و نیز استخراج مشخصه های آنها از ترکیب تحلیلهای زمانی و فرکانسی و نیز برای طبقه بندی آنها از شبکه عصبی Fuzzy ARTMAP استفاده شده است.
در فصل اول، به معرفی مفاهیم اولیه ای چون سامانه گویش انسان، مدل تولید گفتار، آواهای زبان فارسی و مشخصه های نوای گفتار پرداخته میشود. فصل دوم به موضوع تقطیع سیگنال صحبت پرداخته است. در این فصل، روش بکار گرفته شده جهت آشکارسازی رویدادها در یک سیگنال صحبت و تعیین مرز میان قطعات، شرح داده میشود. در فصل سوم، اطلاعاتی پیرامون تبدیل ویولت، مقایسۀ آن با FT و STFT و روشهای پیاده سازی تحلیل ویولت آورده شده است. فصل چهارم به موضوع شبکه عصبی اختصاص داده شده است. در این فصل، مفاهیم اولیه شبکه های عصبی، انواع شبکه های عصبی مصنوعی از نظر برگشت پذیری، شبکه ART، شبکه عصبی Fuzzy ART و شبکه عصبی Fuzzy ARTMAP مورد بحث قرار گرفته است. در فصل پنجم، تشریح روند انجام این پروژه و چگونگی بکارگیری امکانات و مفاهیم معرفی شده در فصل های پیشین برای رسیدن به اهداف مورد نظر، گنجانده شده است. فصل ششم نیز در برگیرنده نتایج و پیشنهادات حاصل از انجام این پروژه است.
برای دانلود متن کامل پایان نامه اینجا کلیک کنید.
لینک بالا اشتباه است
:: بازدید از این مطلب : 515
|
امتیاز مطلب : 3
|
تعداد امتیازدهندگان : 1
|
مجموع امتیاز : 1