تشخیص گوینده
1507. بررسی و ارزیابی چند روش تشخیص جنسیت گوینده از روی گفتار
مقاله شبیه سازی شده کد پروژه:1507 موضوع:پردازش گفتار بررسی و ارزیابی چند روش تشخیص جنسیت گوینده از روی گفتار شامل:مقاله اصلی +گزارش کاملی از ده مقاله در این مورد و شبیه سازی با متلبMatlab عنوان مقالات: 1-A Comparative Study of Gender and Age Classification in Speech Signals 2-Age and Gender Classification using Fusion of Acoustic and Prosodic Features 3-Age and Gender Recognition from Speech Patterns Based on Supervised Non-Negative Matrix Factorization 4-Age and Gender Classification using Fusion of Acoustic and Prosodic Features 5-Combining Five Acoustic Level Modeling Methods for Automatic Speaker Age and Gender Recognition 6-COMPARISON OF FOUR APPROACHES TO AGE AND GENDER RECOGNITION FOR TELEPHONE APPLICATIONS 7-تشخيص جنسيت به كمك شبكه عصبي mpl و شبکه عصبی ژنتیک و شبکه anfis 8-Genderr ecognitionfr oms peechP. art I: Coarsea nalysis 9-تشخيص جنسيت گوينده صدا با استفاده از فرآيندهاي تصادفي چکیده: مطالعات پزشکی نشان می دهد که دستگاه صوتی آقایان بزرگتر از خانم هاست و از آنجایی که بسیاری از ویژگی های صوتی ناشی از اندازه و شکل اندام گویایی است پس این تفاوت مطمئنا باید (حداقل) در یک ویژگی صوتی تاثیر بگذارد. یکی از این تاثیرها روی تفاوت فرکانسی است. فرکانس گفتار خانم و آقا یکسان نیست؛ فرکانس خانمها بالاتر و در محدوده 250-450هرتز و آقایان پایین تر و در محدوده 50-250 است. بنابراین اگر فرکانس پایه گفتار را در صوت تشخیص بدهیم بنابر محدوده فرکانسی گفتار قادر به تشخیص جنسیت گوینده هستیم که با روشهای مختلفی می توان این فرکانس پایه را بدست آورد. هم چنین در این مقاله از روش های دیگری نظیر انواع شبکه های عصبی و استفاده از انرژی جنبشی صوت و مخزوط گوسی نیز بررسی شده و همینطور ترکیب چند روش در کنارهم برای بهبود کارآیی و دقت و سرعت سیستم مطرح شده است. کلمات کلیدی: تشخیص جنسیت ؛ فرکانس پایه ؛ مدل مخلوط گاوسی ؛ شبكه عصبي MLP؛ شبكه عصبي ANFIS؛ ضرایب MFCC؛ ضرایب LPCC سفارش پروژه
ترجمه مقاله تعیین هویت گوینده مستقل از متن، توسط مدل های مخلوط گاوس
عنوان انگلیسی مقاله: Efficient Text-Independent Speaker Verification with Structural Gaussian Mixture Models and Neural Networkعنوان فارسی مقاله: تعیین هویت گوینده مستقل از متن، توسط مدل های مخلوط گاوس ساختاری و شبکه های عصبیدسته: کامپیوتر و فناوری اطلاعاتفرمت فایل ترجمه شده: WORD (قابل ویرایش)تعداد صفحات فایل ترجمه شده: 26لینک دریافت رایگان نسخه انگلیسی مقاله: دانلودترجمه ی سلیس و روان مقاله آماده ی خرید می باشد._______________________________________چکیده ترجمه:چکیده – ما سیستم یکپارچه ای را در ارتباط با مدل های مخلوط گاوس ساختاری (SGMM) و شبکه های عصبی به منظور دستیابی به راندمان محاسباتی و دقت بالا در ارتباط با تعیین هویت گوینده ارائه می دهیم. مدل پس زمینه ساختاری (SBM) در ابتدا از طریق خوشه بندی زنجیره ای تمام موئلفه های مخلوط گاوس در ارتباط با مدل پس زمینه ساختاری ایجاد می گردد. به این ترتیب، یک فضای اکوستیک به بخش های چندگانه ای در سطوح مختلف قدرت تشخیص، جزء بندی می گردد. برای هر یک از گوینده های مورد نظر، مدل مدل مخلوط گاوس ساختاری (SGMM) از طریق استدلال حداکثری (MAP) سازگار با مدل پس زمینه ساختاری (SBM) ایجاد می گردد. در هنگام تست، تنها زیرمجموعه کمی از موئلفه های مخلوط گاوس برای هر بردار مختصات محاسبه می گردد تا هزینه محاسبه را به طور قابل توجهی کاهش دهد. علاوه بر این، امتیازات حاصل شده در لایه های مدل های درخت ساختار، برای تصمیم گیری نهایی از طریق شبکه عصبی ادغام می گردند. وضعیت های مختلفی در بررسی های انجام شده بر روی داده های حاصل از گفتگوهای تلفنی مورد استفاده در ارزیابی هویت گوینده NIST ، مقایسه شد. نتایج تجربی نشان می دهد که کاهش محاسبه توسط فاکتور 17 از طریق 5% کاهش نسبی در میزان خطای هم ارز (EER) در مقایسه با خطو مبنا، حاصل می گردد. روش SGMM-SBM (مدل مخلوط گاوس ساختاری- مدل پس زمینه ساختاری)، مزایایی را نسبت به مدل اخیرا مطرح شده GMM (مدل مخلوط گاوس) داشته، که شامل سرعت بالاتر و عملکرد تشخیص بهتر، می باشد.کلیداژه: خوشه بندی گاوس، شبکه عصبی، تعیین هویت گوینده، مدل مخلوط گاوس ساختاری1. مقدمهتحقیقات بر روی تشخیص گوینده که شامل تعیین هویت و تطبیق موارد می باشد به عنوان یک مورد فعال برای چندین دهه به شمار آورده می شود. هدف این می باشد تا تجهیزانت داشته باشیم که به صورت اتوماتیک فرد خاصی را تعیین هویت کرده یا فرد را از طریق صدای او تشخیص دهیم. بنابر روش های زیست سنجی، تشخیص صدای افراد می تواند در بسیاری از موارد همانند، شبکه های امنیتی، تراکنش های تلفنی و دسترسی به بخش ها کاربرد داشته باشد. گوینده ها به دو گروه تقسیم می شوند.گوینده های هدفمند و گوینده های ...
دانلود کد تشخیص گوینده در متلب
برنامه Open source تشخیص گوینده در نرم افزار متلب : برای دانلود کلیک کنید ... اعمال جبر در سمبلیک+ انتگرال گیری و مشتق گیری سمبلیک + استاندارد سازی و ساده سازی عبارات سمبلیک + تابع collect + تابع factor + تابع expand + محاسبه سمبلیک تبدیل لاپلاس + عکس لاپلاس + محاسبه سمبلیک تبدیل z در متلب + عکس تبدیل z + حل معادلات جبری + حل معادلات دیفرانسیل به روش سمبلیک + آشنایی با پنجره های MATLAB + مقدمات کار با MATLAB + محاسبات عددی آرایه ها + آرایه های استاندارد + اندازه ماتریس ها + ایجاد تغییر در ماتریس ها + مرتب آردن آرایه ها + جستجو در آرایه ها + کاربرد در داده های آماری + ماتریس به عنوان ضرایب چند جمله ای + ماتریس به عنوان مجموعه + محاسبات ماتریسی + مدیریت فایل ها و متغیرها + تابع plot + بر چسب ها، تنظیمات و ... + نمودارهای متعدد + ساخت function file + حلقه های تکرار + حلقه for + حلقه while + عملگرهای منطقی + شرط If - Else – End + شرط Switch-Case + توقف روند اجرای برنامه + MATLAB چیست؟ + استفاده از help + استفاده ازdemo + عملیات ابتدایی در مطلب+ تعریف کردن آرایه ها و عملیات جبری روی آنها + ذخیره کردن و بازیابی داده ها + عملیات ماتریسی روی آرایه ها + عملیات عضو به عضو روی آرایه ها + تنظیم خروجیها روی صفحه نمایش با دستورات format و disp + چند جمله ایها + ریشه های یک چند جمله ای + محاسبه
سیگنال
۱- اهمیت مدلسازی سیگنال تشخیص کامپیوتری صحبت در واقع بر دارندهی دو نوع عمل اصلی تشخیص است: تشخیص صحبت و تشخیص گوینده. با تحلیل یک موج صوتی میتوان خصیصههای۱ اندامهای گفتاری گوینده را تخمین زد که این خصیصهها راهکاری برای تشخیص هویت و تصدیق آن به روش زیستسنجی فراهم میآورند. در مقابل، سیستمهای تشخیص صحبت برای درک مفهوم موج صوتی گفته شده تلاش میکنند. جهت بیشتر تحقیقات فعلی در فنآوری تشخیص صحبت به سمت ایجاد سیستمهای مستقل از گوینده است که توانایی تبدیل صحبت همهی گویندگان را داشته باشد. در حالی که اهداف این دو نوع سیستم کاملاً متفاوت به نظر میرسند هر دو عمیقاً از آبشخوری به نام الگوریتمهای پردازش سیگنال برای استخراج خصیصهها۲ تغذیه میشوند. در هر دو زمینه تلاش برای پیدا کردن دستهای از خصیصهها که در مقابل تغییرات محیطی پایدار باشند ادامه دارد. این قسمت مروری خواهد داشت بر الگوریتمهای استخراج خصیصهها که در هر دو زمینه استفاده شدهاند و شامل ارزیابی کوتاهی از الگوریتمهای گوناگون مدلسازی سیگنال با آزمایشهای تشخیصی کوچک میباشد. ۲- آشنایی با مدلسازی سیگنال هدف سیستمهای تشخیص گوینده بازشناسی خصیصههای اندامهای گفتاری و حالت صحبت کردن با استفاده از صدای گوینده به منظور اهداف تشخیص هویتی میباشد. ساختار اندامهای صوتی، اندازهی چالهی بینی و ویژگیهای تارهای صوتی همگی با استفاده از تحلیل سیگنال قابل تخمین هستند. تشخیص گوینده اصطلاحی کلی است که به اعمال تشخیص هویت گوینده و تأیید هویت گوینده اطلاق میگردد. برای تشخیص، خصیصههای تخمینی گوینده با خصیصههای موجود در یک پایگاه دادهها از کاربران ثبت شده برای یافتن نزدیکترین خصیصههای قابل تطبیق مقایسه میشوند. برای تأیید هویت، ادعای هویتی گوینده بر اساس امضای زیستسنجی وی پذیرفته میشود و یا رد میگردد. شکل شماره ۱ – وظایف مختلف تشخیص صحبت تلاش دارد تا یک سیگنال صوتی صحبت را به واژهها تبدیل کند. انسانها واژهها را با حرکت دادن اندامهای صوتی به یک سری از مکانهای قابل پیشبینی ادا میکنند. اگر این دنبالهها از سیگنال استخراج گردند واژههای گفته شده میتوانند تشخیص داده شوند. بسیاری از کاربردهای تشخیص صحبت نیازمند سیستمهای مستقل از گوینده میباشند این تولیدات میتوانند صحبت هر گویندهای را تشخیص دهند. اگر چه این دو هدف کاملاً متفاوت به نظر میرسند هر دوی آنها بر روی دادههای صحبت تشخیص الگو را اعمال میکنند. بعضی از سیستمهای موجود مانند Nuance ۶ server هم تشخیص صحبت و هم تأیید هویت گوینده را به صورت همزمان اعمال ...
مروری بر سیستم تشخیص گفتار و کاربرد آن
چكيده: سيستم تشخیص گفتار نوعی فناوری است که به یک رايانه این امکان را می دهد که گفتار و کلمات گوینده را بازشناسی و خروجي آنرا به قالب مورد نظر، مانند "متن"، ارائه كند. در این مقاله پس از معرفی و ذكر تاريخچهاي ازفناوري سیستم ها تشخيص گفتار، دو نوع تقسیم بندی از سيستمها ارائه می شود، و سپس به برخی ضعف ها و نهایتاً کاربرد این فناوری اشاره می شود. كليد واژه ها: سيستمهاي تشخیص گفتار، فناوري اطلاعات، بازشناسي گفتار 1. مقدمهگفتار برای بشر طبیعی ترین و کارآمدترین ابزار مبادله اطلاعات است. کنترل محیط و ارتباط با ماشین بوسیله گفتار از آرزوهای او بوده است.طراحی و تولید سیستم های تشخیص گفتار هدف تحقیقاتی مراکز بسیاری در نیم قرن اخیر بوده است.یکی از اهداف انسانها در تولید چنین سیستم هایی مسلماً توجه به این نکته بوده است که "ورود اطلاعات به صورت صوتی ،اجرای دستورات علاوه بر صرفه جویی در وقت و هزینه ،به طرق مختلف کیفیت زندگی ما را افزایش می دهند.امروزه دامنه ای از نرم افزارها (که تحت عنوانSpeech Recognition Systems معرفی می شوند) وجود دارند که این امکان را برای ما فراهم کرده اند.با استفاده از این تکنولوژی می توانیم امیدوار باشیم که چالش های ارتباطی خود را با محیط پیرامون به حداقل برسانیم.2.تعریف قبل از پرداختن به به سیستم های تشخیص گفتار لازم است که فناوری تولید گفتار و تشخیص گفتار با تعریفی ساده از هم متمایز شوند: ● فناوری تولید گفتار(Text To Speech):تبدیل اطلاعاتی مثل متن یا سایر کدهای رایانه ای به گفتاراست.مثل ماشین های متن خوان برای نابینایان،سیستم های پیغام رسانی عمومی. سیستم های تولید گفتار به خاطر سادگی ساختارشان زودتر ابداع شدند. این نوع از فناوری پردازش گفتار موضوع مورد بحث در این مقاله نیستند. ● فناوری تشخیص گفتار(Speech Recognition System ): نوعی فناوری است که به یک کامپیوتراین امکان را می دهد که گفتارو کلمات گوینده ای را که از طریق میکروفن یا پشت گوشی تلفن صحبت می کند،بازشناسی نماید. به عبارت دیگر در این فناوری هدف خلق ماشینی است که گفتار را به عنوان ورودی دریافت کند و آنرا به اطلاعات مورد نیاز (مثل متن)تبدیل کند. 3.تاریخچه فناوری تشخیص گفتاراولین سیستم های مبتنی بر فناوری تشخیص گفتار در سال 1952 در"آزمایشگاههای بل"طراحی شد.این سیستم به شیوه گفتار گسسته و به صورت وابسته به گوینده و با تعداد لغت محدود 10 لغت عمل می کرد.در اوایل دهه 80 میلادی برای اولین بار الگوریتم مدلهای مخفی مارکوف "Hidden Markov Model" ارائه شد.این الگوریتم گامی مهم در طراحی سیستم های مبتنی بر گفتار پیوسته به حساب می آمد.همچنین در طراحی این سیستم از مدل شبکه عصبی ...
نرمافزار تشخیص گفتار فارسی به بازار میآید
نرمافزار تشخیص گفتار فارسی به بازار میآید<?xml:namespace prefix = o ns = "urn:schemas-microsoft-com:office:office" /> آیا با پیشرفت فناوریهای نوین بالاخره زمانی خواهد رسید که دیگر نیازی به تایپ کردن با نوشتن متن نباشد و تنها با خواندن متن، بتوان آن را تایپ کرد؟ بهنظر میآید که چنین پیشرفتی در آینده نزدیک محقق خواهد شد. امروزه نرمافزارهای تشخیص فرمانهای صوتی به صورتی محدود در انواع کامپیوترها و بهخصوص روی گوشیهای موبایل نصب شده است. با کمک این تکنولوژی ارتباط انسان با کامپیوتر بسیار راحتتر و سریعتر شدهاست و بهزودی آرزوی بشر در برقراری ارتباط گفتاری با ماشینها تحقق خواهد یافت. تایپ کامپیوتری هم از جمله کارهای متداول و وقتگیر برای کاربرهای عادی و پیشرفته کامپیوتر است؛ به ویژه که این مسئله برای کاربرانی که به هر دلیل مایل به استفاده از صفحه کلید نیستند، کاری خستهکننده است و استفاده از قابلیت تشخیص خودکار گفتار توسط کامپیوتر باعث سهولت و صرفهجویی در زمان تایپ میشود. تلاش گروههای تحقیقاتی و شرکتهای خارجی برای دستیابی به تکنولوژی تشخیص گفتار به عنوان یکی از تکنولوژیهای سطح اول دنیا، به چندین دهه میرسد، ولی به دلیل پیچیدگی موجود در گفتار انسان هنوز رسیدن به دقت صددرصد امکانپذیر نشده است. نخستین نرمافزار فارسی در کشورمان نیز فعالیتهایی در زمینه طراحی و ساخت نرمافزارهای تشخیص گفتار به زبان فارسی آغاز شدهاست. در این راستا گروهی از فارغالتحصیلان دانشگاه صنعتی شریف از سال 82 اقدام به تهیه موتور تشخیص گفتار پیوسته فارسی کردهاند. برای بالا بردن دقت این نرمافزار در تشخیص گفتار فارسی، از مدلهای آماری و همچنین مدلهای دستوری زبان استفاده شده است. ارایی این سامانه که «نویسا» نام دارد، در شرایط آزمایشگاهی و محیط آرام و بدون نویز قابل قبول است، اما زمانی که از آن در عمل و در شرایط عادی مانند داخل اداره، استفاده میشود، کارایی سامانه افت شدیدی دارد. برای جبران این مسئله از راهحلهایی جهت مقاومسازی سامانه به تغییرات موجود در شرایط آکوستیکی محیط و تغییرات موجود بین گویندههای مختلف استفاده شده است، به گونهای که سامانه موجود که مستقل از گوینده و با واژگان بزرگ است، با بهرهگیری از بهترین روشهای مقاومسازی میتواند خود را با شرایط محیطی جدید و صدای گوینده تطبیق دهد. این مسئله سامانه جاری را به نمونهای موفق و کاربردی در مقایسه با انواع خارجی مشابه کرده است. بهاین ترتیب، نسخه جاری این سامانه دارای دقت تشخیص 95درصد در محیط اداری، قابلیت استفاده در همه ویرایشگرها یا ...
لب خوانی چیست؟
مقدمهمشاهده گوینده نه تنها درک گفتار شنیده شده را در حضور نویز بهبود می بخشد بلکه حتی می تواند چگونگی درک یک صدا را نیز متاثر کند.لب خوانی می تواند نقشی اساسی در بهبود ارتباطات ،افزایش استفاده از سمعک ودیگر وسایل تقویتی داشته و ابزاری هماهنگ کننده در زندگی روزمره در خانواده و اجتماع به حساب آید.هرچه میزان آسیب شنوایی بیشتر باشد ،فرد بیشتر متکی به اطلاعات بینایی برای برقراری ارتباط می شود. فرد آسیب دیده شنوایی به طور ذاتی دارای این توانایی است که نقص خود را در مورد اطلاعات شنیداری با لب خوانی جبران کندلب خوانی چیست؟پروسه ای است شبیه خواندن که طی آن فرد از طریق سیگنال های بینایی ارتباط برقرار می کند.لب خوانی 2مرحله دارد:1)فرد یاد بگیرد که چگونه توالی الگو های بینایی را به ذهن بسپارد.2)درک پیام.لازمه ی درک پیام داشتن زبان واحد میان گوینده و لب خوان است.آموزش لب خوانی در بزرگ سالانی که زبان پایداری قبل از آسیب شنوایی داشته اند به مراتب راحت تر از کودکانی است که هیچ ذخیره ی زبانی ندارند.مسلما می توان مهارت های لب خوانی را با آموزش و تمرین بهبود بخشید.اما تفاوت های فردی علی رغم آموزش نیز وجود دارد. چه کسی لب خوان بهتری است؟تحقیقات خیلی زیاد نشان داد ه که پیش بینی چگونگی اجرای لب خوانی ،مشکل است.اجرا لب خوانی را نمی توان توسط عواملی چون :هوش فرد، موفقیت آموزشی (تحصیلات)، مدت زمان نا شنوایی، سن شروع آسیب شنوایی، پیش بینی نمود.تعدادی از متغییر ها تا اندازه ای می تواند قابل پیش بینی باشد،برای مثال به طور متوسط زنان نسبت به مردان لب خوان بهتری هستند.مردم در لب خوانی کردن هایشان بسیار متفاوت هستنداگر فردی از پشت پنجره بسته با شما صحبت کند ،شما می توانید اورا ببینید اما نمی توانید صدای اورا بشنوید،در چنین حالتی شما کمتر از 20درصد کلمات گفته شده را تشخیص خواهید داد.در مواردی که هم چهره ی شخص گوینده و هم سیگنال گفتاری وی را دریافت کنیم اطلاعات بیشتری از مکالمه در اختیار ما قرار می گیرد.چرا لب خوانی کردن اینقدر مشکل است؟پاسخ این سوال مربوط می شود به عواملی چون:- قابلیت رؤیت اصوات- سرعت گفتار- آموزش- زاویه ی دید- تاثیرات Coarticulation واسترس- تاثیرات گویندهVisemes & Homophenous- قابلیت رؤیت اصواتدر بسیاری از اصوات حرکات دهان که قابل مشاهده است اندک می باشد کلماتی که روی چهره و دهان بیشتر قابل مشاهده هستند،اغلب با همخوان هایی ایجاد می شوند که با بسته شدن لب هاتولید می شوند مانند// p.b.m ویا همخوان هایی که با فشار دادن دندان های جلویی فک بالا بر لب پایین تولید می شوند مانند/f.v/ ویا اینکه نوک زبان به دندان های جلویی فک بالا تماس ...
نرم افزار تایپ گفتار فارسی طراحی شد
در پی دستیابی متخصصان یک شرکت دانش بنیان ایرانی به فن آوری پیشرفته طراحی و ساخت نرم افزار تشخیص گفتار پیوسته فارسی و امکان تایپ مستقیم گفتار توسط رایانه ، نسخه جدید این نرم افزار با قابلیت های قرائت متون مختلف و تشخیص خودکار گوینده طراحی شد. به گزارش ایسنا، دکتر هادی ویسی، مدیرعامل شرکت سازنده این نرم افزار گفت: در نسخه جدید نرم افزار تایپ گفتار فارسی (نویسا) چهار قابلیت جدید به کاربران عرضه شده است. این نرم افزار علاوه بر تایپ سریع متون همزمان با گفتار گوینده، قابلیت تبدیل متن به گفتار را هم دارد به طوری که می تواند متون مختلف داخل رایانه از جمله متونی که توسط خود نرم افزار نویسا تایپ شده را قرائت کند. وی خاطرنشان کرد: یکی دیگر از قابلیت هایی که به این نرم افزار افزوده شده، تشخیص لهجه و لحن و ایجاد پروفایل شخصی برای تمامی کاربران نرم افزار است. در نسخه جدید نویسا تعدادی صدای پیش فرض ضبط شده که وقتی کاربر تازه ای که صدای او در بخش آموزش صدای نرم افزار وارد نشده با آن کار می کند، نرم افزار با قابلیت تشخیص خودکار گوینده تشخیص می دهد که صدای او به کدام یک از صداهای پیش فرض نزدیک است و خود را با پروفایل آن هماهنگ می کند و در نتیجه نرم افزار در تشخیص گفتار و تایپ صحیح کلمات افزایش می یابد. این قابلیت در کاربردهایی مانند تایپ سخنرانی ها و صحبت هایی که حاوی صدای چند نفر است (مانند مذاکرات صحن علنی مجلس) کارآیی نرم افزار را بسیار افزایش می دهد. وی، امکان کنترل صوتی رایانه و تقویت بخش فرمان های صوتی را از دیگر قابلیت های نسخه جدید عنوان و خاطرنشان کرد: تقریبا تمام کارهای رایانه شامل اجرا و کنترل برنامه های نصب شده در آن می تواند با صوت انجام شود. به این صورت که فرد می تواند با صحبت کردن کارها را انجام دهد، مثلا با گفتن «بزرگ تر» اندازه متن تایپ شده در نرم افزار Word بزرگ تر می شود؛ یا با گفتن «حذف کلمه قبلی» آخرین کلمه قبل از نشان نما پاک می شود.
صدای خود را جایگزین رمز عبور ایمیل و کلید ساختمانها کنید!
در پی دستیابی متخصصان یک شرکت دانشبنیان ایرانی به فنآوری پیشرفته طراحی و ساخت نرمافزار تشخیص گفتار پیوسته فارسی و امکان تایپ مستقیم گفتار توسط رایانه، نسخه جدید این نرمافزار با بانک واژگان دو برابر غنیتر و دقت بسیار بالاتر در تشخیص گفتار و تایپ طراحی شد. دکتر هادی ویسی، مدیر عامل شرکت سازنده این نرمافزار اظهار داشت: نرمافزار تایپ گفتار فارسی که براساس فناوری تشخیص گفتار پیوسته مستقل از گوینده فارسی طراحی شده میتواند گفتار کاربران را که از طریق میکروفن به رایانه منتقل میشود در محیطهای مختلف تایپ کند.برای این کار کافی است که یک میکروفن را به رایانه متصل کرده و متن مورد نظر خود را بخوانید.در این حالت کلام شما به رایانه منتقل شده و نرمافزار آن را پردازش کرده و به متن معادل تبدیل میکند.این نرمافزار همچنین امکان تبدیل فایلهای صوتی ضبط شده به متن را نیز را دارد به طوری که میتوان فایل یک سخنرانی یا مذاکرات یک نشست (با گفتار رسمی) را به نرمافزار دارد و متن تایپ شده آن را تحویل گرفت. وی خاطرنشان کرد: از قابلیتهایی این نرمافزار تشخیص لهجه و لحن و ایجاد پروفایل شخصی برای تمامی کاربران نرمافزار است. ویسی تصریح کرد: مهمترین ویژگی نسخه جدید نرم افزار نویسا که در سه ورژن مختلف عرضه شده کاهش قیمت چشمگیر آن از دو میلیون و 950 هزار تومان و یک میلیون و 400 هزار تومان به 980، 680 و حتی 280 هزار تومان در نسخه خانگی است.همچنین درنسخه جدید نویسا، علاوه برارتقای فنی این نرمافزار از نظر دقت و رفع برخی ازمحدودیتها، بانک واژگان نرمافزار به حدود دوبرابر - تا 120 هزار کلمه - افزایش یافته است.این درحالی است که نسخه قبلی آن 65 هزارکلمه داشت. درنسخ جدید نویسا، بانک کلمات نسخههای تخصصی (پزشکی و حقوقی) به 120 هزارکلمه و برای نسخه عمومی حرفهای به 110 هزار کلمه ارتقا داده شده است. وی خاطرنشان کرد: در نسخههای ابتدایی نویسا در صورت فعال بودن نرمافزار، هر کلامی که از دهان کاربر خارج میشد تایپ میشد؛ مثلاً در مواردی مثل کاربردهای پزشکی، وقتی پزشک مشغول گزارشدهی است و ناگهان شخصی وارد اتاق میشود یا ناگریز از پاسخ دادن به تلفن است در صورت فعال بودن برنامه همه گفتارهای وی تایپ میشد. در نسخه های جدید با ارتقای اینترفیس کاربر و رایانه، فرد میتواند به صورت صوتی فرمان روشن یا خاموش را به نرمافزار بدهد تا فعالیت آن در مواردی که کاربر مایل به ضبط گفتارش نیست قطع شود. ویسی یکی دیگر از قابلیتهای نسخه جدید نرمافزار را امکان ویرایش خودکار متون عنوان و اعلام کرد: عرضه عمومی نسخه جدید نرمافزار ...
روشهای تشخیص هویت بیومتریک (Biometric Methods)
امروزه در امور مربوط به امنیت اماکنی مانند دانشگاه ها، فرودگاه ها، وزارتخانه ها و حتی شبکههای کامپیوتری استفاده از روش های بیومتریک در تشخیص هویت یا تایید هویت افراد بسیار متداول شده است .سیستمهای پیشرفته حضور و غیاب ادارات، سیستمهای محافظتی ورود خروج اماکن خاص، نوتبوکهای مجهز به Finger Print و ... از روشهای مختلف تشخیص هویت بیومتریک استفاده میکنند. در این مقاله سعی میکنیم به صورت مختصر، مروری بر روش¬های مختلف بیومتریک داشته باشیم. مقدمه کلمه Biometric از ترکیب دو کلمه یونانی bios (زندگی) و metrikos (تخمین) شکل گرفته است. بیومتریک عبارت است از، تشخیص هویت افراد با استفاده از ویژگی های فیزیولوژی و رفتاری آنها. این یک تعریف کلی از واژه بیومتریک است. با استناد به این تعریف میتوان گفت که همه افراد در زندگی روزمره خود، ناخودآگاه از بیومتریک استفاده میکنند.به عنوان مثال هویت افرادی که با آنها سرو کار داریم را میتوان از روی صدا، چهره و حتی طرز راه رفتنشان تشخیص دهیم بنابراین میتوان تاریخچه استفاده از بیومتریک را به قدمت تاریخ بشر دانست. سیستم های بیومتریک سیستمهای بیومتریک باید با درصد قابل توجهی قابل اعتماد باشند تا سیستم در تشخیص افراد و اجازه دسترسی آنها اشتباه نکند. در مقایسه با روش های سنتی تشخیص هویت مانند رمز عبور و کارت شناسایی می توان به این مزایای بیومتریک اشاره کرد: • قرض داده نمی شوند. • دزدیده نمی شوند. • گم و یا فراموش نمی شوند • خراب نمی شوند. معمولا یک سیستم بیومتری به کمک الگوریتم های تشخیص الگو (Pattern Recognition) سعی در استخراج ویژگی هایی(features) از رفتار یا ساختار فیزیولوژی فرد می کند و سپس این ویژگی ها را در دیتابیسی ( برای تشخیص و تایید هویت) ذخیره می کند. سیستم هایی که بر اساس علائم فیزیولوژی عمل می کنند بسیار مطمئنتر از سیستم های رفتاری هستند. یک سیستم بیومتریک شامل 4 بخش بنیادی است : • Sensor Module : قسمت نمونه برداری که اطلاعات خام مورد نیاز را جمع آوری می کند. مانند تصویر اثر انگشت. • Feature extraction Module : قسمت پردازش برای استخراج ویژگی ها از اطلاعات مرحله قبل. • Matching Module : قسمت مطابقت که بررسی می کند آیا اطلاعات جمع آوری شده با اطلاعات الگو مطابقت می کند یا خیر؟ مثلا تشخیص می دهد که آیا اطلاعات بدست آمده می تواند متعلق به یک اثر انگشت باشد یا خیر، در صورت مطابقت بر حسب نیاز آن را ذخیره می کند و یا به مرحله بعدی برای تشخیص هویت می رود. • Decision-making Module : قسمتی که اطلاعات ورودی (ویژگی ها) را با اطلاعات ذخیره شده مقایسه می کند و اگر شباهت از درصد معلومی ...