Gerçek zamanlı yüksek kalitede ses tanıma

View/ Open
Access
info:eu-repo/semantics/openAccessDate
2017Kind
masterThesisMetadata
Show full item recordCitation
Çakır, M. Y. (2017). Gerçek zamanlı yüksek kalitede ses tanıma. (Yüksek Lisans Tezi). İstanbul Sabahattin Zaim Üniversitesi Fen Bilimleri Enstitüsü.Abstract
Gelişen teknolojiyle birlikte insan-bilgisayar etkileşiminde birçok arayüz (etkileşim kurma şekilleri) oluşmuştur. Bu arayüzlerden biri de konuşma tanımadır. Konuşma tanıma, insan sesini aracılar olmadan bilgisayar tarafından okunabilecek bir forma çevirir. Böylelikle konuşma ile cihazları yönetme imkânı sağlanır. Sağladığı kolaylıkların kullanılma şekillerine göre değiştiği konuşma tanıma teknolojisi birçok uygulama alanına sahiptir. Bu alanlardan birisi olan konuşmanın yazıya çevrilmesi işlemi, geçmişten günümüze birçok çalışmaya konu olmuştur. Geleneksel çalışmalarda, belirli kişilerin konuşmalarının yazıya çevrilmesi hedeflenmiştir. Bu amaçlı uygulamalar konuşmacı bağımlı sistemlerdir. Fakat konuşmacı bağımlı sistemler, farklı konuşmaları, sisteme tanımlamadan başarılı olamamaktadır. Günümüzde ise akıllı cihazlar başta olmak üzere geliştirilen çoğu sistemler konuşmacı bağımsız olarak tasarlanmaktadır. Bu tezde dil ve konuşmacı bağımsız olarak konuşmaların, söz dizileriyle etiketlenerek gelişmesini hedefleyen sistem önerimi yapılmıştır. Etiketlenen konuşmalar ile bu alandaki araştırmalar için yenilikçi bir bakış açısı sayılabilecek dil bağımsız olarak gelişen metin kütüphanesi (corpus) tabanlı konuşma tanıma sistemi önerilmiştir. İlgilendiği konular kapsamında bu tez, sinyal işleme ve örüntü tanıma gibi farklı bilgisayar bilimlerinin kesişiminde yer almaktadır. Önerilen çalışmada nihai hedef, insanların akıllı cihazlarla etkili iletişim kurmaları için verimli teknikler ile başarısı yüksek gerçek zamanlı bir konuşma tanıma sistemi sunmaktır. Ayrıca bu tez kapsamında, konuşma tanıma alanında kullanılan teknikler karşılaştırılarak önerilen sistemin deneysel çalışması ve değerlendirilmesi yapılmıştır. Along with evolving technology, many interfaces (forms of interaction) have occurred in human-computer interaction. One of these interfaces is speech recognition. Speech recognition translates human voice into a form that can be read by the computer without intermediaries. This way, one has the possibility to manage the devices by speaking. The speech recognition technology, which has many application areas, provides facilities that are differentiated according to the ways of use. The process of translating one's speech into one of these areas has been subject to many daily work from past to present. In traditional studies, it was aimed to translate the speeches of certain people into the text. Applications for this purpose are speaker dependent systems. However, speaker-dependent systems are not able to work out, without identifying different speeches to the system first. Nowadays, most of the systems developed, especially smart devices, are designed as speaker independent. In this thesis, a system proposal was made aiming to develop their speech independently from both the speaker and the language by labeling them with their syntax. The tagged speech has been proposed as a corpus-based speech recognition system, which can be considered as an innovative viewpoint for researches in this area. This thesis within the scope of the subjects it is concerned, is in the intersection of different computer sciences such as signal processing and pattern recognition. The ultimate goal in the proposed study is to provide a high level of real-time speech recognition system with efficient techniques for effective communication between humans and smart devices. In addition, in the scope of writing of this thesis, an experimental system is studied and evaluated by comparing the techniques which are used in the field of speech recognition.
Collections
Related items
Showing items related by title, author, creator and subject.
-
Özellik vektörlerinde enerji türevleri ile konuşmacı bağımsız Türkçe konuşma tanıma iyileştirmesi
Çakır, Mert Yılmaz; Şirin, Yahya (Ieee, 2018)At the recent times, speech recognition applications, which are increasingly used in smart devices, are gaining importance as they perform well on speaker-independent systems. In this study, an increase is obtained in the ... -
Pencereleme tekniklerinin konuşma tanıma sistemi için karşılaştırılması
Çakır, Mert Yılmaz; Şirin, Yahya (IEEE, 2018)Akıllı cihazları yönetme imkânısağlayan konuşma tanıma, konuşma sinyalinden gerekli bilgileri çıkartarak bu cihazların tahmin yeteneğinin gelişmesini amaçlamaktadır.Bu çalışmada geçmiş araştırmalarincelenerek ... -
Pencereleme tekniklerinin konuşma tanıma sistemi için karşılaştırılması
Çakır, Mert Yılmaz; Şirin, Yahya (Institute of Electrical and Electronics Engineers Inc., 2018)Speech recognition, which provides the ability to manage intelligent devices, aims to improve the prediction skill of these devices by extracting the necessary information from the speech signal. In this study, with ...