Komputer bisa diperintah secara lisan
Selama ini, penggunaan PC masih tergantung pada keyboard (papan pengetik) sebagai alat untuk menginputkan data ke PC. Namun, lama-kelamaan, apalagi dengan banyaknya pengetikan yang ada, dirasa bahwa panggunaan keyboard ini kurang praktis, sehingga menimbulkan ide untuk membuat suatu alat pengenal suara bagi PC. Dengan demikian PC dapatdiperintah secara lisan. Maksudnya, apabila kita mengucapkan sebuah kata maka cursor langsung menuliskan kata tersebut pada monitor (CRT).
Disadari, untuk merealisasikan hal demikian memang tidak mudah. Itu berarti bahwa PC harus dapat mengerti bahasa manusia. PC yang biasanya hanya mengerti sinyal digital (logika 0 atau 1), sekarang dipaksa untuk mengerti bahasa manusia yang merupakan besaran fisis. Hal itu mungkin, hanya apabila ada alat perantara yang menghubungkan antara PC dan manusia. Alat demikian acap disebut interface.
Perencanaan pembuatan interface yang akan dibahas, dibatasi pada Sistem Pengenal Ucapan ’sederhana’ yang jenis ucapannya terdiri dari satu/dua suku kata saja serta pembicaranya harus menjalani sejumlah latihan tertentu. Frekuensi suara pembicara dibatasi antara 250 Hz sampai dengan 3200 Hz. Interface yang dibuat mempunyai perbendaharaan kata sebanyak 20 kata, dengan kemampuan sistem hanya pada tahap ’mengenal’ dan belum dapat ’mengartikan’ ucapan.
ADVERTISEMENT
SCROLL TO RESUME CONTENT
Interface
Perencanaan Perangkat Keras.
Blok diagram pembuatan interface pengenal suara ditunjukkan pada gambar 1. Dalam gambar ini, terlihat bahwa suara manusia berupa besaran fisis diubah oleh transduser mikrofon (MIC) menjadi sinyal listrik tegangan. Sinyal listrik ini terlalu lemah, sehingga, diperkuat dengan rangkaian amplifier (AMP).
Setelah diperkuat, sinyal ini kemudian dilewaikan ke rangkaian high pass filter (HPF) untuk melewatkan frekuensi di atas 250 Hz. Hasil output sinyal ini kemudian dihubungkan dengan rangkaian pengontrol penguat otomatis (Automatic Gain Control-AGC) untuk menjaga sinyal dalam range 0 sampai dengan 5; range input rangkaian pengubah sinyal analog ke sinyal digital (ADC).
Setelah itu, output dari AGC dilewatkan ke rangkaian low pass filter (LPF) untuk meredam frekuensi di atas 3200 Hz. Output LPF yang berupa sinyal analog, kemudian diubah ke sinyal digital melalui rangkaian ADC. Dari sini, sinyal digital masuk dalam SP-1OOO Speech Processor. IC SP-1000 merupakan IC N-MOS Microprocessor yang dapat digunakan untuk pengenalan ucapan. Keunggulan piranti ini yaitu dapat melaksanakan Kode Peramalan Linier (LinearPredictive Coding, LPC) yang mengolah dan merepresentasikan sinyal ucapan ke dalam Parameter Sumber dan Parameter Sistem. Parameter Sumber mengandung informasi amplitudo dan intonasi sinyal, sedangkan Parameter Sistem mengandung informasi mengenai perilaku frekuensi sinyal. Jadi, LPC dapat membedakan sinyal ucapan yang masuk, karena pada pada prinsipnya suara manusia mempunyai fonem dasar yang berbeda.
Setelah diolah oleh IC SP-1OOO, sinyal disimpan di dalam memory komputer yang merupakan karakter khusus dari suatu ucapan. Dari memory komputer, sinyal ucapan yang dimaksud ditampilkan di monitor melalul decoder yang diatur oleh IC SP-1OOO.
Perangkat lunak
Pembuatan perangkat lunak sistem dengan menggunakan bahasa pemrograman Turbo Pascal, dapat dibagi menjadi tiga modul utama, yaitu Pengambilan Data Ucapan, Pembuatan Pola Ucapan, dan Pengambilan Pola Ucapan.
Ada dua hal utama yang dilakukan dalam Pengambilan Data Ucapan, yaitu pemberian nilai awal (inisialisasi) untuk SP-1000 dan pembacaan data parameter ucapan. Sedangkan Pembuatan Pola Ucapan meliputi tiga bagian, yaitu penentuan awal dan akhir ucapan, serta normalisasi pola dan pelatihan sistem. Untuk Pengambilan Pola Ucapan difokuskan pada pembuatan pola pembanding yang kemudian dibandingkan dengan pola acuan yang ada, sehingga nantinya pengambilan ucapan dikenal, berdasarkan pola acuan yang paling dekat dengan pola pembanding.
Gambar 2 dan 3 menunjukkan hasil karya Deny Murniadi di dalam menyelesaikan skripsinya di UK Petra. Gambar 2 menunjukkan tampilan perangkat lunak dari sistem. Sedangkan gambar 3 menunjukkan bentuk fisik perangkat keras sistem.
Pengujian
Setelah memasang interface pada slot PC, maka dilakukan pengujian untuk menentukan seberapa jauh keandalan sistem. Untuk itu, dilakukan pengujian per-kata. Pengujian ini dimulai dengan menulis dan merekam kata-kata yang akan diucapkan. Setelah itu, kata-kata tersebut diucapkan melalui mikrofon dan cursor langsung menuliskan kata-kata tersebut pada monitor komputer tanpa melalui keyboard. Pengujian dapat pula dilakukan per kalimat, dengan cara yang sama untuk pengujian per-kata.
Idealnya, suatu sistem pengenalan ucapan harus mampu mengenal banyak perbendaharaan kata dan tidak bergantung pada siapa yang berbicara (speaker independent). Aplikasinya secara luas, dapat digunakan untuk belajar bahasa Inggris dalam hal speaking. Dan tentunya, dengan PC yang dapat diperintah secara lisan dan tidak melalui keyboard, penghematan waktu dan tenaga dapat dilakukan. Dengan demikian, akan membuat kehidupan manusia lebih bermakna.
Ir Benyamin F lntan, Dosen Fakultas Teknik Elektro Universitas Kristen Petra, Surabaya
Sumber: Harian Surya, 26 Januari 1992