Please take a moment to complete this survey below
Library's collection Library's IT development CancelSeiring berkembangnya zaman banyak lulusan sarjana yang menganggur akibat tidak didampingi dengan soft skill public speaking yang baik. Hal ini dikarenakan jumlah lulusan mahasiswa jauh lebih banyak daripada ahli public speaking yang ada. Aspek dalam public speaking adalah gestur, mikro ekspresi, serta teknik vokal. Teknik vokal sendiri terdiri dari intonasi serta kecepatan. Teknik vokal dapat dipelajari secara mandiri namun dibutuhkan usaha yang lumayan berat. Oleh sebab dibutuhkan sistem yang dapat membantu lulusan sarjana untuk berlatih teknik vokal khususnya pada bagian kecepatan.
Metode yang digunakan dalam penelitian ini adalah Fast Fourier Transform (FFT), Speech to text, serta convolutional neural network (CNN) dan spektogram. Yang akan dilakukan pada penelitian ini adalah mengkonversi audio menjadi teks untuk klasifikasi kecepatan berbicara, kemudian algoritma FFT untuk klasifikasi intonasi. CNN dan spektogram juga akan digunakan sebagai klasifikasi intonasi dan klasifikasi kesalahan kecepatan berbicara dalam 3 klasifikasi yaitu baik, terlalu cepat, serta terlalu lambat. Hasil penelitian ini menunjukkan bahwa penggunaan google speech to text masih belum dapat mengkonversi data suara secara maksimal. Untuk FFT sendiri sudah dapat digunakan untuk mengklasifikasikan intonasi menjadi tinggi dan rendah. Sedangkan CNN dan spektogram untuk intonasi mendapatkan akurasi 82% dan untuk kesalahan kecepatan berbicara mendapatkan akurasi 60%.