Cukup Lihat Orangnya, Headphone AI Bantu Jernihkan Suara di Tengah Kerumunan

Headphone berbasis kecerdasan buatan (AI) mampu membuat suara yang ingin kita dengar lebih jernih, kendati berada di kebisingan kerumunan.

(Foto: Kiyomi Taguchi/University of Washington via EurekAlert)
(Foto: Kiyomi Taguchi/University of Washington via EurekAlert)

ngarahNyaho! - Tim Universitas Washington mengembangkan sistem AI yang memungkinkan pengguna headphone melihat orang yang berbicara selama tiga hingga lima detik untuk “mendaftarkan” mereka. 

Sistem yang disebut Target Speech Hearing itu kemudian akan mereduksi semua suara lain di lingkungan tersebut dan hanya memutar suara pembicara yang terdaftar secara real-time.

Bahkan ketika pendengar bergerak di tempat yang bising dan tidak lagi menghadap pembicara.

Tim tersebut mempresentasikan temuannya pada 14 Mei di Honolulu pada Konferensi ACM CHI tentang Faktor Manusia dalam Sistem Komputasi. 

Kode untuk perangkat pembuktian konsep tersedia untuk dikembangkan oleh orang lain. Sistem ini tidak tersedia secara komersial.

“Saat ini kita cenderung menganggap AI sebagai chatbot berbasis web yang menjawab pertanyaan,” kata penulis senior Shyam Gollakota, profesor di Sekolah Ilmu & Teknik Komputer Paul G. Allen. 

“Namun dalam proyek ini, kami mengembangkan AI untuk mengubah persepsi pendengaran siapa pun yang memakai headphone, berdasarkan preferensi mereka. 

"Dengan perangkat kami, Anda kini dapat mendengar satu speaker dengan jelas meskipun Anda berada di lingkungan yang bising dengan banyak orang yang berbicara.”

Untuk menggunakan sistem ini, seseorang yang memakai headphone siap pakai yang dilengkapi mikrofon mengetuk tombol sambil mengarahkan kepalanya ke seseorang yang sedang berbicara. 

Gelombang suara dari suara pembicara tersebut kemudian akan mencapai mikrofon di kedua sisi headset secara bersamaan; ada margin kesalahan 16 derajat. 

Headphone mengirimkan sinyal tersebut ke komputer yang terpasang di dalamnya, tempat perangkat lunak pembelajaran mesin tim mempelajari pola vokal pembicara yang diinginkan. 

Sistem akan menangkap suara pembicara tersebut dan terus memutarnya kembali ke pendengar, bahkan saat pasangan tersebut bergerak. 

Kemampuan sistem untuk fokus pada suara yang terdaftar meningkat seiring pembicara terus berbicara, sehingga memberikan lebih banyak data pelatihan pada sistem.

Tim tersebut menguji sistemnya pada 21 subjek, yang menilai kejernihan suara pembicara yang terdaftar hampir dua kali lebih tinggi dibandingkan rata-rata audio tanpa filter.

Proyek ini didasarkan pada penelitian “pendengaran semantik” tim peneliti sebelumnya.

Pada studi itu memungkinkan pengguna memilih kelas suara tertentu, seperti burung atau suara, yang ingin mereka dengar dan membatalkan suara lain di lingkungan.

Saat ini sistem TSH hanya dapat mendaftarkan satu pembicara dalam satu waktu, dan hanya tidak ada suara keras lain yang datang dari arah yang sama dengan suara pembicara target. 

Jika pengguna tidak puas dengan kualitas suaranya, mereka dapat menjalankan pendaftaran lain pada speaker untuk meningkatkan kejernihan.

Tim ini berupaya memperluas sistem ini ke earbud dan alat bantu dengar di masa depan. | Sumber: EurekAlert

Post a Comment

Lebih baru Lebih lama