Jika Anda pernah mengutak-atik pengaturan DAW Anda dan kaget dengan banyaknya sample rate yang ditawarkan, Anda tidak sendirian. Beberapa DAW utama (Logic Pro dan Pro Tools, misalnya) menawarkan enam laju sampel untuk dipilih; 44,1, 48, 88,2, 96, 176,4, dan 192.
Jika Anda belum tahu, sampling rate adalah resolusi yang digunakan untuk merekam audio dan, dalam hal instrumen virtual, menghasilkan suara. Dengan mengetahui hal ini, Anda akan berpikir bahwa lebih besar lebih baik, bukan?
Belum tentu.
Meskipun sebagian besar pembahasan mengenai laju sampel berpusat pada batas pendengaran manusia, namun ada beberapa faktor lain yang perlu dipertimbangkan ketika memilih laju sampel untuk merekam.
Dan di situlah kita masuk. Artikel ini akan membahas lebih dalam (dan maksud saya, lebih dalam) tentang nol dan satu dari audio digital. Rumit? Di beberapa tempat, ya. Tetapi pada akhir artikel ini, Anda akan mengetahui pro dan kontra dari perekaman pada 48kHz vs 96kHz, dan dapat memutuskan mana yang terbaik untuk Anda.
Memahami Tingkat Sampel

Bayangkan ada sebuah mobil yang bergerak melewati rumah Anda. Mobil itu bergerak dari kiri ke kanan, dan melewati rumah tetangga Anda dalam satu gerakan yang terus menerus. Itu setara dengan suara di dunia analog - bentuk gelombangnya adalah suara yang terus menerus.
Sekarang katakanlah Anda ingin meniru mobil yang sedang bergerak. Anda memutuskan untuk membuat animasi flip-book dari kendaraan yang bergerak dari kiri ke kanan. Semakin banyak gambar yang Anda buat dari mobil yang bergerak itu, semakin detail dan halus gerakannya.
Begitulah cara kerja audio digital; audio digital mengambil serangkaian gambar (atau sampel) dari bentuk gelombang analog dengan kecepatan super cepat, untuk mereplikasinya dalam dunia digital.
Laju sampel mengacu ke seberapa sering snapshot tersebut diambil setiap detik; laju sampel 44,1 kHz berarti ada 44.100 sampel bentuk gelombang masuk yang diambil setiap detik. Laju sampel yang lebih tinggi menghasilkan lebih banyak foto yang diambil. Tetapi, apakah kita bisa mendengar detail ekstra itu?
Teorema Nyquist

Seorang anak muda yang cerdas bernama Harry Nyquist menemukan bahwa laju sampel harus setidaknya dua kali frekuensi tertinggi yang direkam. Hal ini dikenal sebagai frekuensi Nyquist, atau batas Nyquist.
Karena manusia dapat mendengar frekuensi maksimum sekitar 20 kHz, maka diperlukan laju sampling minimum 40 kHz untuk menangkap semua frekuensi yang dapat didengar.
Mencoba merekam frekuensi di atas batas ini akan menyebabkan aliasing, atau foldover. Frekuensi yang lebih tinggi disalahartikan sebagai frekuensi yang lebih rendah, sehingga menyebabkan distorsi atau artefak dalam sinyal yang direkonstruksi.
Setiap konverter digital-analog modern memiliki filter anti-aliasing untuk menghilangkan artefak apa pun, yang pada dasarnya bertindak sebagai filter low pass untuk menghilangkan frekuensi tinggi yang mungkin alias. Merekam pada kecepatan sampel yang lebih tinggi memungkinkan ruang kepala untuk filter ini beroperasi tanpa memotong frekuensi yang dapat didengar.
Secara sederhana, teorema Nyquist adalah aturan 'berapa banyak yang cukup' untuk perekaman digital.
Munculnya Audio Berkualitas CD
Standar kualitas CD 44,1 kHz muncul pada masa-masa awal audio digital, ketika hard drive tidak mampu menyimpan materi senilai satu album dan perekam video kembali digunakan untuk pekerjaan itu.
Berdasarkan kecepatan frame dan garis yang dapat digunakan per frame, kepala pensil digunakan untuk menyimpan 3 sampel audio per frame, sehingga menghasilkan kecepatan sampel 44,1 kHz. Ini adalah laju sampel minimum yang sesuai dengan teori Nyquist dan memungkinkan master untuk disimpan dalam kaset video. Ini menjadi apa yang sekarang kita sebut sebagai audio kualitas CD.
Transformasi Fourier

Laju sampel tidak hanya memengaruhi cara sinyal ditangkap; tetapi juga memengaruhi cara audio digital 'dibaca'.
Transformasi Fourier adalah alat bantu matematika yang digunakan untuk menganalisis sinyal yang kompleks dan memecahnya menjadi bentuk gelombang sederhana pada frekuensi yang berbeda. Ini adalah cara kerja plugin seperti EQ, spektogram, dan deteksi nada, yang menganalisis seluruh sinyal dan memecahnya menjadi pita-pita yang lebih kecil.
Intinya, semakin banyak informasi yang dimiliki file audio dalam hal snapshot per detik (kecepatan sampel yang lebih tinggi), maka semakin akurat kalkulasi transformasi fourier.
Respons Frekuensi

Faktor lain yang perlu dipertimbangkan ketika membahas kecepatan sampel adalah perlengkapan yang Anda gunakan untuk merekam dan memantau.
Setiap bagian dari gubin audio memiliki respons frekuensi, yang secara longgar dapat digambarkan sebagai:
- Frekuensi apa yang dapat direproduksi, dan
- seberapa akurat ia melakukannya.
Jika Anda menggunakan mikrofon Radioshack yang jelek untuk merekam gitar yang jelek, dan memutarnya kembali pada sepasang speaker Radioshack yang jelek, kemungkinan besar tidak akan terdengar bagus. Apa pun laju sampling yang Anda gunakan.
Take Me Higher
Setelah menerobos semua hal yang berbau sains ini, kita bisa melihat bahwa laju sampel yang lebih tinggi memungkinkan kita menangkap frekuensi yang lebih tinggi, dan menganalisisnya dengan lebih detail.
Namun, meskipun merekam pada 96 kHz berarti kita dapat menangkap frekuensi hingga 48kHz, dari perspektif pendengaran manusia, tidak ada perbedaan nyata yang dapat didengar dengan rekaman 44,1 kHz. Bahkan bagi mereka yang memiliki pendengaran yang luar biasa, frekuensi yang lebih tinggi masih berada di luar jangkauan pendengaran.
Dan berkat teori Nyquist, kita tahu bahwa 44,1 kHz lebih dari cukup untuk mereproduksi sinyal apa pun dalam jangkauan pendengaran manusia dengan sempurna.
Jadi, mengapa kami menggunakan laju sampel yang lebih tinggi?
48kHz: Standar Industri

Dalam hal film, TV, dan streaming, 48kHz telah menjadi laju sampel yang diterima secara luas untuk pengiriman. Meskipun tersedia kecepatan sampel yang lebih tinggi, 48 kHz telah mendapatkan tempatnya sebagai standar dalam industri media berkat keseimbangan kualitas, efisiensi, dan kompatibilitasnya.
Mengapa 48 kHz adalah pilihan yang tepat?
Alasan utama untuk mengadopsi laju sampel 48 kHz sebagai standar dalam produksi media adalah karena kompatibilitas. Laju sampel ini sangat cocok dengan sistem video berbasis frame yang berbeda, yang digunakan oleh televisi Eropa dan NTSC, dan pada saat yang sama memenuhi persyaratan frekuensi Nyquist.
Saat ini, platform streaming seperti Netflix, Disney, dan Amazon mengharuskan audio dikirimkan pada 48 kHz, dan bahkan jika Anda membuat scoring film jadul yang sebenarnya untuk rilis teater, Anda akan diminta untuk mengirimkan batang 48 kHz untuk tahap pencampuran.
Manfaat Menggunakan Laju Sampel 48kHz
Alasan lain mengapa 48 kHz telah menjadi laju sampel yang diterima secara luas adalah keseimbangan antara suara yang bagus dan tuntutan pemrosesan.
Anti-Aliasing
Frekuensi sampel yang sedikit lebih tinggi memungkinkan lebih banyak ruang untuk filter anti aliasing beroperasi di dalamnya. Pada laju sampling 44,1 kHz, filter anti aliasing yang kurang sempurna dapat menimbulkan artefak yang tidak kentara, namun dapat diukur.
Sebaliknya, apabila menggunakan laju sampling 48 kHz, aliasing apa pun yang terjadi, akan berada di luar spektrum yang dapat didengar.
Resampling
Mengingat penggunaan laju sampel yang lebih tinggi secara luas dalam industri media, pengiriman audio pada 48 kHz meminimalkan kebutuhan untuk resampling. Meskipun 44,1 kHz adalah praktik umum dalam industri musik, jika Anda bekerja dalam lisensi sinkronisasi, produk jadi harus dikirim pada 48 kHz.
Proses konversi laju sampel ketika melakukan upsampling dari laju sampel yang lebih rendah ke 48 kHz dapat menyebabkan munculnya artefak yang tidak diinginkan dalam file. Oleh karena itu, sebaiknya selalu merekam pada laju sampel yang lebih tinggi dan melakukan downsampling nanti jika perlu, misalnya ketika mencetak ke CD.
Ukuran file
Merekam dan memproses audio pada 48 kHz menjaga ukuran file tetap terkendali, yang sangat penting untuk proyek TV dan film yang besar, di mana biaya penyimpanan dan waktu transfer data merupakan faktor penting.
Keterbatasan Menggunakan Laju Sampel 48 kHz
Hanya ada sedikit sekali batasan untuk menggunakan 48 kHz. Meskipun ada beberapa perdebatan di dalam komunitas audio tentang apakah ini benar-benar 'cukup baik' untuk semua aplikasi profesional, perbedaan antara 48 kHz dan laju sampel yang lebih tinggi sering kali hanya terlihat dalam lingkungan pendengaran kelas atas yang sangat terkendali.
96 kHz: Audio Resolusi Tinggi

Meskipun laju sampel 48 kHz adalah standar industri untuk film, TV, podcast, dan sejenisnya, namun sebagian teknisi lebih suka bekerja pada 96 kHz. Manfaat teoretisnya mencakup lebih banyak ruang kepala untuk menangkap konten frekuensi tinggi, mengurangi aliasing, dan kemampuan pemrosesan yang lebih baik.
Keuntungan Teoretis
Jangkauan Perekaman yang Diperpanjang
Laju sampel 96 kHz memungkinkan perekaman frekuensi hingga 48 kHz. Meskipun ini jauh di luar jangkauan pendengaran manusia (yang biasanya mencapai sekitar 20 kHz), sebagian orang berpendapat bahwa konten frekuensi ultra-tinggi ini berinteraksi dengan suara dengan cara yang tidak kentara, yang masih dapat didengar oleh manusia.
Mengurangi penyamaran
Masih ingat batas Nyquist? Merekam pada 96 kHz mendorong batas tersebut hingga 48 kHz, sehingga mengurangi kemungkinan artefak aliasing yang mengganggu suara yang terdengar.
Pemrosesan Plugin yang Lebih Baik
Laju sampel yang tinggi juga dapat menghasilkan pemrosesan yang lebih baik untuk sebagian efek. Hal ini khususnya terlihat jelas apabila melakukan audio yang memperpanjang waktu, atau melakukan tugas pergeseran nada.
Audio yang meregang waktu yang direkam pada laju sampel yang lebih tinggi menghasilkan suara yang lebih bersih, dengan kualitas yang terdengar lebih alami. Inilah sebabnya mengapa banyak perancang suara bekerja pada laju sampel yang lebih tinggi (192kHz).
Hal yang sama juga berlaku untuk pemrosesan, seperti saturasi dan distorsi. Plugin ini menambahkan konten frekuensi tinggi tambahan di atas batas Nyquist asli, sehingga laju sampel 96 kHz akan menghasilkan lebih sedikit peluang terjadinya aliasing setelah efek.
Pengukuran Puncak Sampel yang Lebih Akurat
Manfaat lain dari bekerja pada 96 kHz adalah peningkatan akurasi pengukuran puncak sampel. Sering kali puncak sinyal terjadi di antara sampel yang telah direkam - yang dikenal sebagai puncak antar sampel. Seorang insinyur pencampuran akan mendapatkan representasi yang lebih akurat tentang di mana letak puncak sinyal dengan laju sampel yang lebih tinggi yang berisi lebih banyak sampel per detik.
Kualitas Audio yang Tahan di Masa Depan
Manfaat lain yang dirasakan dari perekaman pada 96 kHz adalah untuk tetap menjadi yang terdepan. Karena teknologi terus berkembang, laju sampel yang lebih tinggi mungkin menjadi norma, dan sebagian insinyur memilih 96 kHz untuk memastikan kompatibilitas dengan format resolusi tinggi di masa depan.
Kelemahan Menggunakan Laju Sampel 96 kHz
Merekam pada 96 kHz memiliki banyak keuntungan secara teoretis, dan dapat menghasilkan kualitas audio yang lebih baik ketika melakukan perekaman dan melakukan tugas pengeditan. Tetapi, keuntungan ini disertai dengan pengorbanan praktis dibandingkan dengan menggunakan laju sampel yang lebih rendah.
Ukuran file
Setiap kali Anda menggandakan kecepatan sampel, jumlah data yang Anda hasilkan juga menjadi dua kali lipat. Sesi yang direkam pada 96 kHz akan menggunakan ruang dua kali lebih besar daripada sesi 48 kHz karena file yang dibuat jauh lebih besar.
Untuk proyek-proyek yang kompleks, hal ini dapat dengan cepat membengkakkan kebutuhan penyimpanan dan membuat pencadangan, berbagi, dan manajemen file menjadi lebih menantang.
Kekuatan Pemrosesan
Seperti yang Anda harapkan, sample rate yang lebih tinggi menuntut lebih banyak tenaga dari CPU Anda. Kecuali jika Anda memiliki mesin yang sangat sibuk, Anda mungkin mendapati bahwa sesi Anda mengalami peningkatan latensi, waktu rendering yang lebih lambat, dan ketidakstabilan sistem.
Kinerja DAW
Meskipun sebagian besar DAW mendukung kecepatan sampel yang lebih tinggi, menjalankan sesi pada 96 kHz atau lebih tinggi berarti DAW harus bekerja lebih keras untuk mengalirkan audio. Tergantung pada sistem Anda, dan kompleksitas sesi, ada peningkatan risiko putus-putus atau gangguan. Tidak ideal ketika Anda mencampur lagu berikutnya.
Kinerja Plugin
Beberapa plugin secara internal mengambil sampel berlebih pada sinyal yang masuk untuk meningkatkan kualitas output yang dihasilkan, misalnya plugin pengukuran atau pembatas. Menjalankan plugin tersebut pada kecepatan sampel yang sudah tinggi dapat mengganggu kinerja CPU.
Efisiensi Alur Kerja
Meskipun kecepatan sampel yang lebih tinggi mungkin menawarkan keuntungan teoretis dan pemeriksaan di masa mendatang, menjalankan sesi pada kecepatan yang lebih tinggi dapat memperlambat alur kerja Anda tanpa keuntungan yang nyata.
- Beberapa antarmuka audio murah tidak dapat menangani laju sampel 96 kHz, yang dapat menyebabkan distorsi pada suara.
- Anda hampir selalu harus melakukan downsample untuk membuat hasil akhir, menciptakan langkah-langkah konversi yang tidak perlu di sepanjang jalan.
- Jika sistem Anda kesulitan menjalankan sesi dengan sample rate yang lebih tinggi, maka akan memakan waktu lebih lama. Pencampuran akan menjadi membosankan, dan Anda masih harus melakukan downsample setelahnya.
Dapatkah Kita Mendengar Perbedaan Antara 48 kHz dan 96 kHz?

Pertanyaan jutaan dolar dalam diskusi ini adalah: dapatkah orang benar-benar mendengar perbedaan antara 48 kHz dan 96 kHz?
Tergantung kepada siapa Anda bertanya.
Beberapa pendengar yang terlatih, terutama para insinyur dan audiophile yang ahli, mengaku dapat mendengar perbedaan yang halus antara sample rate, khususnya jika itu adalah instrumen yang sangat mereka kuasai.
Sebagian orang berpendapat bahwa meskipun kita tidak dapat mendengar perbedaan antara kedua sample rate, namun keberadaan konten ultra-sonik di dalam suara dapat berdampak pada pengalaman mendengarkan akibat interaksi harmonik.
Apakah hal ini disebabkan oleh perbedaan sonik yang sebenarnya, atau hanya bias psikologis, masih bisa diperdebatkan. Tetapi ada beberapa hal yang mempengaruhi cara kita mendengar suara.
Sistem Pemutaran
Masih ingat diskusi tentang respons frekuensi? Bahkan jika Anda memiliki pendengaran manusia super, jauh di luar kisaran 20 kHz, jika speaker yang Anda gunakan untuk mendengarkan tidak mendukung frekuensi ultrasonik ini, maka laju sampel yang lebih tinggi menjadi tidak berguna.
Keterbatasan Pendengaran Manusia
Sebagian besar orang dewasa mengalami penurunan pada rentang atas pendengaran mereka seiring bertambahnya usia. Bahkan jika frekuensi ultra-tinggi hadir dalam suara, ada kemungkinan besar banyak pendengar yang tidak dapat mendengarnya.
Pertimbangan Praktis
Kita dapat meringkas diskusi ini menjadi dua ide:
- 48 kHz adalah standar industri media, dan memenuhi semua kotak sonik.
- 96 kHz tampaknya cukup keren, tetapi juga memiliki banyak beban.
Memilih laju sampel yang tepat untuk proyek Anda bergantung pada kebutuhan spesifik dan alur kerja Anda. Berikut ini adalah perincian praktis untuk berbagai bidang produksi audio.
Produksi Musik: Perekaman, Pencampuran & Mastering
Apabila Anda mengerjakan musik saja, pilihan laju sampel tergantung pada keseimbangan kualitas audio dengan efisiensi sistem.
- Perekaman: Beberapa insinyur suka melacak pada kecepatan sampel tinggi 96 kHz atau lebih tinggi untuk menangkap setiap detail sonik, dan untuk mencegah kesalahan aliasing. Namun, untuk sebagian besar musik, 48 kHz sudah lebih dari cukup, dan tidak terlalu membebani kemampuan sistem dan penyimpanan. Ditambah lagi, ini meniadakan kebutuhan untuk menggunakan master clock untuk menjaga semuanya tetap sinkron.
- Pencampuran & Mastering: Saat ini, banyak plugin yang menyediakan oversampling internal untuk menghasilkan output yang lebih akurat, sehingga bekerja pada 48 kHz masih memberikan standar audio yang tinggi.
- Pengiriman Akhir: Platform streaming cenderung menerima file dengan laju sampel 44,1 atau 48 kHz. Jika musik akan direproduksi dalam bentuk CD, campuran akhir akan membutuhkan konversi laju sampel hingga 44,1 kHz. Apa pun itu, merekam pada laju sampel yang tinggi akan sangat berlebihan dalam situasi ini.
Audio Film & TV
Ketika bekerja di bidang film dan televisi (termasuk lisensi sinkronisasi ), 48 kHz adalah standar emas. Dalam kebanyakan kasus, resolusi kedalaman bit harus 16 bit, meskipun ada baiknya untuk merekam pada kedalaman bit 24 sebagai permulaan dan menurunkannya untuk pengiriman.
Mengingat jumlah track yang tinggi dalam sesi pascaproduksi, perekaman pada 96 kHz dapat menimbulkan masalah pada efisiensi sistem dan ruang penyimpanan.
Game & VR
Audio dalam skenario game dan realitas virtual sering kali membutuhkan laju sampel yang lebih tinggi karena tuntutan format yang unik.
Peregangan waktu yang ekstensif dan pergeseran nada suara sering kali diperlukan, jadi lebih baik merekam pada 96 kHz.
Suara Langsung & Streaming
Dalam situasi live, performa real-time adalah prioritas utama, menjadikan 48 kHz sebagai pilihan terbaik.
Rekomendasi Akhir
Sebagai aturan umum, cara yang paling efisien dan efektif untuk merekam audio adalah pada kedalaman bit 24 dan laju sampel 48 kHz.
Pengaturan ini merupakan titik temu antara kejernihan sonik, dan efisiensi dalam penyimpanan serta performa CPU.
Banyak plugin yang sudah melakukan oversampling internal ketika bekerja pada kecepatan ini, yang berarti bahwa manfaat perekaman pada 96 kHz dapat diabaikan.
Selain itu, pembatas dan pengukur digital berkualitas tinggi mengimbangi puncak antar-sampel, sehingga mengurangi kebutuhan akan laju sampel yang lebih tinggi.
Terakhir, 48 kHz adalah standar industri untuk sebagian besar pekerjaan profesional, yang memastikan integrasi tanpa hambatan dengan kolaborator dan distributor.
Beberapa situasi yang mungkin perlu dipertimbangkan untuk menggunakan 96 kHz untuk merekam adalah, kapan saja:
- sebuah proyek membutuhkan peregangan waktu yang ekstensif, pergeseran nada atau pengeditan (seperti sintesis granular).
- sebuah proyek untuk tujuan pengarsipan, dan Anda ingin membuktikan bahwa pekerjaan tersebut dapat digunakan di masa depan.
Kesimpulan
Kami telah membahas banyak hal! Berikut ini adalah rangkuman singkat dari apa yang telah dibahas. Catatan singkatnya, jika Anda mau:
- Laju sampel 44,1 kHz mampu mereproduksi sinyal audio secara sempurna hingga frekuensi tertinggi dalam jangkauan pendengaran manusia.
- Industri TV, film, dan media menggunakan 48 kHz sebagai standar.
- Perekaman pada 96 kHz memerlukan daya pemrosesan yang lebih besar, dan ruang disk yang lebih besar untuk menyimpan file yang lebih besar.
- Menggunakan tingkat sampel yang semakin tinggi menghasilkan hasil yang semakin berkurang dalam kaitannya dengan efisiensi sistem dan biaya penyimpanan.
- Jika Anda tahu bahwa Anda akan menggunakan time-stretching dan fungsi pengeditan lainnya pada audio Anda, rekamlah pada 96 kHz untuk hasil yang lebih baik.
Ingat, konteks tempat Anda bekerja lebih penting daripada mengejar angka.
Jika Anda seorang seniman, pendengar Anda mungkin tidak peduli bahwa Anda menghasilkan lagu pada 96 kHz. Bahkan, mereka tidak mungkin mendengar perbedaan antara itu dan sesuatu yang direkam pada 44,1 kHz.
Jika Anda merekam musik untuk film dan TV, 48 kHz adalah keseimbangan sempurna antara kualitas suara dan standar profesional.
Dan jika Anda sedang membangun perpustakaan suara untuk perpustakaan efek, 96 kHz adalah cara yang tepat untuk memungkinkan kemampuan penyuntingan yang maksimal.
Pada akhirnya, ini adalah keputusan Anda. Bereksperimenlah dengan kecepatan sampel yang berbeda dan lihatlah apa yang terdengar bagus bagi Anda. Jika Anda mendengar perbedaan yang nyata pada 96 kHz, lakukanlah! (Tapi mungkin belilah hard drive yang lebih besar...).
Apa pun yang akhirnya Anda gunakan, majulah dan buatlah musik!