Procedimientos de audio: Guía completa para principiantes

Procedimientos de audio: Guía completa para principiantes Procedimientos de audio: Guía completa para principiantes

¿Te has fijado alguna vez en que, cuando estás metido de lleno en un juego, oyes todo tipo de sonidos, como pisadas, explosiones y ruidos ambientales, todos ellos perfectamente sincronizados con tus acciones? La mayoría de estos sonidos son muestras de audio pregrabadas por talentosos diseñadores de sonido.

Estos pequeños fragmentos de audio también se presentan de muchas formas, desde una sola toma, como un disparo, hasta bucles, como el zumbido constante del motor de una nave espacial. Sin embargo, lo que quizá no sepas es que no todos los sonidos de los videojuegos proceden de muestras pregrabadas. Algunos se crean sobre la marcha mientras juegas.

Esto es lo que llamamos audio procedural, que a mí me gusta considerar como el pequeño compositor personal de un juego. Con él, podemos crear sonidos dinámicamente durante el juego sin depender de archivos de audio pre-renderizados. Esto significa que el sonido que se oye cuando un personaje pisa grava puede ser ligeramente distinto cada vez, lo que hace que el juego resulte aún más envolvente y realista.

En esta guía, vamos a echar un vistazo a todo lo que hay que saber sobre el audio procedural, incluida su historia, cómo funciona y algunos ejemplos interesantes de cómo se utiliza en los juegos modernos.

Así que, tanto si eres un diseñador de sonido en ciernes como si simplemente sientes curiosidad por la tecnología que hay detrás de tus juegos favoritos, ¡quédate por aquí! Tenemos mucho que contar.

¿Qué es el audio procesal?

El audio procedural es un aspecto fascinante del diseño sonoro de los juegos. La idea es crear sonido en tiempo de ejecución o generado sobre la marcha, justo mientras juegas, en lugar de pregrabarlo y reproducirlo.

En términos sencillos, el diseño de sonido procedural crea efectos de sonido basados en comportamientos predeterminados. Imagínatelo como un sistema que sabe cómo generar un sonido de pisada cada vez que tu personaje camina sobre distintas superficies sin necesidad de una muestra pregrabada para cada paso. En su lugar, sintetiza el sonido en tiempo real, haciendo que cada pisada sea ligeramente única.

Esta técnica es similar a la generación procedural utilizada en otras partes de los juegos, como el arte ambiental y el diseño de niveles. Del mismo modo que un juego puede crear un bosque o una mazmorra nuevos cada vez que juegas, el audio procedural crea paisajes sonoros basados en el estado actual del juego y en tus interacciones.

Mediante el audio procedural, los diseñadores de sonido pueden crear paisajes sonoros profundamente integrados, que reaccionan a las acciones del jugador y al entorno del juego de forma cohesiva y creíble.

Sin embargo, el uso de las técnicas habituales de diseño de sonido procedimental tiene sus inconvenientes.

Un reto importante es la complejidad de garantizar que los sonidos sean de alta calidad y realistas. Crear un sonido procedural convincente puede ser técnicamente más exigente que utilizar muestras pregrabadas. Además, puede requerir más CPU, lo que podría afectar al rendimiento del juego, sobre todo en sistemas de gama baja.

Historia del diseño procedimental del sonido

En los primeros tiempos de los videojuegos, el diseño procedural del sonido no era sólo una forma de arte. Era una necesidad para el sonido. La limitada memoria RAM de los primeros sistemas de juego no permitía almacenar muestras de audio pregrabadas, la alternativa al sonido procedural. Esta limitación obligó a los desarrolladores a generar sonidos en tiempo real a medida que se desarrollaba el juego.

El sonido en los juegos comenzó con el icónico Pong en el Magnavox Odyssey en 1972. Curiosamente, el Magnavox Odyssey original no incorporaba ningún tipo de sonido. Fue la versión Atari de Pong la que hizo historia al incorporar sonido. Atari lo consiguió utilizando el adaptador de interfaz de televisión (TIA), una pieza de hardware diseñada para manejar tanto salidas de vídeo como de audio.

La TIA podía generar ondas sonoras utilizando dos osciladores. Al manipular estos osciladores, la versión Atari de Pong podía crear un sonido sencillo pero eficaz, lo que supuso el primer caso de diseño de sonido procedural en los juegos.

En el juego, había tres sonidos principales, cada uno generado proceduralmente:

  • El primer sonido era el pitido cuando la pelota golpeaba las palas, lo que proporcionaba a los jugadores información sonora inmediata sobre sus golpes.
  • El segundo sonido era un pong más grave cuando la pelota chocaba con las paredes, diferenciándolo de los golpes de pala.
  • El tercer sonido era un ruido más agudo para marcar, señal de que se había conseguido un punto.

Aunque básicos para los estándares actuales, estos sonidos añadían una nueva capa de compromiso y retroalimentación que resultaba crucial para la experiencia inmersiva del juego.

Por supuesto, a medida que la tecnología evolucionaba, también lo hacían la complejidad y la calidad del audio procedimental.

La evolución del audio procesal

A finales de la década de 1970, el audio procedural empezó a tomar forma en varias consolas de videojuegos. Tres sistemas notables de esta época fueron la Atari 2600, la Fairchild Channel F y la Bally Astrocade. Cada una de estas consolas utilizaba audio procedural para mejorar la experiencia de juego dentro de las limitaciones de su hardware.

Los avances de la década de 1980 ampliaron aún más los límites del audio de los juegos.

En 1983, la Vectrex introdujo un nuevo nivel de síntesis de audio, mientras que Nintendo avanzó significativamente con el lanzamiento de la Nintendo Entertainment System (NES) en 1985. La NES utilizaba un sistema de audio de cinco canales que admitía una gama de frecuencias más amplia, de 54 Hz a 28 kHz, y podía realizar dobleces de tono. Juegos emblemáticos como Super Mario Bros. marcaron un hito en el campo del audio procedimental con sonidos memorables como el "ping" de la recogida de monedas, el "champiñón" de los potenciadores y el efecto "salto".

En 1986, la Sega Master System trajo consigo una evolución aún mayor del audio de los juegos. Incorporaba tanto el muestreo como la síntesis electrónica, utilizando cuatro canales de audio (tres para la música y uno para los efectos de sonido). La Master System estaba equipada con el chip YM2413 de Yamaha, el mismo que se utilizaba en sus sintetizadores profesionales, lo que mejoraba notablemente la calidad y complejidad de los sonidos que podía producir.

La evolución continuó con el lanzamiento de la Sega Mega Drive (Genesis) en 1988 y la Super Nintendo Entertainment System (SNES) en 1990. Ambas consolas introdujeron funciones de audio más sofisticadas, como muestras de mayor calidad y más canales para crear paisajes sonoros más ricos.

Sin embargo, no fue hasta el lanzamiento de Sega Saturn en 1994 cuando pudimos ver otro hito importante en la evolución del audio de los juegos. Incorporaba un chip de sonido y un procesador de sonido capaz de soportar hasta 16 canales de audio con calidad de CD a 44,1 kHz, sentando las bases para el sonido de alta calidad que esperamos de los juegos modernos.

Efectos de sonido y música pregrabados

En 1994, el mundo de los videojuegos experimentó un cambio monumental con el lanzamiento de la PlayStation de Sony. Esta consola introdujo una mejora significativa en las capacidades de audio, ofreciendo una frecuencia de muestreo de 44,1 kHz y 24 canales de audio estéreo. El chip de sonido de la PlayStation cambió las reglas del juego, ya que permitía efectos de reverberación y bucles.

Con esta nueva flexibilidad, los compositores y diseñadores de sonido podían crear paisajes sonoros más complejos y envolventes para enriquecer la experiencia de cada jugador.

Antes de la era PlayStation, la creación de audio para juegos requería un profundo conocimiento de la programación de audio y el audio procedural. Los creadores de sonido debían ser expertos en codificación compleja y procesamiento de señales para generar e implementar efectos de sonido y música. Esto hacía que el proceso fuera muy laborioso y a menudo limitaba la creatividad de quienes tenían más inclinaciones musicales pero menos conocimientos técnicos.

En muchos sentidos, PlayStation revolucionó este proceso al permitir que los efectos de sonido y la música pregrabados se implementaran fácilmente en los juegos. Los compositores y diseñadores de sonido ya no tenían que preocuparse de los entresijos del sonido procedural. En su lugar, podían centrarse únicamente en crear efectos de sonido y música de alta calidad, que luego pasaban a los desarrolladores para que los integraran en el juego.

¿Ha pasado de moda el audio procesal?

A pesar del auge de los efectos de sonido y la música pregrabados, el audio procedural está lejos de pasar de moda. Muchos juegos posteriores a PlayStation siguen aprovechando los modelos matemáticos del audio procedural. Veamos algunos de los más populares.

Juegos modernos que utilizan audio procedural

Espora

En el revolucionario juego Spore de 2008, los programadores de audio Aaron McLeran y Ken Jolly emplearon avanzadas técnicas de audio procedural para crear una experiencia auditiva dinámica y envolvente.

Utilizaron una adaptación de Pure Data llamada libpd, una biblioteca de síntesis de audio integrable diseñada para integrar las potentes capacidades de Pure Data en otras aplicaciones. Pure Data, para quien no lo conozca, es un lenguaje de programación visual de código abierto para multimedia, muy utilizado en la creación de música y audio interactivos por ordenador.

Libpd permitió al equipo generar música y sonidos ambientales basados en variables infinitamente cambiantes dentro del juego. Por ejemplo, a medida que los jugadores creaban y hacían evolucionar a sus criaturas, los sonidos que éstas emitían se generaban en tiempo real, reflejando sus características y comportamientos únicos.

Este uso del audio procedural garantizaba que cada jugador tuviera una experiencia única y personal con el juego.

No Man's Sky

No Man's Sky es otro excelente ejemplo de cómo el diseño procedural del sonido puede crear un mundo de juego rico y dinámico. El equipo de desarrollo se enfrentó al reto único de crear una banda sonora que se adaptara al universo generado proceduralmente del juego. Dado que la mayoría de los elementos del juego, como planetas, ecosistemas e incluso criaturas, se generan algorítmicamente, una banda sonora tradicional pregrabada no sería suficiente.

Para superar este reto, el equipo de Hello Games empleó el middleware de audio de Wwise, concretamente un plugin personalizado conocido como VocAlien. Esta herramienta fue esencial para sintetizar las vocalizaciones de las diversas y únicas criaturas del juego. VocAlien genera sonidos basados en las características de cada criatura, como su tamaño y tipo, garantizando que cada sonido sea apropiado y único.

El sistema de audio procedural del juego también permitió a los creadores "interpretar" sonidos. Esto significa que los paisajes sonoros creados no son grabaciones estáticas, sino piezas dinámicas de audio que cambian en tiempo real en función de las animaciones y comportamientos básicos de las criaturas.

Como resultado, los sonidos que oyes mientras exploras están estrechamente relacionados con las acciones en pantalla y las condiciones del entorno.

Elite Dangerous

Elite Dangerous, el exitoso juego de exploración espacial de ciencia ficción en línea de 2014, puso el listón muy alto para el audio inmersivo en los juegos con su uso del diseño de sonido procedural. Los desarrolladores del juego emplearon técnicas procedurales para crear sonidos dinámicos y adaptables, sobre todo para los motores de las naves espaciales y las interfaces gráficas.

Mini Metro

Mini Metro es un juego minimalista de simulación de metro de 2015 que utiliza audio procedural para crear una banda sonora adaptable y atractiva que mejora la jugabilidad. Los desarrolladores, Dino Polo Club, se propusieron integrar la música procedural desde el principio, aprovechando los puntos fuertes de las técnicas procedurales para adaptarse a la naturaleza dinámica del juego.

Rich Vreeland, el compositor, utilizó un sistema musical procedural que responde a las acciones del jugador y a la evolución del sistema de metro. Cada ciudad del juego tiene sus propias cualidades musicales, como ritmos y opciones armónicas, que cambian dinámicamente en función de cómo los jugadores construyen y modifican sus líneas de metro.

Just Cause 4

En Just Cause 4, los desarrolladores utilizaron el diseño de sonido procedural para el efecto de sonido whoosh que se genera cuando el jugador se cruza con un vehículo NPC en el tráfico. Este efecto se crea mediante la síntesis en tiempo de ejecución del middleware de audio FMOD.

Este efecto de sonido whoosh se sintetizó utilizando una mezcla de ruido blanco y marrón. El ruido blanco contiene la misma intensidad en distintas frecuencias, lo que crea un silbido consistente, mientras que el ruido marrón tiene más energía en las frecuencias más bajas, lo que produce un sonido más profundo y suave.

Mezclando estos dos tipos de ruido en diferentes proporciones, el equipo pudo variar la salida del sonido combinado en función de varias variables del juego, como la distancia a los vehículos de los NPC, la velocidad de esos vehículos y la velocidad del vehículo del jugador.

Con este planteamiento, los efectos de sonido del motor del juego podían adaptarse dinámicamente a las acciones del jugador y al entorno.

Reflexiones finales: una mirada al futuro del diseño procedimental del sonido

El sonido procedural ofrece una inmensa flexibilidad a los juegos modernos. Los diseñadores de sonido pueden crear paisajes sonoros dinámicos y adaptables que respondan a las acciones del jugador y a los cambios del entorno en tiempo real, asegurándose de que la experiencia de cada jugador sea única y mejorando la inmersión y el compromiso al proporcionar efectos de sonido adaptados al contexto específico del juego.

Sin embargo, a pesar de las ventajas del audio procedural, el audio muestreado sigue siendo el patrón oro para lograr la máxima fidelidad y realismo. Las muestras pregrabadas capturan los detalles matizados y las características naturales de los sonidos del mundo real, proporcionando un nivel de calidad de audio inigualable. ¿Por qué no programar algunos de los millones de samples de éxitos de espadas disponibles en las bibliotecas de samples en lugar de sintetizar los tuyos propios?

De cara al futuro, es probable que las técnicas procedimentales sigan evolucionando y aumenten los métodos tradicionales de diseño de sonido. Al integrar el diseño de sonido procedural con el audio muestreado, los creadores de juegos podrán aprovechar los puntos fuertes de ambos enfoques para lograr paisajes sonoros más dinámicos y realistas.

Da vida a tus canciones con una masterización de calidad profesional, ¡en cuestión de segundos!