Áudio Processual: O guia completo para iniciantes

Áudio Processual: O guia completo para iniciantes Áudio Processual: O guia completo para iniciantes

Já reparou que, quando está no fundo de um jogo, ouve todo o tipo de sons, como passos, explosões e ruídos ambientais, que parecem perfeitamente sincronizados com as suas acções? A maioria destes sons são amostras de áudio pré-gravadas feitas por talentosos designers de som.

Estes pequenos fragmentos de áudio também se apresentam de muitas formas, incluindo sons únicos, como um único tiro, ou loops, como o zumbido constante do motor de uma nave espacial. No entanto, o que talvez não saibas é que nem todos os sons dos jogos de vídeo provêm de amostras pré-gravadas. Alguns sons são criados na hora, à medida que se joga o jogo.

É a isto que chamamos áudio processual, que gosto de considerar como o pequeno compositor pessoal de um jogo. Com ele, podemos criar sons dinamicamente durante o jogo sem depender de ficheiros de áudio pré-renderizados. Isto significa que o som que ouves quando uma personagem pisa gravilha pode ser ligeiramente diferente de cada vez, tornando o jogo ainda mais imersivo e realista.

Neste guia, vamos dar uma olhada em tudo o que há para saber sobre áudio procedural, incluindo sua história, como funciona e alguns exemplos legais de como ele é usado em jogos modernos.

Por isso, quer sejas um designer de som em início de carreira ou apenas curioso sobre a tecnologia por detrás dos teus jogos favoritos, fica por aqui! Temos muito para falar.

O que é o áudio processual?

O áudio processual é um aspeto fascinante do design de som para jogos. A ideia é criar som em tempo de execução ou gerado em tempo real, à medida que se joga o jogo, em vez de ser pré-gravado e reproduzido.

Em termos leigos, o design de som processual cria efeitos sonoros com base em comportamentos pré-determinados. Pense nisso como um sistema que sabe como gerar um som de passos sempre que o seu personagem anda em superfícies diferentes sem precisar de uma amostra pré-gravada para cada passo. Em vez disso, sintetiza o som em tempo real, tornando cada passo ligeiramente único.

Esta técnica é semelhante à geração processual utilizada noutras partes dos jogos, como a arte ambiental e o design de níveis. Tal como um jogo pode criar um novo layout de floresta ou masmorra de cada vez que se joga, o áudio processual cria paisagens sonoras que se ouvem com base no estado atual do jogo e nas suas interacções.

Ao utilizar o áudio processual, os designers de som podem criar paisagens sonoras profundamente integradas, que reagem às acções do jogador e ao ambiente do jogo de uma forma coesa e credível.

No entanto, a utilização de técnicas comuns de design de som processual tem algumas desvantagens.

Um dos principais desafios é a complexidade de garantir que os sons são de alta qualidade e realistas. Criar um áudio processual convincente pode ser tecnicamente mais exigente do que usar amostras pré-gravadas. Além disso, pode exigir mais CPU, o que pode afetar o desempenho do jogo, especialmente em sistemas de gama baixa.

Uma história do design de som procedimental

Nos primórdios dos jogos, o design de som processual não era apenas uma forma de arte. Era uma necessidade para o som. A RAM limitada dos primeiros sistemas de jogos não conseguia lidar com as exigências de armazenamento de amostras de áudio pré-gravadas, a alternativa ao áudio processual. Esta limitação levou os programadores a gerar sons em tempo real à medida que o jogo se desenrolava.

O áudio nos jogos começou com o icónico jogo Pong no Magnavox Odyssey em 1972. Curiosamente, o Magnavox Odyssey original não vinha com qualquer som. Foi a versão Atari do Pong que fez história ao incorporar o som. A Atari conseguiu-o utilizando o Television Interface Adapter (TIA), uma peça de hardware concebida para lidar com saídas de vídeo e áudio.

O TIA podia gerar ondas sonoras usando dois osciladores. Ao manipular estes osciladores, a versão Atari do Pong podia criar um áudio simples mas eficaz, marcando o primeiro exemplo de design de som processual em jogos.

No jogo, havia três sons principais, cada um gerado processualmente:

  • O primeiro som foi o sinal sonoro quando a bola bateu nas pás, dando aos jogadores um feedback áudio imediato sobre as suas tacadas
  • O segundo som era um som de pong mais profundo quando a bola colidia com as paredes, diferenciando-o das pancadas da raquete.
  • O terceiro som era um ruído mais agudo para marcar pontos, indicando que um ponto tinha sido alcançado.

Embora básicos para os padrões actuais, estes sons acrescentaram uma nova camada de envolvimento e feedback que foi crucial para a experiência imersiva do jogo.

É claro que, com a evolução da tecnologia, a complexidade e a qualidade do áudio processual também evoluíram.

A evolução do áudio processual

No final da década de 1970, o áudio processual começou a tomar forma em várias consolas de jogos. Três sistemas notáveis desta era foram o Atari 2600, o Fairchild Channel F e o Bally Astrocade. Cada uma destas consolas utilizou áudio processual para melhorar a experiência de jogo dentro das limitações do seu hardware.

Os avanços na década de 1980 alargaram ainda mais os limites do áudio dos jogos.

Em 1983, o Vectrex introduziu um novo nível de síntese áudio, enquanto a Nintendo deu passos significativos com o lançamento da Nintendo Entertainment System (NES) em 1985. A NES utilizava um sistema de áudio de cinco canais que suportava uma gama de frequências mais alargada de 54 Hz a 28 kHz e podia efetuar pitch bends. Jogos icónicos como Super Mario Bros. estabeleceram uma referência para o áudio processual com sons memoráveis como o "ping" da coleção de moedas, o som do "cogumelo" do power-up e o efeito de "salto".

Em 1986, a Sega Master System trouxe uma evolução ainda maior do áudio dos jogos. Incorporou tanto a amostragem como a síntese eletrónica, utilizando quatro canais de áudio (três para música e um para efeitos sonoros). O Master System foi equipado com o chip YM2413 da Yamaha, o mesmo chip usado em seus sintetizadores profissionais, o que aumentou significativamente a qualidade e a complexidade dos sons que ele podia produzir.

A evolução continuou com o lançamento da Sega Mega Drive (Genesis) em 1988 e da Super Nintendo Entertainment System (SNES) em 1990. Ambas as consolas introduziram capacidades de áudio mais sofisticadas, incluindo amostras de maior qualidade e mais canais para paisagens sonoras mais ricas.

No entanto, só com o lançamento da Sega Saturn em 1994 é que pudemos ver outro marco importante na evolução do áudio dos jogos. Esta apresentava um chip de som e um processador de som capazes de suportar até 16 canais de áudio com qualidade de CD a 44,1 kHz, preparando o terreno para o som de alta qualidade que esperamos nos jogos modernos.

Efeitos sonoros e música pré-gravados

Em 1994, o mundo dos jogos sofreu uma mudança monumental com o lançamento da PlayStation da Sony. Esta consola introduziu uma melhoria significativa nas capacidades de áudio, oferecendo uma taxa de amostragem de 44,1 kHz e 24 canais de áudio estéreo. O chip de som da PlayStation foi um divisor de águas, permitindo efeitos de reverberação e looping.

Com a nova flexibilidade, os compositores e designers de som puderam criar paisagens áudio mais complexas e envolventes para enriquecer a experiência de cada jogador.

Antes da era da PlayStation, a criação de áudio para jogos exigia um conhecimento profundo da programação de áudio e do áudio processual. Os criadores de sons tinham de ser peritos em codificação complexa e processamento de sinais para gerar e implementar efeitos sonoros e música. Este facto tornava o processo muito trabalhoso e restringia frequentemente a criatividade daqueles que tinham mais apetência musical mas menos competências técnicas.

Em muitos aspectos, a PlayStation revolucionou este processo ao permitir que os efeitos sonoros e a música pré-gravados fossem facilmente implementados nos jogos. Os compositores e designers de som já não precisavam de se preocupar com as complexidades do som processual. Em vez disso, podiam concentrar-se apenas na criação de efeitos sonoros e música de alta qualidade, que depois passavam aos programadores para integração no jogo.

O áudio processual está fora de moda?

Apesar do aumento dos efeitos sonoros e da música pré-gravados, o áudio processual está longe de estar fora de moda. Muitos jogos pós-PlayStation continuam a tirar partido dos modelos matemáticos do áudio processual. Vamos dar uma olhadela a alguns dos mais populares.

Jogos modernos que usam áudio procedimental

Esporo

No inovador jogo Spore de 2008, os programadores de áudio Aaron McLeran e Ken Jolly utilizaram técnicas avançadas de áudio processual para criar uma experiência auditiva dinâmica e envolvente.

Utilizaram uma adaptação do Pure Data chamada libpd, uma biblioteca de síntese de áudio incorporável concebida para integrar as poderosas capacidades do Pure Data noutras aplicações. O Pure Data, para quem não sabe, é uma linguagem de programação visual de código aberto para multimédia, que é amplamente utilizada na criação de música e áudio interactivos para computador.

O Libpd permitiu à equipa gerar música e sons ambientais com base em variáveis infinitamente variáveis dentro do jogo. Por exemplo, à medida que os jogadores criavam e evoluíam as suas criaturas, os sons que estas produziam eram gerados em tempo real, reflectindo as suas características e comportamentos únicos.

Esta utilização de áudio processual garantiu que cada jogador tivesse uma experiência única e pessoal com o jogo.

No Man's Sky

No Man's Sky é outro excelente exemplo de como o design de som processual pode criar um mundo de jogo rico e dinâmico. A equipa de desenvolvimento enfrentou o desafio único de criar uma banda sonora que se adaptasse ao universo gerado processualmente do jogo. Com a maioria dos recursos do jogo, incluindo planetas, ecossistemas e até criaturas, a serem gerados por algoritmos, uma banda sonora tradicional pré-gravada não seria suficiente.

Para enfrentar este desafio, a equipa da Hello Games utilizou o middleware de áudio Wwise, especificamente um plugin personalizado conhecido como VocAlien. Esta ferramenta foi essencial para sintetizar vocalizações para as diversas e únicas criaturas do jogo. O VocAlien gera sons com base nas características de cada criatura, como o seu tamanho e tipo, garantindo que cada som é adequado e único.

O sistema de áudio processual do jogo também permitiu aos criadores "executar" sons. Isto significa que as paisagens sonoras criadas não são gravações estáticas, mas peças dinâmicas de áudio que mudam em tempo real com base nas animações e comportamentos básicos das criaturas.

Como resultado, os sons que ouve enquanto explora estão intrinsecamente ligados às acções no ecrã e às condições ambientais.

Elite Dangerous

Elite Dangerous, o jogo de exploração espacial de ficção científica online de grande sucesso de 2014, estabeleceu uma fasquia elevada para o áudio imersivo nos jogos com a sua utilização de design de som processual. Os criadores do jogo utilizaram técnicas processuais para criar sons dinâmicos e adaptáveis, especialmente para motores de naves espaciais e interfaces gráficas.

Mini Metro

Mini Metro é um jogo minimalista de simulação de metro de 2015 que utiliza áudio processual para criar uma banda sonora adaptável e envolvente que melhora a jogabilidade. Os criadores, Dino Polo Club, tinham como objetivo integrar a música processual desde o início, aproveitando os pontos fortes das técnicas processuais para corresponder à natureza dinâmica do jogo.

Rich Vreeland, o compositor, utilizou um sistema de música processual que responde às acções do jogador e à evolução do sistema de metro. Cada cidade do jogo tem o seu próprio conjunto de qualidades musicais, como ritmos e escolhas harmónicas, que mudam dinamicamente com base na forma como os jogadores constroem e alteram as suas linhas de metro.

Just Cause 4

Em Just Cause 4, os criadores utilizaram o design de som processual para o efeito sonoro "whoosh" gerado quando o jogador passa por um veículo NPC no trânsito. Este efeito é criado utilizando a síntese em tempo de execução do middleware de áudio FMOD.

Este efeito sonoro whoosh foi sintetizado utilizando uma mistura de ruído branco e castanho. O ruído branco contém igual intensidade em diferentes frequências, criando um som sibilante consistente, enquanto o ruído castanho tem mais energia em frequências mais baixas, produzindo um som mais profundo e suave.

Ao misturar estes dois tipos de ruído em diferentes proporções, a equipa conseguiu variar a saída do som combinado com base em diversas variáveis do jogo, como a distância até aos veículos NPC, a velocidade desses veículos e a velocidade do veículo do jogador.

Com esta abordagem, os efeitos sonoros no motor de jogo foram capazes de se adaptar dinamicamente às acções do jogador e ao ambiente.

Considerações finais - Olhando para o futuro do design de som procedimental

O som processual oferece uma flexibilidade imensa na jogabilidade moderna. Os designers de som podem criar paisagens sonoras dinâmicas e adaptáveis que respondem às acções dos jogadores e às alterações ambientais em tempo real, assegurando que a experiência de cada jogador é única e melhorando a imersão e o envolvimento através de efeitos sonoros adaptados ao contexto específico do jogo.

No entanto, apesar das vantagens do áudio procedural, o áudio de amostragem continua a ser o padrão de ouro para alcançar a mais alta fidelidade e realismo. As amostras pré-gravadas capturam os detalhes e as características naturais dos sons do mundo real, proporcionando um nível incomparável de qualidade de áudio. Porque não programar alguns dos milhões de amostras de êxitos de espadas disponíveis em bibliotecas de amostras em vez de sintetizar as suas próprias?

Olhando para o futuro, é provável que as técnicas processuais continuem a evoluir e a aumentar os métodos tradicionais de design de som. Ao integrar o design de som processual com o áudio samplado, os criadores de jogos poderão tirar partido dos pontos fortes de ambas as abordagens para criar paisagens sonoras mais dinâmicas e realistas.

Dê vida às suas músicas com uma masterização de qualidade profissional, em segundos!