Exercici d’Audio Data Visualization

Taller 1. 29/04/2011 i 06/05/2011
Oriol Rosell i Julià Carboneras (www.ptchwrks.com)

Sobre un fragment musical que se’n proporciona, hem de generar un vocabulari propi, que ens permeti traslladar l’àudio en un llenguatge visual. Aquí es poden descarregar els àudios: www.ptchwrks.com/adv

Això té implicacions importants, en aquest cas canvia el sentit que percep la informació, per que canvia el fenòmen físic percebut. En els dos casos són ones, l’audio, ones del fluid (aire) en que ens trobem, en l’altre cas, ones electromagnètiques. Els sentits encarregats de percebre aquestes ones són dos ben diferents, la oïda i la vista.

Com tradueix el sentit la informació? quina energia es percep? Aquesta traducció, ha de fer que percebim lo mateix? Les mateixa sensacions de plaer o no, de calidesa o fredó? La mostra d’audio que se’ns va proporcionar per a realitzar l’exercici, era freda, molesta de vegades, no tranquilitzadora, incòmoda, … els gràfics resultants han de produir el mateix efecte? Però, la meva percepció de l’audio és una, i una altra ben diferent per a una altra persona; la seva representació gràfica, ha de produir els diferents efectes corresponents?

El procediment que he seguit consisteix en transformar cada instant de l’àudio en alguns valors numèrics, que posteriorment usaré per a generar gràfics amb l’ordinador. En cada instant, el so té una quantitat d’energia, i si el mirem des del punt de vista freqüencial, veiem que cada moment és pot descomposar en el seu espectre de freqüències. la FFT o transformada ràpida de Fourier és una operació matemàtica que permet fer aquesta transformació.

En el primer exemple, dibuixaré circumferències, el radi, posició i el color de les quals dependrà de cada mostra freqüencial, aquest és l’algoritme principal:

for (int i = 0; i < fft.specSize(); i++)  {

float A = fft.getBand(i);
float Ang = i * 2 * PI / fft.specSize();
float X =  i * A *  sin(Ang);
float Y = i * A * cos(Ang);
fill(X*4,Y*4,i*4);
ellipse(X,Y,100*A,100*A);

}

El que fa aquest petit programa és en un bucle que recorre totes les components freqüencials d’un instant determinat, “i” correspon a cada una de les freqüències i “A” és la seva amplitud. Desprès divideixo els 360 graus d’una circumferència pel nombre de mostres que hi ha, i el radi de cada una d’aquestes divisions depèn de l’amplitud “A” de la componen freqüencial corresponent. Al final de cada radi, hi dibuixo una petita el·lipse, el radi de la qual també depèn de l’amplitud “A”, i el color, depèn de la seva posició. He usat Processing per a generar els gràfics, aquest n’és el resulat:

http://vimeo.com/26825506

En un segon exercici, també realitzat amb Processing, es realitzen les FFT independents per a cada una de les pistes proporcionades del mateix de àudio, en total 13, tot i que a l’exercici només n’uso 7. Per cada pista, els gràfics dibuixats són diferents, rectangles, línies, colors, transparències, etc … tots els valors proven igual que en l’exemple anterior, dels valors instantanis de l’espectre freqüencial:

http://vimeo.com/26825046

Reflexió sobre els treballs presentats a classe.

Després d’observar atentament els treballs presentats a classe per alguns del companys del curs, he arribat a la conclusió de que el procés de translació del so a la seva representació gràfica, és molt semblant al que resulta de fer una transformació de Fourier o a la seva aplicació informàtica, la transformada ràpida de Fourier (FFT). La FFT permet mostrar el so (o una ona en general) des del punt de vista de l’espectre de freqüències que el composen. Efectivament, en alguns dels exercicis presentats, cada so, per exemple un TIC TIC TIC repetitiu, era representat per una petit rectangle de color vermell, mentre que un so més greu, tipus POM POM POM, era representat per un cercle més fosc. Per tant, un so més agut queda representat de manera diferent que un so més greu, en definitiva, lo que caracteritza la representació d’un so és la seva freqüència. Lo que és sorprenent per a mi, és que no és ni més ni menys que lo que jo he fet en el meu treball, però d’una forma purament informàtica, és a dir, que en el meu cas, el càlcul de la FFT el realitza l’ordinador, i els gràfic resultants també. En els dos casos, l’humà i l’informàtic, hi ha una relació directa entre la freqüència del so i la visualització resultant.

This entry was posted in Àudio, Classes, Reflexions and tagged , , . Bookmark the permalink.

Comments are closed.