Unixtopia

Transformada wavelet

É uma operação matemática, não muito diferente da transformada de Fourier, que leva um sinal, como áudio ou imagem, e produz informações sobre as frequências contidas nesse sinal, bem como nos locais dessas frequências. Isso é útil, caso queira analisar e manipular frequências no sinal, o JPEG 2000 explora as transformações da wavelet para comprimir imagens, descartando certas frequências nelas que nossos olhos não são sensíveis. A principal vantagem sobre a transformada de Fourier, e transformadas semelhantes, como a do cosseno, é que a transformação de wavelet nos mostra não apenas frequências, mas também seus locais, horário em que essas frequências entram em jogo em um sinal de áudio. Isso nos permite localizar sons específicos no áudio ou aplicar compactação apenas a certas partes de uma imagem. Embora frequências de localização também sejam possíveis com a transformada de Fourier com truques como espectrogramas, as transformações de wavelet são uma maneira mais elegante, natural e contínua de fazê-lo. Observe que, devido ao princípio da incerteza de Heisenberg, é matematicamente impossível conhecer exatamente as frequências e seus locais, sempre deve haver uma troca, o próprio sinal de entrada nos diz tudo sobre localização, mas nada sobre frequências, a transformada de Fourier nos diz tudo sobre frequências, mas nada sobre seus locais e a transformada wavelet está a meio caminho entre os dois, nos diz sobre frequências e seus locais aproximados. Sempre há uma transformação inversa para uma transformação de wavelet para que possamos transformar o sinal, depois manipular as frequências e transformá-lo de volta.

As transformadas da wavelet usam os chamados wavelets, ondas minúsculas, como sua função de base, da mesma forma que a transformada de Fourier usa funções senoidal e cosseno para analisar o sinal de entrada. Uma wavelet é uma função especial, satisfazendo algumas propriedades dadas, que parece uma onda curta, enquanto uma função seno é uma onda infinita, contínua para sempre, uma wavelet se eleva na frente de 0, vibra por um tempo, e então desaparece gradualmente novamente após 0. Existem muitas funções wavelet possíveis, portanto não há uma única transformação de wavelet, as transformações de wavelet são uma família de transformações que cada uma usa algum tipo de wavelet como base. Wavelet é de fato uma função complexa, o que é mostrado aqui é apenas sua parte real, a parte imaginária parece semelhante e oscila de forma perpendicular à parte real. A transformação pode funcionar até mesmo com a parte real, para entendê-la você pode ignorar números complexos para começar, mas trabalhar com números complexos acabará criando uma saída melhor, iremos efetivamente calcular um envelope que é o que nos interessa.

A saída de uma transformada wavelet é chamada de escalograma, semelhante ao espectro na transformada de Fourier, uma função multidimensional que para cada local no sinal, como o tempo no sinal de áudio ou posição de pixel em uma imagem, e para cada frequência fornece a força da influência dessa frequência naquele local no sinal. Aqui, a força da influência é basicamente similaridade com a wavelet de determinada frequência e deslocamento, similaridade significando basicamente um produto escalar ou convolução. O escalograma pode ser calculado por força bruta simplesmente pegando cada wavelet de frequência possível, deslocando-a por cada deslocamento possível e então convoluindo-a com o sinal de entrada. Para cérebros grandes, similarmente à transformada de Fourier, a transformada wavelet pode ser vista como a transformação de um ponto no espaço de alta dimensão, a função de entrada, para uma base de vetor ortogonal diferente, o conjunto de vetores de base representados pelas possíveis wavelets escalonadas e deslocadas. Nós literalmente apenas transformamos a função em um sistema de coordenadas diferente onde nossas coordenadas são frequências e suas localizações em vez de localizações e amplitudes do sinal, o sistema de coordenadas original.

Impulsionado por nada. Todo conteúdo é disponível sob CC0 1.0 domínio público. Envie comentários e correções para Mr. Unix em victor_hermian@disroot.org.