Home > Terms > Portuguese (PT) > Análise espectral

Análise espectral

Os métodos de análise espectral sobre pequenos intervalos de tempo são considerados o coração do módulo de análise do sinal de um sistema de reconhecimento de fala.

Basicamente dois métodos de análise espectral predominam nos sistemas de reconhecimento de fala atuais: o método de análise espectral por banco de filtros a partir da transformada rápida de Fourier (FFT) e o método de análise espectral LPC (Linear Predictive Coding). Tanto o espectro resultante da FFT quanto o espectro de predição linear são representações bem mais correlacionadas ao processo de audição e percepção humana que a representação temporal inicial, o que justifica a ampla utilização de parâmetros extraídos a partir destas representações espectrais. Inicialmente, o sinal de fala é dividido em quadros de duração fixa. A duração de cada quadro, T_f, é definida como o intervalo de tempo sobre o qual uma dada análise espectral é válida. Durações de quadro típicas variam de 10ms a 20ms em sistemas práticos. Os valores dentro desta faixa representam um compromisso entre a taxa de variação do espectro de um sinal de fala (taxa de mudança da configuração do trato vocal) e a complexidade do sistema. Define-se a duração da janela, T_w, como o intervalo de tempo sobre o qual é realizada uma análise espectral. Geralmente, T_w > T_f indicando a existência de superposição entre janelas adjacentes. O grau de superposição entre janelas adjacentes controla o quão rapidamente os parâmetros podem variar quadro a quadro. A técnica de análise LPC realiza uma análise espectral em janelas de fala com a utilização de um modelo autorregressivo. Isto significa que a representação espectral resultante é da forma σ/A(e^(jω)), onde σ é uma constante relacionada com a energia da janela em análise e A(e^(jω)) é um polinômio de ordem p com transformada Z dada por A(z) = 1 - a_1 z^(-1) - a_2 z^(-2) - ... - a_p z^(-p). A ordem do polinômio é também denominada ordem da análise LPC. O resultado da análise LPC numa janela de fala é um vetor de coeficientes que especifica parametricamente o espectro do modelo autorregressivo que melhor representa o espectro do sinal de fala nesta janela. O modelamento LPC resulta numa boa aproximação da envoltória espectral do trato vocal, principalmente para as regiões de fala sonoras. Durante regiões de fala não-sonoras ou transientes o modelamento é menos efetivo, porém aceitável. Além disso, a maneira pela qual o modelamento LPC é aplicado aos sinais de fala leva a uma separação razoável entre a excitação e a resposta em frequência do trato vocal (filtro), permitindo uma boa representação das características do trato vocal, as quais estão diretamente relacionadas ao som produzido. Por fim, o custo computacional envolvido no modelamento LPC é inferior ao da obtenção do espectro do sinal de fala via FFT.

Esta definição foi adaptada a partir de fragmentos retirados da seguinte fonte:

NUNES, Henrique Ferreira. Reconhecimento de fala baseado em HMM. 1996. 78 f. Dissertação (mestrado) - Universidade Estadual de Campinas, Faculdade de Engenharia Elétrica e de Computação, Campinas, SP. Disponível em: http://www.repositorio.unicamp.br/handle/REPOSIP/259042. Acesso em: 07 abr. 2020.

0
Adicionar ao meu Glossário

O que quer dizer?

Precisa de iniciar sessão para iniciar uma discussão.

Terms in the News

Billy Morgan

Desportos; Snowboarding

Snowboarder britânico Billy Morgan aterrou o primeiro alguma vez 1800 cortiça quádruplo do esporte. o piloto, que representou a Grã-Bretanha nos Jogos Olímpicos de inverno em Sochi 2014, foi em Livigno, Itália, quando ele alcançou a manobra. Envolve lançando quatro vezes, enquanto o corpo gira também cinco rotações completas sobre um eixo lateralmente ou virado ...

Marzieh Afkham

Broadcasting & receiving; Notícias

Marzieh Afkham - a porta-voz oficial do Ministério dos Negócios Estrangeiros Iraniano - vai liderar uma missão na Ásia Oriental, segundo a agência noticiosa estatal. Não é ainda claro para que país será a mesma enviada, uma vez que a sua nomeação ainda não foi oficialmente anunciada. Afkam será a segunda mulher a assumir o cargo de embaixatriz no Irão. No ...

Pacote semanal

Idiomas; Serviços Online; Gíria; Internet

Semanal pacote ou "Paquete Semanal" como é conhecido em Cuba é um termo usado pelos cubanos para descrever as informações coletadas de internet fora de Cuba e salvos em unidades de disco rígido para ser transportado na própria Cuba. Pacotes semanais são depois vendidos para o cubano sem acesso à internet, permitindo-lhes obter informações poucos dias - e às vezes ...

Banco de investimento de infra-estrutura Asiático (AIIB)

Banking; Investment banking

O Banco Asiático de investimento infra-estrutura (AIIB) é uma instituição financeira internacional criada para atender à necessidade da Ásia para o desenvolvimento de infra-estrutura. De acordo com o Banco Asiático de desenvolvimento, Ásia precisa de US $ 800 bilhões anualmente para estradas, portos, usinas de energia ou outros projetos de infra-estrutura antes de ...

Espartano

Serviços Online; Internet

Spartan é o nome de código dado para o novo navegador da Microsoft Windows 10 que irá substituir o Microsoft Windows Internet Explorer. o novo navegador será construído do chão e desconsiderar qualquer código da plataforma IE. Tem um novo motor de renderização que é construído para ser compatível com como a web é escrito hoje. o ...

Featured Terms

Carlos Espírito Santo
  • 0

    Terms

  • 0

    Glossários

  • 0

    Followers

Actividade/ Sector: Pessoas Category: Actresses

Shirley Temple

Shirley Temple (23 de abril de 1928 – 10 de fevereiro de 2014) foi decerto a estrela infantil mais popular de todos os tempos. Ela começou a sua ...

Featured blossaries

Unusual Sports

Categoria: Desportos   2 3 Terms

Divergent

Categoria: Entertainment   2 6 Terms