Cientistas do Massachusetts Institute of Technology (MIT) nos EUA, desenvolveram um modelo de computador capaz de localizar som por meio de redes neurais convolucionais.
Segundo os pesquisadores, o computador é capaz de realizar a mesma tarefa que os humanos para localizar sons da vida real.
Além disso, este modelo foi desenvolvido com o objetivo de realizar o mesmo tipo de cálculo que o cérebro usa para localizar sons.
Os modelos de computador deste tipo só funcionavam bem em ambientes sem ruído de fundo e tinha dificuldades de reconhecer sons em locais com ruídos e ecos.
Para mudar isso, os cientistas utilizaram um mecanismo que simula o cálculo do cérebro humano que pode reconhecer um som específico e a direção de onde ele está vindo.
Isso é possível por que partes do mesencéfalo realizam o processo de comparar as pequenas diferenças encontradas no som para ajudar a estimar de que direção ele veio.
Com isso, os humanos conseguem identificar a direção de uma fonte sonora facilmente, mesmo em ambientes que produzem ecos e muitos sons.
Ao reproduzir estes processos do cérebro humano neste novo modelo de computador, a máquina passou a localizar sons no mundo real distinguindo ecos e ruídos.
"No passado, o que descobrimos repetidamente é que o modelo recapitula os resultados que você vê em humanos", disse Josh McDermott, professor associado de ciências do cérebro e cognitivas e membro do McGovern Institute for Brain Research do MIT.
Para aperfeiçoar a localização sonora por computador, os cientistas utilizaram um supercomputador para treinar e testar cerca de 1.500 modelos diferentes.
Para treinar os modelos, eles criaram um mundo virtual no qual podem controlar o tamanho e as propriedades de reflexão das paredes de uma sala.
Todos os sons alimentados aos modelos se originaram em algum lugar dessa sala virtual, incluindo um conjunto de mais de 400 sons de treinamento separados por categoria:
- Vozes humanas
- Sons de animais
- Sons de máquinas, como motores de carros
- Sons naturais, como trovões
Durante as buscas, os pesquisadores identificaram dez dos modelos que pareciam os mais adequados para localização, após isso, eles treinaram ainda mais os modelos e os usaram para estudos subsequentes.
Após concluírem os testes, os cientistas do projeto garantiram que o modelo começa com as mesmas informações fornecidas pelos ouvidos ao cérebro humano.
Várias dobras no ouvido externo refletem o som, alterando as frequências que entram no ouvido. Existem variações nessas reflexões com base na direção do som.
Este efeito foi simulado executando cada som através de uma função matemática especializada antes do modelo de computador.
Durante os testes, o modelo de computador treinado também apresentou o mesmo padrão de sensibilidade à frequência das orelhas de um humano.
Por fim, os resultados dos testes mostram que, embora o modelo tenha sido treinado em um mundo virtual, tudo indica que ele conseguirá localizar sons no mundo real.
"À medida que você adiciona mais e mais fontes, obtém um padrão específico de declínio na capacidade dos humanos de julgar com precisão o número de fontes presentes e sua capacidade de localizar essas fontes. Os humanos parecem estar limitados a localizar cerca de três fontes ao mesmo tempo e, quando executamos o mesmo teste no modelo, vimos um padrão de comportamento semelhante", disse Francl.
"Quando os modelos treinados nesses mundos estranhos foram avaliados na mesma bateria de testes comportamentais, os modelos se desviaram do comportamento humano e como eles falharam variou dependendo do tipo de ambiente em que foram treinados. a ideia de que as habilidades de localização do cérebro humano são adaptadas aos ambientes em que os humanos evoluíram", observaram os cientistas do projeto.
Via: MIT