A real-time silent speech system for voice restoration after total laryngectomy

Gonzalez, Jose A.; Green, Phil D.

doi:10.1016/j.rlfa.2018.07.004

Información del artículo

Resumen

Texto completo

Bibliografía

Descargar PDF

Estadísticas

Figuras (3)

Mostrar másMostrar menos

Tablas (2)

Table 1. Amount of data recorded by each subject.

Table 2. Results of the listening test for speech intelligibility. Average denotes the average intelligibility results over all subject and best denotes the results obtained for the most intelligible subject (M4). 95% confidence intervals are presented for each measure.

Mostrar másMostrar menos

Abstract

Background and aim

Individuals who have lost their voice following a laryngectomy as a treatment for cancer will inevitably struggle with their daily communication. Unfortunately, the current methods for speaking after laryngectomy all have limitations, either because of the poor acoustics generated by these methods or because they are potentially harmful. The aim of this work is thus to explore an alternative method for post-laryngectomy voice restoration in which the movement of the intact articulators is captured and then converted into audible speech using machine learning techniques.

Materials and methods

To demonstrate the feasibility of speech generation from captured articulator movement, 6 healthy adults were recruited. For each subject, both the speech acoustics and the subject's articulator movements were recorded simultaneously. Articulator movements were captured using a technique known as permanent magnet articulography (PMA), in which small magnets are attached to the articulators (typically tongue and lips) and the magnetic field generated by the magnets is captured with sensors located close to the mouth. Deep artificial neural networks were then used to model the mapping between the sensor data and the speech acoustics, thus, enabling the synthesis of speech from captured articulatory data.

Results

The proposed silent speech system is able to generate speech that sounds natural, resembles the subject's own voice and is fairly intelligible (up to 92% intelligibility for some speakers on a phonetically-rich corpus).

Conclusions

With further research, the proposed system could in future be a real option to restore lost voice after laryngectomy.

Keywords:

Laryngectomy

Silent speech interfaces

Speech rehabilitation

Speech synthesis

Permanent magnet articulography

Resumen

Antecedentes y objetivo

Aquellas personas que han perdido su voz después de una laringectomía se ven limitadas irremediablemente en su comunicación diaria. A pesar de existir en la actualidad métodos para recuperar el habla tras la laringectomía, todos ellos presentan limitaciones. El objetivo de este trabajo es explorar un método alternativo para hablar tras la laringectomía, en el que el movimiento de los órganos de la voz se transforma en una señal acústica utilizando técnicas de aprendizaje automático.

Materiales y métodos

En esta investigación participaron 6 adultos sanos. Para cada sujeto se grabó tanto su voz como los movimientos de sus labios y lengua. Los movimientos de los órganos del habla fueron capturados usando una técnica conocida como Articulografía de Imán Permanente (PMA), en la cual pequeños imanes se colocan sobre estos órganos y el campo magnético generado por los imanes se captura usando unos sensores sensibles al campo magnético. Se utilizaron redes neuronales artificiales profundas para modelar la transformación entre los datos de los sensores y la acústica de la voz.

Resultados

El sistema de habla silenciosa propuesto es capaz de generar voz que suena natural, se asemeja a la propia voz del sujeto y es inteligible (hasta un 92% de inteligibilidad para algunos sujetos).

Conclusiones

El sistema propuesto podría ser en el futuro una opción viable para restaurar la voz tras una laringectomía total.

Palabras clave:

Laringectomía

Interfaces del habla silenciosa

Rehabilitación de la voz

Síntesis de voz

Articulografía por imanes permanentes

Artículo

Opciones para acceder a los textos completos de la publicación Revista de Logopedia, Foniatría y Audiología

Suscriptor

Suscriptor de la revista

Si ya tiene sus datos de acceso, clique aquí.

Si olvidó su clave de acceso puede recuperarla clicando aquí y seleccionando la opción "He olvidado mi contraseña".

Suscribirse a:

Revista de Logopedia, Foniatría y Audiología

Más información

Comprar

Comprar acceso al artículo

Comprando el artículo el PDF del mismo podrá ser descargado

Comprar ahora

Contactar

Teléfono para suscripciones e incidencias

De lunes a viernes de 9h a 18h (GMT+1) excepto los meses de julio y agosto que será de 9 a 15h

Llamadas desde España

932 415 960

Llamadas desde fuera de España

+34 932 415 960

E-mail

atencionalcliente@elsevier.com

Indexada en:

Síguenos:

Suscribirse:

Artículo

Indexada en:

Síguenos:

Suscribirse:

Artículo

Suscríbase a la newsletter