Buscar en
Revista de Logopedia, Foniatría y Audiología
Toda la web
Inicio Revista de Logopedia, Foniatría y Audiología A real-time silent speech system for voice restoration after total laryngectomy
Información de la revista
Vol. 38. Núm. 4.
Páginas 148-154 (Octubre - Diciembre 2018)
Compartir
Compartir
Descargar PDF
Más opciones de artículo
Visitas
29
Vol. 38. Núm. 4.
Páginas 148-154 (Octubre - Diciembre 2018)
Original article
A real-time silent speech system for voice restoration after total laryngectomy
Un sistema de voz silenciosa en tiempo real para la restauración de la voz después de la laringectomía total
Visitas
29
Jose A. Gonzaleza,
Autor para correspondencia
j.gonzalez@uma.es

Corresponding author.
, Phil D. Greenb
a Department of Languages and Computer Sciences, University of Malaga, Malaga, Spain
b Department of Computer Science, University of Sheffield, Sheffield, UK
Este artículo ha recibido
Información del artículo
Resumen
Texto completo
Bibliografía
Descargar PDF
Estadísticas
Figuras (3)
Mostrar másMostrar menos
Tablas (2)
Table 1. Amount of data recorded by each subject.
Table 2. Results of the listening test for speech intelligibility. Average denotes the average intelligibility results over all subject and best denotes the results obtained for the most intelligible subject (M4). 95% confidence intervals are presented for each measure.
Mostrar másMostrar menos
Abstract
Background and aim

Individuals who have lost their voice following a laryngectomy as a treatment for cancer will inevitably struggle with their daily communication. Unfortunately, the current methods for speaking after laryngectomy all have limitations, either because of the poor acoustics generated by these methods or because they are potentially harmful. The aim of this work is thus to explore an alternative method for post-laryngectomy voice restoration in which the movement of the intact articulators is captured and then converted into audible speech using machine learning techniques.

Materials and methods

To demonstrate the feasibility of speech generation from captured articulator movement, 6 healthy adults were recruited. For each subject, both the speech acoustics and the subject's articulator movements were recorded simultaneously. Articulator movements were captured using a technique known as permanent magnet articulography (PMA), in which small magnets are attached to the articulators (typically tongue and lips) and the magnetic field generated by the magnets is captured with sensors located close to the mouth. Deep artificial neural networks were then used to model the mapping between the sensor data and the speech acoustics, thus, enabling the synthesis of speech from captured articulatory data.

Results

The proposed silent speech system is able to generate speech that sounds natural, resembles the subject's own voice and is fairly intelligible (up to 92% intelligibility for some speakers on a phonetically-rich corpus).

Conclusions

With further research, the proposed system could in future be a real option to restore lost voice after laryngectomy.

Keywords:
Laryngectomy
Silent speech interfaces
Speech rehabilitation
Speech synthesis
Permanent magnet articulography
Resumen
Antecedentes y objetivo

Aquellas personas que han perdido su voz después de una laringectomía se ven limitadas irremediablemente en su comunicación diaria. A pesar de existir en la actualidad métodos para recuperar el habla tras la laringectomía, todos ellos presentan limitaciones. El objetivo de este trabajo es explorar un método alternativo para hablar tras la laringectomía, en el que el movimiento de los órganos de la voz se transforma en una señal acústica utilizando técnicas de aprendizaje automático.

Materiales y métodos

En esta investigación participaron 6 adultos sanos. Para cada sujeto se grabó tanto su voz como los movimientos de sus labios y lengua. Los movimientos de los órganos del habla fueron capturados usando una técnica conocida como Articulografía de Imán Permanente (PMA), en la cual pequeños imanes se colocan sobre estos órganos y el campo magnético generado por los imanes se captura usando unos sensores sensibles al campo magnético. Se utilizaron redes neuronales artificiales profundas para modelar la transformación entre los datos de los sensores y la acústica de la voz.

Resultados

El sistema de habla silenciosa propuesto es capaz de generar voz que suena natural, se asemeja a la propia voz del sujeto y es inteligible (hasta un 92% de inteligibilidad para algunos sujetos).

Conclusiones

El sistema propuesto podría ser en el futuro una opción viable para restaurar la voz tras una laringectomía total.

Palabras clave:
Laringectomía
Interfaces del habla silenciosa
Rehabilitación de la voz
Síntesis de voz
Articulografía por imanes permanentes

Artículo

Opciones para acceder a los textos completos de la publicación Revista de Logopedia, Foniatría y Audiología
Suscriptor
Suscriptor de la revista

Si ya tiene sus datos de acceso, clique aquí.

Si olvidó su clave de acceso puede recuperarla clicando aquí y seleccionando la opción "He olvidado mi contraseña".
Suscribirse
Suscribirse a:

Revista de Logopedia, Foniatría y Audiología

Comprar
Comprar acceso al artículo

Comprando el artículo el PDF del mismo podrá ser descargado

Precio 19,34 €

Comprar ahora
Contactar
Teléfono para suscripciones e incidencias
De lunes a viernes de 9h a 18h (GMT+1) excepto los meses de julio y agosto que será de 9 a 15h
Llamadas desde España
932 415 960
Llamadas desde fuera de España
+34 932 415 960
E-mail
Opciones de artículo
Herramientas
es en pt

¿Es usted profesional sanitario apto para prescribir o dispensar medicamentos?

Are you a health professional able to prescribe or dispense drugs?

Você é um profissional de saúde habilitado a prescrever ou dispensar medicamentos