Diese Seite wurde automatisch übersetzt und die Genauigkeit der Übersetzung wird nicht garantiert. Bitte wende dich an die englische Version für einen Quelltext.

Künstliche Intelligenz und gutartige Läsionen der Stimmlippenerkennung

21. Februar 2023 aktualisiert von: Marchese Maria Raffaella, Fondazione Policlinico Universitario Agostino Gemelli IRCCS

Künstliche Intelligenz zur Erkennung gutartiger Läsionen der Stimmlippen aus Audioaufnahmen

Die Entwicklung der künstlichen Intelligenz (KI), die Evolution der Sprachtechnologie, Fortschritte in der Audiosignalanalyse und Methoden zur Verarbeitung und zum Verständnis natürlicher Sprache haben den Weg für zahlreiche potenzielle Anwendungen der Stimme geebnet, wie z. B. die Identifizierung von stimmlichen Biomarkern für Diagnose und Klassifizierung oder zur Verbesserung der klinischen Praxis. In jüngerer Zeit konzentrierten sich die Forschungen auf die Rolle des Audiosignals der Stimme als Signatur des pathogenen Prozesses. Dysphonie zeigt an, dass einige negative Veränderungen in der Stimmerzeugung aufgetreten sind. Die Gesamtprävalenz von Dysphonie beträgt etwa 1 %, auch wenn die tatsächlichen Raten je nach untersuchter Population und Definition der spezifischen Stimmstörung höher sein können. Die Stimmgesundheit kann anhand mehrerer akustischer Parameter beurteilt werden. Die Beziehung zwischen Stimmpathologie und akustischen Stimmmerkmalen wurde klinisch etabliert und sowohl quantitativ als auch subjektiv von Sprachexperten bestätigt. Die automatischen Systeme sind so ausgelegt, dass sie bestimmen, ob die Probe zu einem gesunden Probanden oder einem nicht gesunden Probanden gehört. Die Genauigkeit akustischer Parameter ist mit den Merkmalen verknüpft, die verwendet werden, um sie für die Erkennung von Sprachgeräuschen zu schätzen. Aktuelle Sprachsuchen beschränken sich meist auf grundsätzliche Fragestellungen, wenn auch mit breiten Perspektiven. Die Literatur zu stimmlichen Biomarkern spezifischer Stimmbanderkrankungen ist anekdotisch und bezieht sich auf funktionelle Stimmbandstörungen oder seltene Bewegungsstörungen des Kehlkopfes. Die häufigsten Ursachen für Dysphonie sind die benignen Läsionen der Stimmlippe (BLVF). Derzeit ist die Videolaryngostroboskopie, obwohl invasiv, der Goldstandard für die Diagnose von BLVF. Es ist jedoch ein invasives und teures Verfahren. Die neuartigen ML-Algorithmen haben kürzlich die Klassifikationsgenauigkeit ausgewählter Merkmale in Zielvariablen im Vergleich zu konventionelleren Verfahren verbessert, dank der Fähigkeit, große Datensätze von Sprachmerkmalen zu kombinieren und zu analysieren. Auch wenn sich die meisten Studien auf die Diagnose einer Störung konzentrieren und dabei zwischen gesunden und nicht gesunden Probanden unterscheiden, sehen die Forscher die wichtigere Aufgabe häufig in der Differenzialdiagnose zwischen zwei oder mehreren Krankheiten. Auch wenn dies eine herausfordernde Aufgabe ist, ist es von entscheidender Bedeutung, die Entscheidungsunterstützung auf diese Ebene zu verlagern. Das Hauptziel dieser Forschung wäre die Untersuchung, Entwicklung und Validierung von ML-Algorithmen zur Erkennung der unterschiedlichen BVLVFL aus digitalen Sprachaufzeichnungen.

Studienübersicht

Status

Rekrutierung

Bedingungen

Intervention / Behandlung

Detaillierte Beschreibung

Die Ermittler werden die Audioaufnahmen von dysphonischen Teilnehmern sammeln, die von BLVF betroffen sind. Alle Stimmproben werden anhand der endoskopischen Diagnose in folgende Gruppen eingeteilt: Stimmlippenzysten, Reinke-Ödem, Knötchen und Polypen. Die Audiospuren werden erhalten, indem Sie dreimal hintereinander aufgefordert werden, das Wort /aiuole/ mit gewohnter Stimmintensität, -tonlage und -qualität auszusprechen. Stimmen werden unter Verwendung eines Shure-Mikrofons Modell SM48 (Evanston IL) erfasst, das in einem Winkel von 45° in einem Abstand von 20 cm vom Mund des Patienten positioniert wird. Der Mikrofonsättigungseingang wird auf 6/9 von CH1 festgelegt und die Umgebungsgeräusche waren <30 dB Schalldruckpegel (SPL). Die Signale werden im ".nvi"-Format mit einem hochauflösenden Audiorecorder Computerized Speech Lab, Modell 4300B, von Kay Elemetrics (Lincoln Park, NJ, USA) mit einer Abtastrate von 50 kHz Frequenz aufgezeichnet und in ".nvi" umgewandelt. wav"-Format. Jede Audiodatei wird anonym mit Geschlecht und BLVF-Typ gekennzeichnet.

Analysepipeline Alle folgenden Analysen werden mit MatLab R2019b, The MathWorks, Natick MA, USA, durchgeführt. Die Analyse-Pipeline umfasste die Signalvorverarbeitung, die Merkmalsextraktion, das Screening der Merkmale und die Modellimplementierung.

Merkmalsextraktion Aus dem segmentierten Signal werden 66 verschiedene Merkmale im Zeit-, Frequenz- und Cepstralbereich extrahiert. Dann werden aus den extrahierten Merkmalen sieben statistische Maße berechnet, nämlich: Mittelwert, Standardabweichung, Schiefe, Kurtosis, 25., 50. und 75. Perzentile. Zusätzlich werden Jitter, Schimmer und Neigung des Leistungsspektrums aus dem gesamten unsegmentierten Signal erhalten.

Merkmalsscreening Das Merkmalsscreening wird unter Verwendung biostatistischer Analysen auf den gesamten Datensatz angewendet, um die erweiterte Anzahl von Merkmalen zu reduzieren, die als Eingabe für den Klassifikator bereitgestellt werden. Zwei statistische Tests werden verwendet, um relevante Merkmale für die Klassifizierungsaufgabe zu screenen: die Einweg-Varianzanalyse (ANOVA), wenn alle Gruppen normalverteilt waren, und andernfalls der Kruskal-Wallis-Test. Die Normalität der Gruppen wird durch den Kolmogorov-Smirnov-Test überprüft. Für alle Tests gilt ein p-Wert < 0,05 als statistisch signifikant.

A. Modellimplementierung Eine nichtlineare Support Vector Machine (SVM) mit einem Gaußschen Kern ist der für diese Forschung gewählte Algorithmus. Die Klassifizierungsleistung wird anhand der Genauigkeit und des durchschnittlichen F1-Scores gemessen. Beide Metriken werden für die Beschreibung der Gesamtklassifikationsleistungen und derjenigen bereitgestellt, die für Geschlechtsuntergruppen erzielt wurden.

Studientyp

Beobachtungs

Einschreibung (Voraussichtlich)

300

Kontakte und Standorte

Dieser Abschnitt enthält die Kontaktdaten derjenigen, die die Studie durchführen, und Informationen darüber, wo diese Studie durchgeführt wird.

Studienkontakt

Studienorte

Teilnahmekriterien

Forscher suchen nach Personen, die einer bestimmten Beschreibung entsprechen, die als Auswahlkriterien bezeichnet werden. Einige Beispiele für diese Kriterien sind der allgemeine Gesundheitszustand einer Person oder frühere Behandlungen.

Zulassungskriterien

Studienberechtigtes Alter

18 Jahre bis 65 Jahre (Erwachsene, Älterer Erwachsener)

Akzeptiert gesunde Freiwillige

N/A

Studienberechtigte Geschlechter

Alle

Probenahmeverfahren

Wahrscheinlichkeitsstichprobe

Studienpopulation

Patienten, die von gutartigen Läsionen der Stimmlippen betroffen sind

Beschreibung

Einschlusskriterien:

  • Reinkes Ödem
  • Zyste der Stimmlippe
  • Knötchen der Stimmlippe
  • Polyp der Stimmlippen

Ausschlusskriterien:

  • frühere Kehlkopf- oder Schilddrüsenoperationen
  • vorangegangene Logopädie
  • aktuelle Lungenerkrankungen
  • aktuellen gastroösophagealen Reflux
  • Kehlkopfbewegungsstörung oder rezidivierende Kehlkopflähmung
  • Italienische Nicht-Muttersprachler

Studienplan

Dieser Abschnitt enthält Einzelheiten zum Studienplan, einschließlich des Studiendesigns und der Messung der Studieninhalte.

Wie ist die Studie aufgebaut?

Designdetails

Was misst die Studie?

Primäre Ergebnismessungen

Ergebnis Maßnahme
Maßnahmenbeschreibung
Zeitfenster
Validierung von ML-Algorithmen zur Erkennung der verschiedenen BVFL
Zeitfenster: 5 Jahre
Die anhand der extrahierten Merkmale berechneten statistischen Maße sind die folgenden: Mittelwert, Standardabweichung, Schiefe, Kurtosis, 25., 50. und 75. Perzentile. Zusätzlich werden Jitter, Schimmer und Neigung des Leistungsspektrums aus dem gesamten unsegmentierten Signal erhalten.
5 Jahre

Mitarbeiter und Ermittler

Hier finden Sie Personen und Organisationen, die an dieser Studie beteiligt sind.

Studienaufzeichnungsdaten

Diese Daten verfolgen den Fortschritt der Übermittlung von Studienaufzeichnungen und zusammenfassenden Ergebnissen an ClinicalTrials.gov. Studienaufzeichnungen und gemeldete Ergebnisse werden von der National Library of Medicine (NLM) überprüft, um sicherzustellen, dass sie bestimmten Qualitätskontrollstandards entsprechen, bevor sie auf der öffentlichen Website veröffentlicht werden.

Haupttermine studieren

Studienbeginn (Tatsächlich)

1. November 2021

Primärer Abschluss (Voraussichtlich)

1. November 2025

Studienabschluss (Voraussichtlich)

1. November 2025

Studienanmeldedaten

Zuerst eingereicht

1. Februar 2023

Zuerst eingereicht, das die QC-Kriterien erfüllt hat

21. Februar 2023

Zuerst gepostet (Schätzen)

6. März 2023

Studienaufzeichnungsaktualisierungen

Letztes Update gepostet (Schätzen)

6. März 2023

Letztes eingereichtes Update, das die QC-Kriterien erfüllt

21. Februar 2023

Zuletzt verifiziert

1. Februar 2023

Mehr Informationen

Begriffe im Zusammenhang mit dieser Studie

Plan für individuelle Teilnehmerdaten (IPD)

Planen Sie, individuelle Teilnehmerdaten (IPD) zu teilen?

NEIN

Arzneimittel- und Geräteinformationen, Studienunterlagen

Studiert ein von der US-amerikanischen FDA reguliertes Arzneimittelprodukt

Nein

Studiert ein von der US-amerikanischen FDA reguliertes Geräteprodukt

Nein

Diese Informationen wurden ohne Änderungen direkt von der Website clinicaltrials.gov abgerufen. Wenn Sie Ihre Studiendaten ändern, entfernen oder aktualisieren möchten, wenden Sie sich bitte an register@clinicaltrials.gov. Sobald eine Änderung auf clinicaltrials.gov implementiert wird, wird diese automatisch auch auf unserer Website aktualisiert .

Klinische Studien zur Audioaufnahmen

Abonnieren