Questa pagina è stata tradotta automaticamente e l'accuratezza della traduzione non è garantita. Si prega di fare riferimento al Versione inglese per un testo di partenza.

Intelligenza artificiale e lesioni benigne del riconoscimento delle corde vocali

21 febbraio 2023 aggiornato da: Marchese Maria Raffaella, Fondazione Policlinico Universitario Agostino Gemelli IRCCS

Intelligenza artificiale per il riconoscimento delle lesioni benigne delle corde vocali da registrazioni audio

Lo sviluppo dell'Intelligenza Artificiale (AI), l'evoluzione della tecnologia vocale, i progressi nell'analisi del segnale audio e i metodi di elaborazione/comprensione del linguaggio naturale hanno aperto la strada a numerose potenziali applicazioni della voce, come l'identificazione di biomarcatori vocali per la diagnosi, la classificazione o per migliorare la pratica clinica. Più recentemente, le ricerche si sono concentrate sul ruolo del segnale audio della voce come firma del processo patogeno. La disfonia indica che si sono verificati alcuni cambiamenti negativi nella produzione vocale. La prevalenza complessiva della disfonia è di circa l'1% anche se i tassi effettivi possono essere più elevati a seconda della popolazione studiata e della definizione dello specifico disturbo della voce. La salute della voce può essere valutata da diversi parametri acustici. La relazione tra patologia vocale e caratteristiche della voce acustica è stata stabilita clinicamente e confermata sia quantitativamente che soggettivamente dagli esperti del linguaggio. I sistemi automatici sono progettati per determinare se il campione appartiene a un soggetto sano oa un soggetto non sano. L'esattezza dei parametri acustici è legata alle caratteristiche utilizzate per stimarli per l'identificazione del rumore vocale. Le attuali ricerche vocali sono per lo più limitate a domande di base anche se con ampie prospettive. La letteratura sui biomarcatori vocali di specifiche malattie delle corde vocali è aneddotica e correlata a disturbi funzionali delle corde vocali o rari disturbi del movimento della laringe. Le cause più comuni di disfonia sono le lesioni benigne della piega vocale (BLVF). Attualmente, la videolaringostroboscopia, sebbene invasiva, è il gold standard per la diagnosi di BLVF. Tuttavia, è una procedura invasiva e costosa. I nuovi algoritmi ML hanno recentemente migliorato l'accuratezza della classificazione delle caratteristiche selezionate nelle variabili target rispetto a procedure più convenzionali grazie alla capacità di combinare e analizzare grandi set di dati delle caratteristiche vocali. Anche se la maggior parte degli studi si concentra sulla diagnosi di un disturbo in cui si distingue tra soggetti sani e non sani, i ricercatori ritengono che il compito più importante sia spesso la diagnosi differenziale tra due o più malattie. Anche se questo è un compito impegnativo, è di fondamentale importanza spostare il supporto decisionale a questo livello. Lo scopo principale di questa ricerca sarebbe lo studio, lo sviluppo e la validazione di algoritmi ML per riconoscere i diversi BVLVFL dalle registrazioni vocali digitali.

Panoramica dello studio

Stato

Reclutamento

Condizioni

Descrizione dettagliata

Gli investigatori raccoglieranno le registrazioni audio dei partecipanti disfonici affetti da BLVF. Tutti i campioni vocali saranno suddivisi nei seguenti gruppi in base alla diagnosi endoscopica: cisti delle corde vocali, edema di Reinke, noduli e polipi. Le tracce audio saranno ottenute chiedendo di pronunciare con la consueta intensità, tono e qualità della voce la parola /aiuole/ per tre volte di seguito. Le voci verranno acquisite utilizzando un microfono Shure modello SM48 (Evanston IL) posizionato ad un angolo di 45° ad una distanza di 20 cm dalla bocca del paziente. L'ingresso di saturazione del microfono sarà fissato a 6/9 di CH1 e il rumore ambientale era <30 dB di livello di pressione sonora (SPL). I segnali saranno registrati in formato ".nvi" con un registratore audio ad alta definizione Computerized Speech Lab, modello 4300B, della Kay Elemetrics (Lincoln Park, NJ, USA) con frequenza di campionamento di 50 kHz e convertiti in ". formato wav". Ogni file audio sarà etichettato in modo anonimo con genere e tipo di BLVF.

Pipeline di analisi Tutte le seguenti analisi saranno eseguite utilizzando MatLab R2019b, MathWorks, Natick MA, USA. La pipeline di analisi includeva la pre-elaborazione del segnale, l'estrazione delle caratteristiche, lo screening delle caratteristiche e l'implementazione del modello.

Estrazione delle caratteristiche Sul segnale segmentato, verranno estratte 66 diverse caratteristiche nel dominio del tempo, della frequenza e del dominio cepstrale. Quindi, verranno calcolate sette misure statistiche sulle caratteristiche estratte, vale a dire: media, deviazione standard, asimmetria, curtosi, 25°, 50° e 75° percentile. Inoltre, jitter, shimmer e tilt dello spettro di potenza saranno ottenuti dall'intero segnale non segmentato.

Screening delle caratteristiche Lo screening delle caratteristiche verrà applicato utilizzando analisi biostatistiche sull'intero set di dati, per ridurre il numero esteso di caratteristiche da fornire come input al classificatore. Verranno utilizzati due test statistici per vagliare le caratteristiche rilevanti per il compito di classificazione: l'analisi della varianza unidirezionale (ANOVA), quando tutti i gruppi erano distribuiti normalmente, e il test di Kruskal-Wallis, altrimenti. La normalità dei gruppi sarà verificata attraverso il test di Kolmogorov-Smirnov. Per tutti i test sarà considerato statisticamente significativo un p-value <0.05.

A. Implementazione del modello Una Support Vector Machine (SVM) non lineare con un kernel gaussiano è l'algoritmo scelto per questa ricerca. Le prestazioni della classifica saranno misurate attraverso l'accuratezza e il punteggio medio di F1. Entrambe le metriche saranno fornite per la descrizione delle performance della classifica complessiva e di quelle ottenute sui sottogruppi di genere.

Tipo di studio

Osservativo

Iscrizione (Anticipato)

300

Contatti e Sedi

Questa sezione fornisce i recapiti di coloro che conducono lo studio e informazioni su dove viene condotto lo studio.

Contatto studio

Luoghi di studio

      • Roma, Italia, 00198
        • Reclutamento
        • Maria Raffaella Marchese
        • Contatto:

Criteri di partecipazione

I ricercatori cercano persone che corrispondano a una certa descrizione, chiamata criteri di ammissibilità. Alcuni esempi di questi criteri sono le condizioni generali di salute di una persona o trattamenti precedenti.

Criteri di ammissibilità

Età idonea allo studio

Da 18 anni a 65 anni (Adulto, Adulto più anziano)

Accetta volontari sani

N/A

Sessi ammissibili allo studio

Tutto

Metodo di campionamento

Campione di probabilità

Popolazione di studio

Pazienti affetti da lesioni benigne delle corde vocali

Descrizione

Criterio di inclusione:

  • Edema di Reinke
  • cisti delle corde vocali
  • nodulo delle corde vocali
  • polipo della corda vocale

Criteri di esclusione:

  • precedente intervento chirurgico alla laringe o alla tiroide
  • precedente logopedia
  • patologie polmonari attuali
  • reflusso gastroesofageo in atto
  • disturbo del movimento laringeo o paralisi ricorrente del nervo laringeo
  • Non madrelingua italiana

Piano di studio

Questa sezione fornisce i dettagli del piano di studio, compreso il modo in cui lo studio è progettato e ciò che lo studio sta misurando.

Come è strutturato lo studio?

Dettagli di progettazione

Cosa sta misurando lo studio?

Misure di risultato primarie

Misura del risultato
Misura Descrizione
Lasso di tempo
validazione di algoritmi ML per riconoscere i diversi BVFL
Lasso di tempo: cinque anni
Le misure statistiche calcolate sulle caratteristiche estratte sono le seguenti: media, deviazione standard, asimmetria, curtosi, 25°, 50° e 75° percentile. Inoltre, jitter, shimmer e tilt dello spettro di potenza saranno ottenuti dall'intero segnale non segmentato.
cinque anni

Collaboratori e investigatori

Qui è dove troverai le persone e le organizzazioni coinvolte in questo studio.

Studiare le date dei record

Queste date tengono traccia dell'avanzamento della registrazione dello studio e dell'invio dei risultati di sintesi a ClinicalTrials.gov. I record degli studi e i risultati riportati vengono esaminati dalla National Library of Medicine (NLM) per assicurarsi che soddisfino specifici standard di controllo della qualità prima di essere pubblicati sul sito Web pubblico.

Studia le date principali

Inizio studio (Effettivo)

1 novembre 2021

Completamento primario (Anticipato)

1 novembre 2025

Completamento dello studio (Anticipato)

1 novembre 2025

Date di iscrizione allo studio

Primo inviato

1 febbraio 2023

Primo inviato che soddisfa i criteri di controllo qualità

21 febbraio 2023

Primo Inserito (Stima)

6 marzo 2023

Aggiornamenti dei record di studio

Ultimo aggiornamento pubblicato (Stima)

6 marzo 2023

Ultimo aggiornamento inviato che soddisfa i criteri QC

21 febbraio 2023

Ultimo verificato

1 febbraio 2023

Maggiori informazioni

Termini relativi a questo studio

Piano per i dati dei singoli partecipanti (IPD)

Hai intenzione di condividere i dati dei singoli partecipanti (IPD)?

NO

Informazioni su farmaci e dispositivi, documenti di studio

Studia un prodotto farmaceutico regolamentato dalla FDA degli Stati Uniti

No

Studia un dispositivo regolamentato dalla FDA degli Stati Uniti

No

Queste informazioni sono state recuperate direttamente dal sito web clinicaltrials.gov senza alcuna modifica. In caso di richieste di modifica, rimozione o aggiornamento dei dettagli dello studio, contattare register@clinicaltrials.gov. Non appena verrà implementata una modifica su clinicaltrials.gov, questa verrà aggiornata automaticamente anche sul nostro sito web .

Prove cliniche su Registrazioni audio

Sottoscrivi