Imparare a prevedere le espressioni della sequenza di RNA da immagini di diapositive intere con applicazioni per la ricerca e la classificazione
CasaCasa > Notizia > Imparare a prevedere le espressioni della sequenza di RNA da immagini di diapositive intere con applicazioni per la ricerca e la classificazione

Imparare a prevedere le espressioni della sequenza di RNA da immagini di diapositive intere con applicazioni per la ricerca e la classificazione

Apr 24, 2023

Biologia delle comunicazioni volume 6, numero articolo: 304 (2023) Citare questo articolo

3463 accessi

14 Altmetrico

Dettagli sulle metriche

I metodi di deep learning sono ampiamente applicati nella patologia digitale per affrontare sfide cliniche come la prognosi e la diagnosi. Essendo una delle applicazioni più recenti, i modelli profondi sono stati utilizzati anche per estrarre caratteristiche molecolari da immagini di diapositive intere. Sebbene i test molecolari contengano numerose informazioni, sono spesso costosi, richiedono molto tempo e richiedono tessuto aggiuntivo da campionare. In questo articolo, proponiamo tRNAsformer, una topologia basata sull'attenzione che può imparare sia a predire la massa di RNA-seq da un'immagine sia a rappresentare simultaneamente l'intera immagine di un vetrino. Il tRNAsformer utilizza l'apprendimento a istanze multiple per risolvere un problema scarsamente supervisionato mentre l'annotazione a livello di pixel non è disponibile per un'immagine. Abbiamo condotto diversi esperimenti e ottenuto prestazioni migliori e una convergenza più rapida rispetto agli algoritmi all'avanguardia. Il tRNAsformer proposto può fungere da strumento di patologia computazionale per facilitare una nuova generazione di metodi di ricerca e classificazione combinando la morfologia dei tessuti e l'impronta molecolare dei campioni bioptici.

I patologi utilizzano l’istopatologia per diagnosticare e classificare il cancro dopo aver esaminato un campione bioptico. L’introduzione della patologia digitale, i progressi nella tecnologia informatica e la crescente disponibilità di enormi set di dati hanno reso possibile l’addestramento di modelli di deep learning sempre più complessi per vari compiti clinici. Le reti neurali convoluzionali (CNN) hanno superato tutti gli altri algoritmi tradizionali di visione artificiale in un'ampia gamma di applicazioni cliniche, tra cui la sottotipizzazione del cancro1, la ricerca e la categorizzazione2 di immagini su diapositiva intera (WSI), il rilevamento della mitosi3 e la classificazione4, tra le architetture di deep learning.

Tuttavia, recentemente ci sono stati alcuni tentativi di collegare le caratteristiche morfologiche incorporate nelle immagini alle firme molecolari5,6,7,8. Ad esempio, ricerche recenti hanno rivelato che i modelli statistici possono collegare i tratti istomorfologici alle mutazioni negli organi, inclusi il polmone e la prostata9,10. È noto che le mutazioni e le modifiche epigenomiche causano grandi variazioni nell'espressione genica. Pertanto, la caratterizzazione dell'espressione genica può essere vitale per la diagnosi e il trattamento11. Anche se sono stati stabiliti strumenti di sequenziamento dell'intero trascrittoma più convenienti per lo studio delle informazioni sui geni, sono ancora lontani dall'essere ampiamente utilizzati nei centri medici12. D'altra parte, il recupero delle caratteristiche molecolari dei WSI colorati con ematossilina ed eosina (H&E) è una delle opzioni più rapide e meno costose. È stato dimostrato che la capacità di prevedere l'espressione genica utilizzando le WSI, sia come modalità intermedia che come risultato, aiuta la diagnosi e la prognosi5,8. Studi precedenti hanno attirato l'attenzione sulla previsione dell'espressione genica utilizzando WSI; tuttavia, la dimensione dei WSI e la quantità di dati ben annotati pongono ancora sfide serie. In particolare, la selezione del campione e la rappresentazione del WSI sono un argomento aperto che viene spesso gestito in modo arbitrario.

Secondo il più recente rapporto sulle statistiche globali sul cancro, nel 2020 si sono verificati circa 431.288 nuovi casi di cancro al rene e 179.368 decessi a livello globale13. Il carcinoma a cellule renali (RCC) è il tumore renale più comune ed è responsabile dell'85% dei casi maligni14. Da un singolo fenotipo maligno a un gruppo eterogeneo di tumori, la nostra conoscenza sull'RCC si è evoluta nel tempo14. Tra tutti i sottotipi istologici di RCC, ccRCC, pRCC e crRCC rappresentano rispettivamente quasi il 75%, 16% e 7% di tutti i casi di RCC14. I sottotipi di RCC differiscono per istologia, caratteristiche molecolari, esiti clinici e reattività terapeutica come risultato di questa eterogeneità. Ad esempio, poiché il tasso di sopravvivenza a 5 anni differisce tra i diversi sottotipi, la corretta diagnosi del sottotipo è fondamentale15. Tutti i metodi in questo lavoro vengono applicati sulle diapositive RCC per identificare i sottotipi utilizzando la ricerca e la classificazione.