Alto
CasaCasa > Notizia > Alto

Alto

Jul 07, 2023

Nature Biotechnology (2023) Citare questo articolo

Accessi 24k

5 citazioni

172 Altmetrico

Dettagli sulle metriche

Le colture batteriche pure rimangono essenziali per studi sperimentali e meccanicistici dettagliati nella ricerca sul microbioma, e i metodi tradizionali per isolare i singoli batteri da ecosistemi microbici complessi sono ad alta intensità di lavoro, difficili da scalare e mancano di integrazione fenotipo-genotipo. Qui descriviamo una piattaforma di isolamento dei ceppi robotici ad alto rendimento open source per la generazione rapida di isolati su richiesta. Sviluppiamo un approccio di apprendimento automatico che sfrutta la morfologia delle colonie e i dati genomici per massimizzare la diversità dei microbi isolati e consentire la raccolta mirata di generi specifici. L’applicazione di questa piattaforma su campioni fecali di 20 esseri umani produce biobanche personalizzate del microbioma intestinale per un totale di 26.997 isolati che rappresentano più dell’80% di tutti i taxa abbondanti. L'analisi spaziale su >100.000 colonie catturate visivamente rivela modelli di cocrescita tra le famiglie Ruminococcaceae, Bacteroidaceae, Coriobacteriaceae e Bifidobacteriaceae che suggeriscono importanti interazioni microbiche. L'analisi comparativa di 1.197 genomi di alta qualità provenienti da queste biobanche mostra un'interessante evoluzione dei ceppi intra e interpersonali, selezione e trasferimento genico orizzontale. Questo quadro culturomico dovrebbe potenziare nuovi sforzi di ricerca per sistematizzare la raccolta e l’analisi quantitativa di fenotipi basati su imaging con dati genomici ad alta risoluzione per molti studi emergenti sul microbioma.

La metagenomica offre la possibilità di esaminare ampiamente la composizione di diversi ecosistemi microbici che vanno dalle comunità del suolo al microbioma intestinale. Tuttavia i microbi devono essere isolati e coltivati ​​per analizzare meccanicamente i loro ruoli funzionali nell’habitat e la miriade di processi interspecie che si verificano. I metodi di coltivazione tradizionali che si basano sulla raccolta casuale delle colonie con la "forza bruta" sono noiosi e richiedono molto lavoro1,2,3,4. I metodi di isolamento basati su diluizione seriale che utilizzano 96 o 384 pozzetti richiedono un uso intensivo delle risorse e comportano l'isolamento ripetuto degli stessi ceppi dominanti dalla popolazione5. I sistemi microfluidici consentono la crescita in reattori da nanolitri, ma gli isolati clonali sono difficili da estrarre6,7. Dato che un tipico microbioma può contenere da centinaia a migliaia di specie uniche che mostrano una distribuzione dell’abbondanza a coda lunga8 (vale a dire, poche dominano mentre la maggior parte sono rare), la generazione di raccolte complete di ceppi tramite culturomica sistematica rimane una sfida importante ed eccezionale.

I microbi possono essere distinti in base ai loro diversi fenotipi, sia per la loro capacità di crescere in determinati terreni sia per i metaboliti che producono9,10,11,12. La selezione basata sulla crescita può migliorare l'isolamento di specie rare, ad esempio, con terreni di crescita contenenti diversi nutrienti o antibiotici1,2,13. Gli spettri della spettrometria di massa possono essere utilizzati per differenziare le specie14,15, ma l'approccio è a bassa produttività e richiede un'elaborazione manuale. Il cell sorting attivato dall'imaging è stato sviluppato per isolare le cellule eucariotiche sulla base di immagini multidimensionali, ma questo metodo richiede una strumentazione sofisticata e non è stato implementato per i batteri16. Con i recenti progressi nell’intelligenza artificiale (AI) e nei modelli di deep learning addestrati a discernere le caratteristiche sfumate nell’imaging multidimensionale e nei dati biologici17, l’apprendimento automatico (ML) di flussi di dati fenotipici e genomici combinati è pronto a trasformare la culturomica microbica di prossima generazione.

Qui descriviamo una piattaforma di isolamento e genotipizzazione robotica dei ceppi guidata da ML che consente la generazione rapida e ad alto rendimento di biobanche coltivate su richiesta. Questo sistema utilizza un algoritmo intelligente basato sull'imaging per aumentare la diversità tassonomica dei culturomici rispetto a un metodo di selezione casuale. Abbiamo dimostrato l'utilità di questo sistema generando anaerobicamente biobanche di isolati personalizzati per 20 partecipanti umani, ottenendo un totale di 26.997 isolati con 1.197 bozze di genomi di alta qualità, che coprono 394 varianti di sequenza di ampliconi 16S (ASV). Utilizzando le informazioni genomiche e morfologiche accoppiate per ciascun isolato, abbiamo addestrato un modello ML in grado di prevedere l'identità tassonomica basata solo sulla morfologia della colonia. L'applicazione di questo modello ML ha portato a un miglioramento nell'isolamento mirato dei microbi di interesse. L'analisi di immagini su larga scala di tutte le colonie coltivate su piastre di agar ha rivelato interessanti modelli di crescita specie-specifici e interazioni interspecie. L'analisi dell'intero genoma da biobanche personalizzate ha scoperto variazioni a livello di ceppo specifiche per persona e firme del trasferimento genico orizzontale (HGT) all'interno dei principali phyla intestinali. Abbiamo ulteriormente sviluppato un database basato sul web ad accesso aperto (http://microbial-culturomics.com/) contenente dati genotipici, morfologici e fenotipici ricercabili di tutti gli isolati generati dalla culturomica automatizzata come risorsa comunitaria unica e in espansione per il campo del microbioma.

20 times higher capacity and faster than manual colony isolation by a person. To ensure that our genomic analysis capacity matches the robotic isolation throughput, we also developed a low-cost, high-throughput sequencing pipeline that leverages liquid handling automation to generate barcoded libraries for 16S rRNA sequencing or whole-genome sequencing (WGS; Methods). The cost per isolate in this pipeline is $0.45 for colony isolation and genomic DNA (gDNA) preparation, $0.46 for 16S rRNA sequencing and $6.37 for WGS at a coverage of >60× on an Illumina HiSeq platform, which is substantially cheaper than commercial services (Supplementary Table 2)./p> 0.1% are shown and the side bar on the left represents their family-level taxonomy. ASVs found in personalized biobanks are shown as black bars in the right heatmap and uncultured ASVs not found in any biobank are highlighted. f, Correlation of average relative abundance in original feces sample and number of isolates in entire collection for ASVs. Highly abundant ASVs that are difficult to culture, that is, with fewer isolates, are highlighted. g, Average relative abundance of top abundant ASVs but with no more than 2 isolates in the entire collection. Color of bars represents family-level taxonomy./p> 0.1%) are found in the biobank. Notably, a substantial fraction of the uncultured gut bacteria belonged to the Ruminococcaceae and Lachnospiraceae families (Fig. 2e and Supplementary Table 6), which has also been previously documented as ‘unculturable’24. For each ASV, we compared the number of isolates generated in our total isolate collection versus their average abundance in the bulk feces (Fig. 2f), which appeared to be positively correlated. Still, we identified a set of abundant yet difficult-to-culture bacteria, including Faecalibacterium ASV-58, Prevatella ASV-470 and ASV-324, Oscillibacter ASV-215 and Clostridium XlVa ASV-287 (Fig. 2g). Interestingly, Faecalibacterium ASV-58, from which we obtained one isolate and performed WGS, matched with >98% genome-wide average nucleotide identity (ANI) to the metagenome-assembled genome (MAG) of Candidatus cibiobacter qucibialis. This strain in our collection was previously reported as the most abundant uncultured species in human gut25 and is highly depleted in inflammatory bowel disease (IBD) patients, as are other Faecalibacterium strains26./p>3% relative abundance on average in the bulk fecal matter, which further expands the collection of culturable gut microbiomes. Together, these results highlight cultured isolates and the remaining missing diversity based on our current media and growth conditions, and offer directions to guide future culturomics efforts focused on these ‘dark matter’ gut microbiome (Supplementary Table 6)./p> Bacteroides > Dorea), reflecting differences in their growth characteristics. On the other hand, colonies of Faecalibacterium are smaller and fainter, in line with our earlier results of their poor culturability. Furthermore, colony morphologies are significantly clustered according to their phylogeny (P = 0.008 by PERMANOVA test in Fig. 3c). For instance, most genera of Clostridia are closer to each other by morphology-based ordination (Fig. 3c). Therefore, colony morphologies may embed a substantial amount of information that could be linked to taxonomic identities./p>2 kb in length (Methods). Consistent with recent reports38,39, we observed that HGT events were strongly linked to the phylogeny of the isolates, that is, most HGT events occurred within the same phyla but were also quite prevalent across different families and between distinct species (Fig. 5c and Supplementary Table 10). Interestingly, we observed that HGTs were predominantly enriched between isolates with the same Gram staining, with Gram-negative species showing more prevalent HGTs than Gram-positive species (P = 0.0005 by Pearson's chi-squared test). This result is consistent with recent finding39 and suggests that different cell wall structures may play an important role in HGTs. Notably, HGTs between Gram-positive and -negative species were also observed in our dataset, inspiring future studies to study the effect of cell wall structures on HGTs and engineer these HGT elements into a microbiome editing tool. Next, to examine whether these HGTs occurred recently, we calculated the mean HGT frequency between all species pairs (Methods). We hypothesized that if HGTs occurred recently between two species, they would be only associated with a small proportion of isolates, resulting in a low frequency between species, while if HGTs occurred earlier and provided growth benefits, they would be enriched and vertically inherited by later generation, resulting in a high frequency. Interestingly, we found most HGT elements were frequently present across isolates (71.5% HGTs with >50% frequency), especially for ones within Bacteroidaceae species (Fig. 5c), suggesting that they occurred in the distant past and were enriched under strong selection within the gut environment./p>80% of all microbiota by abundance present. This isolate collection covers a majority of microbial diversity in the healthy gut and is one of the most extensive personalized isolate biobanks described to date. Using this resource, we demonstrated that quantitative analysis of colony morphologies can predict taxonomy, enhance the isolation of targeted genera and reveal potential interactions between microbes. Systematic analysis of genomic differences between isolates within and across people revealed interesting patterns of population selection, adaptation and HGT./p>100 isolates across all 20 individuals) were subjected to model training and testing. Considering the potential impact of antibiotics perturbation and neighbor colonies, a multilabel random forest model was trained on 70% of isolates, which was randomly sampled using 14 colony morphological features, antibiotics condition and number of nearby colonies, and the performance (precision and recall) of the model was evaluated on the remaining 30% of isolates. The procedure of model training and evaluating was bootstrapped 20 times with different randomization settings to minimize bias, and the background performance of the model was calculated by null model (prediction based on the number of isolates). To perform targeted microbial isolation, a multilabel random forest model was trained on colonies of data-rich genus (>15 isolates from the same individual) from individuals H12, H13 and H14 separately as described above. The same fecal samples were then plated out and the model was applied to the new plates after bacterial growth to screen all colonies on plates and predict colonies of targeted genus-level taxonomy. All colonies of the plates were then isolated on CAMII and subjected to 16S V4 sequencing to identify their taxonomy and evaluate the performance of targeted isolation./p> 20×; N50 > 5,000 bp; completeness > 80%; contamination < 5%) and used for downstream genomic variation and HGT analysis. To identify strain-level genomic variation of gut microbiota isolates within and between individuals, draft assemblies with the highest completeness and N50 of each species were selected as the reference genomes for reads alignment, and processed Illumina reads of isolates were aligned to reference genomes of the same species by Bowtie2 v2.3.4 (ref. 55) in paired-end mode with ‘--very-sensitive’ setting. Resulting reads alignments were then processed by SAMtools v1.9 and BCFtools v1.9 (ref. 56) with ‘--ploidy 1’ setting to call genomic variation (SNPs and Indels). Resulting variations were then subjected to quality filtering to identify ‘reliable’ genotypes (covered by ≥5 reads; with ≥0.9 haploidy) and only SNP variations with more than 90% ‘reliable’ genotypes across all isolates were used for downstream analysis. To construct SNP-based phylogeny, base profiles of isolates at SNP sites were concatenated together and UPGMA tree was then calculated by MEGA v11.0.11 with the default setting./p>95% ANI were considered to be the same species./p>20 and query coverage >50. Secretion systems were also predicted on CDS of HGT elements by EffectiveDB62 with the default setting./p>