ISME Communications volume 3, Numéro d'article : 85 (2023) Citer cet article
Accès 2012
Détails des métriques
Comprendre la variation génomique bactérienne liée à des environnements distincts peut fournir de nouvelles informations sur les mécanismes sous-jacents à l'adaptation différentielle et à la transmission des microbes à travers les environnements. Obtenir de telles informations est particulièrement crucial pour les agents pathogènes, car cela profite à la surveillance de la santé publique. Cependant, la compréhension de la variation génomique bactérienne est limitée par le manque d’investigations sur la variation génomique associée à des contextes écologiques différents. Pour remédier à cette limitation, nous nous sommes concentrés sur Listeria, un genre bactérien important pour la sécurité alimentaire qui comprend le pathogène humain L. monocytogenes, et avons analysé un ensemble de données génomiques à grande échelle que nous avons collectées dans des environnements naturels et associés à l'alimentation à travers les États-Unis. Grâce à des analyses génomiques comparatives sur 449 isolats du sol et 390 isolats provenant des eaux agricoles et des installations de transformation des produits représentant L. monocytogenes, L. seeligeri, L. innocua et L. welshimeri, nous constatons que les profils génomiques diffèrent fortement selon les environnements au sein de chaque espèces. Ceci est corroboré par les sous-clades associées à l'environnement et par la présence différentielle de plasmides, d'îlots de stress et de gènes accessoires impliqués dans la biogenèse de l'enveloppe cellulaire, le transport et le métabolisme des glucides. Les génomes centraux des espèces de Listeria sont également fortement associés aux environnements et peuvent prédire avec précision les sources d’isolement au niveau de la lignée chez L. monocytogenes grâce à l’apprentissage automatique. Nous constatons que la grande variation génomique associée à l'environnement chez Listeria semble être déterminée conjointement par la propriété du sol, le climat, l'utilisation des terres et les espèces bactériennes qui l'accompagnent, représentant principalement les actinobactéries et les protéobactéries. Collectivement, nos données suggèrent que les populations d'espèces de Listeria se sont génétiquement adaptées à différents environnements, ce qui peut limiter leur transmission des environnements naturels aux environnements associés à l'alimentation.
Les génomes bactériens, y compris les génomes centraux (gènes présents chez tous les individus) et les génomes accessoires (gènes non partagés par tous les individus), peuvent être très polyvalents au sein des espèces en raison du gain et de la perte de gènes et de la recombinaison homologue médiée par la sélection et la dispersion environnementales [1, 2,3,4]. Une telle variation génomique permet aux espèces bactériennes (principalement des bactéries non pathogènes) de vivre dans un large éventail de dimensions écologiques, y compris des conditions environnementales avec différentes sources de carbone et de nutriments inorganiques [5]. Bien que certains agents pathogènes humains (par exemple Bacillus anthracis, Clostridium spp., Listeria monocytogenes, Yersinia pestis, Burkholderia pseudomallei et Francisella tularensis) puissent également survivre dans les environnements naturels [6], notre compréhension de leur variation génomique dans différents environnements est limitée en raison de un manque d'investigations intensives dans les environnements naturels par rapport aux environnements associés à l'homme [7,8,9]. Il s’agit d’une occasion manquée d’améliorer la compréhension des mécanismes écologiques sous-jacents à l’adaptation des agents pathogènes à des environnements non humains et de mieux éclairer la surveillance de la santé publique pour les maladies infectieuses, par exemple en déduisant la probabilité que les souches se transmettent des environnements naturels aux environnements associés à l’homme. .
Listeria, un genre bactérien Gram positif, anaérobie facultatif et non sporulé, essentiel à la sécurité alimentaire, constitue l'occasion d'étudier la variation génomique entre les environnements naturels et associés à l'homme chez les bactéries importantes pour la santé publique. Les membres de Listeria sont largement répartis dans les environnements naturels ainsi que dans les sols agricoles, l'eau et les installations de transformation des aliments [10, 11, 12]. Deux espèces de Listeria : L. monocytogenes et L. ivanovii sont considérés comme des agents pathogènes facultatifs. Alors que d'autres espèces ne sont pas pathogènes [13], ces espèces (par exemple, L. seeligeri, L. innocua et L. welshimeri) sont souvent testées dans l'industrie alimentaire car elles sont considérées comme une preuve de conditions susceptibles de faciliter la contamination par L. monocytogenes. [14, 15]. L'étude de la variation génomique des espèces de Listeria peut ainsi fournir un aperçu de sa transmission des environnements naturels aux environnements et aliments associés à l'alimentation, ce qui est particulièrement important pour les produits alimentaires tels que les produits frais, où des étapes de non-élimination sont utilisées pour inactiver les agents pathogènes qui seraient introduit à n’importe quel stade de la chaîne alimentaire.
0.8 and no premature stop codon was present, (ii) putative non-functional when 0.3 ≤ coverage <0.8 or premature stop codon was present, and iii) absent when no hits were observed in BLASTN or coverage was <0.3. A coverage of 0.3 and 0.8 was chosen as the cutoffs because (i) the multi-domain structure of proteins is most likely preserved when using a coverage of 0.8 [33], and (ii) at least 0.3 or less query coverage has been recommended to identify genes that span contigs and/or touch gaps [34]. When calculating the presence/prevalence of a given gene across genomes, only putative functional genes are included in the calculation./p>0.2 or <−0.2 with each Listeria taxon were defined as bacterial taxa that tend to have similar and dissimilar habitat preferences, respectively; these species were included in the co-occurrence network analysis. Networks of co-occurring bacterial species for each Listeria taxon were constructed using ggraph in R 3.6.0./p>70% are indicated by gray circles on the bifurcation nodes. The tree was rooted by the midpoint. Branches are color-coded by L. monocytogenes lineages. The tree is annotated by the presence/absence of virulence genes. The presence/absence gene matrices from the inner to the outer represent (i) genes located in the pathogenicity islands LIPI-1 (prfA, plcA, hly, mpl, actA, plcB), (ii) genes coding for internalins (inlABCEFGHJKIP), and (iii) genes located in the pathogenicity islands LIPI-3 (llsAGHXBYDP) and LIPI-4 (LM9005581_70009 to LM9005581_70014). A filled box represents the presence of a putative functional gene; an empty box represents a non-functional gene (i.e., being truncated or having premature stop codons); and a white box represents the absence of the gene. b Histograms showing the distribution of cgMLST allelic mismatches between isolates from soil and produce processing facilities (food plant) for L. monocytogenes (LM) lineage I (red), II (blue), and III (yellow). c ROC and PR curves for binary classifiers trained on cgMLST allelic profiles of LM lineage I, II, and III isolates. auROC: area under the curve of the receiver operating characteristic, auPR: area under the curve of precision-recall. Maximum likelihood phylogenetic tree of (d) L. innocua, (e) L. welshimeri, and (f) L. seeligeri based on the core SNPs of isolates of each species; isolates were obtained from soil, agricultural (ag.) water, and produce processing facilities (“food plant”). Trees were constructed based on 1000 bootstrap repetitions and were rooted by midpoint. Labels of isolates are color-coded by sources. Bootstrap values >70% are indicated by gray circles on the bifurcation nodes./p>2 (black dashed line) indicates that the COG category is significantly enriched (P < 0.05). The size of the circle is in proportion to the logarithm of the number of genes annotated as one COG category./p> 0.5; Fig. S8, Table S11). Many of these plasmid-correlated genes were annotated with functions involved in replication, such as resolvase and recombinase, and a few were involved in metal resistance (e.g., arsenic resistance operon repressor) (Table S11). Of note, a total of nine plasmid groups were detected, including rep13, rep25, rep26, rep32, rep33, rep35, rep7a, repUS25, and repUS43. To infer potential horizontal transfer of plasmids across environments and across species, we constructed a gene tree for each of the four plasmid groups that harbored by more than three genomes (rep25, rep26, repUS25, and repUS43). We found that the largest plasmid group, repUS25, was predominately present in soil isolates (81% out of 84 isolates) and exhibited two major clades with a mixture of isolates from both soil and food-associated environments and all four species, L. monocytogenes, L. seeligeri, L. welshimeri, and L. innocua (Fig. 3c). The plasmid group repUS43 was predominately present in isolates from food-associated environments (91% out of 11 isolates) and was exclusively detected in L. innocua (Fig. 3d). The plasmid group rep25 was also predominately present in isolates from food-associated environment (97% out of 29 isolates) and exhibit two major clades with a mixture of L. innocua and L. monocytogenes lineage II isolates (Fig. 3e). The plasmid group rep26 was exclusively found in isolates from food processing facilities and formed two major clades, one with L. welshimeri and L. inncoua isolates and the other with L. monocytogenes lineage II and L. welshimeri (Fig. 3f). These results suggest that plasmid groups are strongly associated with isolation sources and some plasmids (e.g., repUS25, rep25) may transfer across environments and species in Listeria./p>20% impervious cover. b Variable importance in predicting the ANI of isolates for LM, LM lineage II, L. seeligeri, and L. innocua based on % Inc MSE index in a random forest model. Abiotic variables on the y-axis are sorted in ascending order based on the median % Inc MSE value of 1000 repetitions. “spatial” indicates geographic distance. Minimum and maximum values are depicted by short vertical lines of whiskers; the box signifies the upper and lower quartiles, and the short line within the box signifies the median. Points above and below the whiskers indicate outliers. Boxes and whiskers are color-coded by ecological variable groups. c Network of co-occurring bacterial species and LM, L. seeligeri, L. innocua, and L. welshimeri. Each node stands for a bacterial species that had a Phi correlation coefficient (r) > 0.2 or < −0.2 with one Listeria species. Nodes representing Listeria species are in black (these data are based on culture data generated, not 16 S amplicon sequencing data), and other nodes representing co-occurring bacterial species are color-coded by phylum. An edge stands for the Phi correlation with an r > 0.2 or < −0.2 between the two nodes. The thickness of the edge is in proportion to the absolute value of the Phi correlation r. An orange edge represents a positive correlation, while a gray edge represents a negative correlation./p> 0.2; Table S13). A large proportion of the species positively correlated with L. monocytogenes and L. innocua (41% and 50%, respectively) was classified into the phylum Proteobacteria, including the families Hyphomicrobiaceae and Rickettsiaceae; 29% of the species positively correlated with L. seeligeri were classified into the phylum Planctomycetes, including the family Pirellulaceae; and 33% of the species positively correlated with L. welshimeri were classified into the phylum Actinobacteria, including the family Pseudonocardiaceae (Fig. 4c, Table S13). These positively correlated species may occupy similar habitats as these Listeria species./p> 0.2 and r < −0.2, respectively; Fig. S10, Table S13). These negatively correlated bacterial species may prefer different or distinct habitats than these Listeria taxa. In summary, we propose that certain Proteobacteria and Actinobacteria species are taxa of interest that might pose selective pressures on Listeria and contribute to its genome evolution in the soil environment./p>