banner
Centre d'Information
Une maîtrise exceptionnelle de leur métier.

Masques de rediploïdisation indépendants partageant la duplication du génome entier chez l'esturgeon

Jun 13, 2023

Nature Communications volume 14, Numéro d'article : 2879 (2023) Citer cet article

2397 accès

81 Altmétrique

Détails des métriques

La duplication du génome entier (WGD) est un événement évolutif dramatique générant de nombreux nouveaux gènes et qui peut jouer un rôle dans la survie lors d'extinctions massives. Le spatulaire et l'esturgeon sont des lignées sœurs qui présentent toutes deux des preuves génomiques de l'ancienne WGD. Jusqu'à présent, cela a été interprété comme deux événements WGD indépendants en raison d'une prépondérance de gènes en double avec des histoires indépendantes. Ici, nous montrons que bien qu'il existe en effet une pluralité de duplications de gènes apparemment indépendantes, celles-ci dérivent d'un événement de duplication de génome partagé qui s'est produit il y a plus de 200 millions d'années, probablement près de la période d'extinction de masse du Permien-Trias. Cela a été suivi d'un processus prolongé de retour à un héritage diploïde stable (rediploïdisation), qui peut avoir favorisé la survie pendant l'extinction massive du Trias-Jurassique. Nous montrons que le partage de ce WGD est masqué par le fait que la divergence des lignées des spatulaires et des esturgeons s'est produite avant que la rediploïdisation n'ait progressé même à mi-chemin. Ainsi, pour la plupart des gènes, la résolution de la diploïdie était spécifique à la lignée. Parce que les gènes ne sont vraiment dupliqués qu'une fois l'héritage diploïde établi, les génomes du polyodlon et de l'esturgeon sont donc une mosaïque de duplications de gènes partagées et non partagées résultant d'un événement de duplication de génome partagé.

D'anciens événements WGD se sont produits dans l'arbre de la vie et sont particulièrement bien étudiés chez les plantes1,2,3,4, les levures5,6 et les vertébrés7,8,9,10,11,12,13,14,15,16,17 ,18. On suppose souvent que ces événements ont facilité le succès de l'évolution grâce à la fourniture de matériel génétique brut pour l'innovation phénotypique et la diversification des espèces1,19,20,21,22,23. Un processus évolutif clé après WGD est la rediploïdisation - la transition d'un génome polyploïde, généralement tétraploïde, vers un état diploïde plus stable1,7,9,14,22,23,24,25. Fait important dans ce contexte, les événements WGD sont dérivés soit de l'hybridation de deux espèces parentales différentes (allopolyploïdisation), soit du doublement du même génome au niveau intra-espèce/individuel (autopolyploïdisation), chacun avec des résultats cytogénétiques distincts. Classiquement, les chromosomes non homologues des nouveaux allopolyploïdes s'apparient préférentiellement de manière bivalente lors de la méiose, alors que les quatre chromosomes homologues des nouveaux autopolyploïdes prennent une formation multivalente1,9,14,22,24. Il en résulte une recombinaison homologue continue, et donc une conversion et une homogénéisation des gènes, à travers les quatre copies alléliques à chaque locus. La suppression de la recombinaison, probablement obtenue par des réarrangements chromosomiques et d'autres mutations, est une étape nécessaire pour rediploïdiser ces gènes en deux loci ohnolog distincts (bivalents) (gènes en double dérivés de WGD) à partir d'allèles tétraploïdes. Ce n'est qu'alors qu'une séquence ininterrompue et une divergence fonctionnelle peuvent se produire entre les paires d'ohnologues24. Le processus de rediploïdisation découple ainsi le processus de duplication du génome du processus de duplication de gènes chez les autopolyploïdes, car ce n'est qu'une fois la rediploïdisation survenue que le locus peut être considéré comme dupliqué.

Des preuves substantielles issues d'études sur les salmonidés ancestraux WGD18,24,26 et les téléostéens ancestraux WGD13,27,28 indiquent que la rediploïdisation autopolyploïde peut être prolongée dans le temps, se produisant de manière asynchrone à travers le génome sur des dizaines de millions d'années13,18,24,26 ,27,28. Des implications majeures découlent du retard qui l'accompagne dans tout processus évolutif qui dépend de la divergence génétique ohnolog24. Ceux-ci incluent des modèles bien établis d'évolution fonctionnelle après duplication de gènes, par exemple une sous-/néo-fonctionnalisation29,30, et des modèles d'isolement reproductif impliquant une perte réciproque d'ohnologues dans des lignées sœurs31. De plus, si la spéciation se produit avant la fin de la rediploïdisation dans les lignées descendantes du même WGD, la rediploïdisation peut se produire indépendamment dans ces lignées filles (rediploïdisation spécifique à la lignée) dans certaines régions génomiques24. Cela permet à son tour aux paires d'ohnologues d'évoluer indépendamment dans des trajectoires réglementaires et fonctionnelles divergentes dans chaque lignée, potentiellement en réponse à des pressions sélectives spécifiques à la lignée24. Les Ohnologs avec cette histoire ont été décrits comme suivant le modèle LORe (Lineage-specific Ohnolog Resolution)24.

Bien que noté comme un processus évolutif potentiellement important après plusieurs WGD4, 8, 12, 24, 27, 32, 33, 34, il reste difficile de savoir si la rediploïdisation asynchrone et spécifique à la lignée est une caractéristique générale après le WGD autopolyploïde en dehors du clade des téléostéens. Les dernières années ont vu la génération de génomes de référence de haute qualité à partir de plusieurs lignées de poissons à nageoires rayonnées non téléostéens7,8,35,36, qui partagent les deux anciennes séries de WGD communes à tous les vertébrés à mâchoires9,11,37, mais n'ont pas l'événement WGD spécifique aux téléostéens7,8,35,36,38,39. Ces espèces ont généralement des génomes à évolution lente, permettant une inférence plus fiable de l'état ancestral des vertébrés osseux que les téléostéens, tout en fournissant des groupes externes pour comprendre l'impact de l'événement WGD spécifique aux téléostéens7,8,35,36,39. Parmi ces génomes nouvellement disponibles figurent des assemblages à l'échelle des chromosomes pour l'esturgeon sterlet (Acipenser ruthenus)7 et le polyodon américain (Polyodon spathula)8, qui ont chacun connu une WGD au cours de leur histoire évolutive.

Plusieurs événements WGD se sont produits au cours de l'évolution de l'esturgeon, mais un seul, que l'on pense être partagé par tous les esturgeons, est présent dans l'histoire de l'esturgeon sterlet7,40,41,42. D'autre part, le spatulaire américain est le seul spatulaire existant43, et il est suggéré qu'il ait subi un seul événement WGD8,35,44,45,46. Bien qu'il s'agisse de lignées sœurs, représentant ensemble les Acipenseriformes existants, les analyses précédentes ont systématiquement rejeté un WGD ancestral partagé en faveur d'événements WGD indépendants (Fig. 1) 8, 35, 38, 44, 45. Les efforts déployés à ce jour pour ces WGD ont produit des résultats incongrus, avec des estimations allant de 21,3 Ma38, 51 Ma35 et 180 Ma7 pour l'esturgeon WGD, et 41,7 Ma44, ~50 Ma8 et 121 Ma35 pour le paddlefish WGD. Bien que certains auteurs aient suggéré que la rediploïdisation asynchrone puisse contribuer à l'incongruité observée entre les études8,44, ce processus a été ignoré lors de la datation de ces WGD. En outre, le potentiel de rediploïdisation spécifique à la lignée à l'échelle du génome (par exemple 13, 24, 26) pour masquer un événement WGD partagé n'a jamais été formellement proposé ou testé dans aucune lignée.

Le scénario 1 est l'hypothèse largement acceptée d'événements WGD indépendants dans les lignées d'esturgeons et de polyodons. Le scénario 2 est un WGD ancestral partagé avec une rediploïdisation complète avant la divergence de la lignée. Le scénario 3 étend le scénario 2 en considérant la possibilité que la spéciation se produise pendant un processus de rediploïdisation asynchrone prolongé suite à un événement WGD partagé. Dans ce cas, les gènes se rediploïdisant avant la spéciation suivront l'arbre génétique attendu dans le scénario 2, tandis que ceux qui se rediploïdisant après la spéciation (c'est-à-dire la rediploïdisation spécifique à la lignée) suivront l'arbre génétique attendu dans le scénario 1. Cela se distingue de la duplication indépendante à petite échelle en utilisant le on s'attend à ce que les paires d'ohnologues conservent largement la colinéarité ancestrale entre les régions chromosomiques en double non chevauchantes. Les événements de rediploïdisation et les arbres génétiques associés après la spéciation esturgeon-spadon sont représentés en rouge, ceux qui précèdent la spéciation sont représentés en bleu.

Ici, en adoptant une approche phylogénomique, nous reconsidérons le moment des WGD (s) par rapport à la divergence esturgeon-spaddlefish, en tenant compte de la possibilité d'une rediploïdisation spécifique à la lignée après une WGD partagée. En prenant soin de distinguer nos résultats de l'erreur phylogénétique et en nous appuyant sur la synténie conservée, nous fournissons des preuves solides d'une seule autopolyploïdie ancestrale se produisant à proximité de l'événement d'extinction du Permien-Trias. Cela a été suivi d'une rediploïdisation étendue spécifique à la lignée, résultant du fait que le génome acipenseriforme ancestral restait principalement tétraploïde au moment de la divergence esturgeon-spatule, une condition génomique qui peut avoir favorisé la survie de la lignée à travers l'extinction massive du Trias-Jurassique.

Des études antérieures évaluant le moment des WGD (s) dans l'histoire acipenseriforme ont recherché un temps de divergence ohnolog consensuel unique par rapport à la spéciation8,35,44. Cette approche considère deux scénarios comme plausibles : (1) si une pluralité d'arbres génétiques ohnologues récupèrent des nœuds de duplication indépendants après la divergence esturgeon-spatulaire, alors les esturgeons et les polyodons sont supposés avoir subi des WGD indépendants (hypothèse actuellement acceptée) (Fig. 1, Scénario 1); et (2) si une pluralité d'arbres génétiques ohnologues montrent des nœuds de duplication antérieurs à la divergence esturgeon-spadon, alors un seul événement WGD ancestral peut être supposé (hypothèse généralement rejetée) (Fig. 1, Scénario 2). Ces interprétations supposent implicitement que tous les ohnologues partagent le même moment de rediploïdisation. Ici, nous considérons un troisième scénario plausible, comme observé précédemment après les événements ancestraux de WGD des salmonidés et des téléostéens13,18,24,26 : (3) un WGD partagé suivi d'un processus de rediploïdisation prolongé qui commence avant mais se poursuit après la spéciation. Cela prédit la présence de deux sous-ensembles distincts d'arbres à gènes ohnologues, l'un avec des nœuds de duplication avant la divergence esturgeon-spaddlefish et l'autre avec des nœuds de duplication indépendants après la spéciation (Fig. 1, Scénario 3).

Pour faire la distinction entre ces scénarios, nous nous sommes appuyés sur un ensemble d'ohnologues de haute confiance précédemment identifiés dans le génome de l'esturgeon7, intégrant de nombreuses preuves phylogénétiques et synténiques supplémentaires. Plus précisément, nous avons incorporé un large échantillonnage de protéomes prédits à partir de génomes de vertébrés à mâchoires, y compris de poissons à nageoires rayonnées non téléostéens nouvellement disponibles. Cela nous a permis de définir 5 439 familles de gènes codant pour des protéines contenant des paires d'ohnologues à haut niveau de confiance chez l'esturgeon et le spatulaire. En analysant les arbres génétiques à vraisemblance maximale pour chaque famille, nous avons constaté que l'arbre génétique abritant des nœuds de duplication indépendants était la topologie la plus courante (ci-après : "PostSpec", pour le nœud de duplication Post-Spéciation, comme dans le scénario 1 et le scénario 3 à droite), en cours de récupération. 2074 fois (38,13 % de tous les arbres ; Fig. 2A). La topologie de paire ohnolog alternative avec un nœud de duplication partagé ("PreSpec" pour la pré-spéciation, comme dans le scénario 2 et le scénario 3-milieu) a été récupérée 1448 fois (26, 62% de tous les arbres; Fig. 2A). Les arbres génétiques restants (1917, 35,25 % ; "Autre" pour les topologies autres que PostSpec ou PreSpec) n'ont pas réussi à récupérer l'une ou l'autre de ces topologies.

Une catégorisation des 15 sous-arbres possibles d'esturgeons et de spatulaires enracinés avec des nœuds de duplication venant avant ('PreSpec') ou après ('PostSpec') ces espèces ont divergé, et des arbres 'Autres' qui ne correspondent que partiellement à l'un de ces scénarios (soit, 'PreSpec -like' ou 'PostSpec-like'). Le graphique à secteurs quantifie la fréquence relative à laquelle chaque topologie a été récupérée. B Trois sous-arbres possibles d'esturgeons et de spatulaires non enracinés (deux de type « PreSpec », à gauche ; et un « de type PostSpec », au centre), et un test d'environ unbiased (AU) (à droite) de la fiabilité de l'arbre pour déterminer la fréquence à laquelle les ensembles de données de chaque La catégorie de sous-arbre enraciné décrite dans la partie (A) peut rejeter de manière décisive un type de catégorie de topologie non enracinée donné et ainsi favoriser l'autre. C Catégorie de topologie de sous-arbre enraciné (décomposée au niveau 'Autre', 'PostSpec', 'PreSpec') nombre (en haut à gauche), pourcentage (en haut à droite) et écart de pli du nombre d'arbres par catégorie par rapport aux attentes aléatoires (c. si chacun des 15 arbres enracinés a été récupéré à fréquence égale ; en bas) sous des seuils de pourcentage UFBoot de plus en plus stricts, de sorte que les deux pourcentages UFBoot dans un sous-arbre donné doivent être supérieurs ou égaux au seuil pour que cet arbre soit conservé. D Pourcentage d'arbres correspondant à chaque sous-catégorie d'esturgeons et de spatulaires qui recouvrent d'autres clades clés incontestés. E Résumé des différences significatives entre l'alignement des séquences, la modélisation et les statistiques basées sur les arbres pour chaque catégorie de sous-arbres (la Fig. 1 supplémentaire fournit des diagrammes en violon/boîte avec des valeurs p). Les données source sont fournies sous la forme d'un fichier de données source. Les alignements bruts, les arbres génétiques et le code d'analyse des arbres génétiques sont fournis sur figshare106.

La récupération fréquente de la topologie PostSpec explique probablement pourquoi des études antérieures ont déduit que les esturgeons et les spatulaires ont subi des WGD indépendants8,35,38,44,45 (Scénario 1 ; Fig. 1), mais la prévalence élevée de la topologie PreSpec et des topologies « Autres » dans nos analyses nécessite une explication. Premièrement, la récupération fréquente des topologies PreSpec et PostSpec est cohérente avec un WGD partagé suivi d'une rediploïdisation prolongée s'étendant au-delà de la spéciation esturgeon-spaddlefish (scénario 3; Fig. 1). Dans ce cas, les topologies PreSpec et PostSpec correspondent directement aux modèles de résolution ohnolog ancestraux et spécifiques à la lignée (appelés « AORe » et « LORe ») précédemment décrits chez les salmonidés24. Cependant, étant donné la forte proportion de topologies «autres» inférées, il est important de déterminer si la variabilité des estimations du temps de divergence ohnolog est affectée par une erreur phylogénétique. De même, malgré nos efforts pour définir un ensemble d'ohnologs de haute confiance, il est également important de s'assurer que les événements de duplication à petite échelle ne conduisent pas à la récupération des topologies PreSpec ou PostSpec.

Pour déterminer l'impact possible de l'erreur phylogénétique sur nos résultats, nous avons pris en compte les facteurs susceptibles d'avoir influencé les topologies arborescentes initiales récupérées. Le modèle de ramification critique informant nos hypothèses concurrentes est le clade de chaque arbre généalogique de gènes enracinés comprenant les paires d'ohnologues de polyodons et d'esturgeons (c'est-à-dire un sous-arbre à quatre gènes). Tout d'abord, nous avons considéré la récupération de trois grandes catégories de topologie (PostSpec, PreSpec, «Autre»; Fig. 2A) à la lumière des 15 topologies enracinées possibles qu'un arbre à quatre taxons peut prendre. L'une de ces 15 topologies correspond à PostSpec, deux à PreSpec et les 12 autres à des topologies "Autres" (Fig. 2A). Cependant, ces topologies 'Autres' rentrent naturellement dans deux catégories ; "PostSpec-like" et "PreSpec-like", dont chacun a été récupéré à une fréquence correspondant à sa topologie principale la plus proche (c'est-à-dire PostSpec/PreSpec), et ne nécessite qu'un seul changement de branche (ce qui pourrait s'expliquer par un changement mineur erreur d'inférence) à récupérer en tant que PostSpec ou PreSpec, respectivement (Fig. 2A). De plus, ces différences topologiques mineures seraient impossibles à distinguer de leur topologie principale la plus proche (PostSpec / PreSpec) si les arbres n'étaient pas enracinés (Fig. 2A, B). Les topologies PostSpec et PreSpec, mais pas les topologies "Autres", sont récupérées plus fréquemment que ce à quoi on pourrait s'attendre par hasard (c'est-à-dire en supposant une chance sur 15 pour une topologie donnée ; Fig. 2A). Cela indique un signal fort pour PreSpec et/ou PostSpec mais pas pour les topologies "Autres".

Pour confirmer la force du signal prenant en charge chaque topologie, nous avons effectué des tests d'approximation sans biais (AU) non enracinés47 sur les sous-arbres de paires d'ohnologues d'esturgeons et de spatulaires, en tenant compte des trois topologies non enracinées possibles d'un arbre à quatre taxons ; un type PostSpec (l'équivalent sans racine de PostSpec et de type PostSpec) et deux types de PreSpec (l'équivalent sans racine de PreSpec et de type PreSpec) (Fig. 2B). Les résultats indiquent que les paires ohnolog récupérant les topologies PostSpec et PreSpec enracinées sont plus robustes. Plus précisément, ils rejettent fréquemment le type de topologie alternative sans racine ; tandis que ceux qui ont récupéré les topologies "Autres" de type PostSpec et PreSpec enracinées rejettent moins fréquemment le type de topologie alternative non enracinée (Fig. 2B). Bien que les ensembles de données "Autres" de type PreSpec/PostSpec soient plus indécis, le type de topologie sans racine correspondant n'est presque jamais rejeté en faveur de la topologie alternative sans racine sur l'un des quatre ensembles de topologie enracinée (Fig. 2B). Plutôt qu'une topologie unique fournissant un consensus, ces résultats sont cohérents avec un support significatif pour les topologies PostSpec et PreSpec dans notre ensemble de données de paires ohnolog plus large, et avec la topologie «Autre», dérivée d'alignements de familles de gènes moins informatifs.

Comme test supplémentaire de la robustesse des arbres, nous avons évalué l'impact du filtrage des arbres sur la base de seuils de support de branche de plus en plus stricts (c. À mesure que la rigueur augmente, nous observons une baisse de toutes les topologies arborescentes (Fig. 2C). Cependant, cela est plus grave pour les topologies "Autres", qui sont rarement récupérées à haute stringence, étant récupérées plus de 40 fois moins souvent qu'au hasard au seuil le plus strict (UFBoot = 100%) (Fig. 2C). D'autre part, les topologies PostSpec et PreSpec ont été récupérées beaucoup plus souvent que prévu au hasard, quelle que soit la coupure UFBoot, la topologie PreSpec dépassant PostSpec en tant que topologie la plus fréquemment récupérée à UFBoot ≥ 95% (Fig. 2C). Cela confirme en outre un signal fort et non aléatoire pour les topologies PostSpec et PreSpec dans notre ensemble de données complet sur la famille de gènes de paires ohnolog.

Ensuite, pour déterminer si nous pouvons nous attendre à ce que la sous-clade esturgeon-pagaie soit récupérée avec précision, nous avons comparé la capacité des arbres génétiques supportant chaque topologie de paires ohnolog esturgeon-pagaie à récupérer d'autres clades bien acceptés49,50, c'est-à-dire les poissons cartilagineux, les tétrapodes. , téléostéens (Fig. 2D). Si un arbre génétique ne parvient pas à récupérer des clades connus et bien pris en charge, cela peut indiquer un signal phylogénétique généralement faible. Bien qu'aucune différence majeure n'ait été observée entre les trois catégories de topologie, les arbres PreSpec ont toujours obtenu les meilleurs résultats et «Autre» les pires (Fig. 2D).

Après avoir confirmé la robustesse du signal phylogénétique, nous avons cherché à tester si des erreurs systématiques pouvaient générer un signal cohérent et trompeur pour l'une ou l'autre des topologies PostSpec et PreSpec. Nous avons analysé une variété de statistiques51,52 aux niveaux de l'alignement des séquences, de la modélisation et de la topologie arborescente (Fig. 2E, Fig. 1 supplémentaire). Les `` autres '' topologies arborescentes dérivent d'alignements de séquences multiples plus courts avec moins de substitutions par site (c'est-à-dire une identité par paire moyenne plus élevée, un taux d'évolution plus lent et moins de sites informatifs variables et de parcimonie) que les topologies PostSpec ou PreSpec (Fig. 2E, Fig. 1 supplémentaire) . La combinaison de ces facteurs limite vraisemblablement le signal phylogénétique, conformément à l'idée que les topologies «autres» résultent d'erreurs phylogénétiques mineures faiblement étayées. Nous n'avons observé aucune différence significative entre les statistiques considérées entre les topologies PreSpec et PostSpec (Fig. 2E, Fig. 1 supplémentaire). Il est important de noter que, bien qu'ils aient plus de substitutions par site que les arbres "Autres", les ensembles de données PostSpec et PreSpec ne montrent pas de signes d'être plus sensibles aux erreurs systématiques, ayant un équilibre comparable de substitutions sur les branches d'arbres internes et externes (arborescence), et une composition similaire. niveaux de variabilité et de saturation substitutionnelle aux ensembles de données "Autres" (Fig. 2E, Fig. 1 supplémentaire)52,54,55. Enfin, les modèles hétérogènes de site peuvent aider à atténuer les artefacts de ramification induits par des erreurs systématiques dans l'analyse phylogénétique56. Tester leur utilisation sur toutes les familles de gènes qui avaient des valeurs de support maximales (UFBoot = 100%) au sein de la sous-clade de la paire ohnolog esturgeon-paddlefish n'a jamais entraîné de changement de topologie, tandis que les valeurs de support ne sont jamais tombées en dessous de UFBoot = 97% (Fig. 2 supplémentaire).

Ensemble, ces analyses indiquent que ni les topologies PostSpec ni PreSpec ne dérivent d'une erreur, ce qui indique un support solide et fiable pour les ohnologs divergeant à la fois avant et après la divergence esturgeon-paddlefish, tout en suggérant que les `` autres '' topologies d'arbres sont souvent le produit d'un signal phylogénétique relativement limité. .

Des milliers de gènes supplémentaires sont annotés dans le génome de l'esturgeon par rapport au spatulaire7,8,35. Pour évaluer l'impact de cela sur nos résultats, nous avons analysé l'ensemble des paires d'ohnologues d'esturgeons pour lesquelles un seul orthologue est annoté chez les polyodons. Dans ces arbres génétiques, le sous-arbre ohnolog esturgeon-paddlefish ne comprend que trois gènes. En tant que tel, il n'y a que trois topologies enracinées possibles : deux similaires à PreSpec et une à PostSpec (Fig. 3 supplémentaire). Nous les étiquetons 'PreSpec-type' et 'PostSpec-type' car il n'est pas possible d'exclure que ces arbres forment plutôt des topologies 'Autres' si une deuxième séquence de polyodons a été introduite.

Parmi ces gènes de polyodons apparemment à copie unique, il y a une plus grande proportion d'arbres de type PostSpec (1836 arbres, ~ 82%) à type PreSpec (397 arbres, ~ 18%) que récupéré pour les données principales ci-dessus (Fig. 3). Comme nos analyses précédentes semblent exclure un biais phylogénétique vers une topologie donnée, deux explications plausibles se présentent. Soit les ohnologues à rediploïdisation tardive ont une plus grande tendance à revenir au statut de singleton, soit certaines régions génomiques en double très similaires sont regroupées en une seule séquence d'assemblage. Les difficultés à distinguer ces régions de haute similarité de séquence ont été notées dans l'analyse du génome de l'esturgeon7, et le potentiel d'effondrement et de maintien de la tétraploïdie a été noté chez les salmonidés, en particulier pour l'ombre européen (Thymallus thymallus)26,57.

Si une petite proportion de locus de polyodons dupliqués subissent encore une hérédité tétrasomique ou sont regroupés de manière artificielle en un seul locus, cela devrait apparaître comme des régions avec deux fois la profondeur de séquençage par rapport au reste du génome. En effet, les lectures dérivées de deux emplacements génomiques distincts doivent correspondre aux régions effondrées26,57. Pour tester cela, nous avons examiné la distribution de la profondeur de lecture du séquençage du génome pour chaque gène de spatulaire au sein d'une paire d'ohnologues conservés, ainsi que l'examen séparé de la profondeur de lecture pour les gènes de spatulaire à copie unique avec des topologies de type PostSpec ou PreSpec (c'est-à-dire copier les loci des polyodons où l'esturgeon conserve les deux ohnologues).

Le pic de densité principal lors du traçage de la profondeur de lecture du séquençage par gène pour les ensembles de gènes à copie unique est comparable à chacun des gènes de la paire ohnolog du poisson-pagaie à deux copies. Cela implique que la perte de gènes chez les spatulaires, plutôt que le maintien de la tétraploïdie ou l'effondrement de l'assemblage, explique la plupart de ces cas (Fig. 3 supplémentaire). Cependant, nous trouvons un pic de double couverture plus petit, mais clair, pour les gènes de polyodons à copie unique. Cela représente une proportion nettement plus élevée de gènes de type PostSpec que de gènes à copie unique de type PreSpec (Fig. 3 supplémentaire). Ceci est cohérent avec l'attente selon laquelle les paires d'ohnologues rediploïdisées plus récemment (type PostSpec et PostSpec) auront la plus grande similarité de séquence et seront plus sujettes aux difficultés d'assemblage et aux artefacts.

On pense que le processus de rediploïdisation autopolyploïde implique de nombreux événements de réarrangement génomique physiquement indépendants à travers le génome24. En supposant que ces réarrangements ne se limitent pas à des gènes uniques et que les réarrangements ultérieurs ne sont pas étendus, de grands blocs de gènes voisins partageant des historiques de rediploïdisation communs devraient être visibles sous forme de blocs synténiques largement non chevauchants sur différents chromosomes et présents dans les deux lignées. Ce n'est pas sans rappeler l'histoire de la suppression de la recombinaison au cours de l'évolution des chromosomes sexuels des mammifères, où les réarrangements du génome sont associés à l'apparition de la divergence des locus sur X et Y et ont abouti à des strates contiguës de gènes qui partagent un temps de divergence XY14,58. Si nos résultats phylogénétiques proviennent d'un WGD partagé suivi d'une rediploïdisation prolongée couvrant à la fois les branches partagées et spécifiques à la lignée, de tels blocs de synténie stratifiés par divergence dans le temps devraient être très évidents, d'autant plus que les génomes acipenseriformes évoluent lentement et montrent une réorganisation limitée après WGD7 ,8,35.

Le traçage des paires d'ohnologues à l'intérieur et à travers les génomes de l'esturgeon et du spatulaire a révélé que les ohnologues des catégories PreSpec et PostSpec (Fig. 2) ne sont pas distribués au hasard le long du génome. Au lieu de cela, des paires d'ohnologues avec des dates de divergence partagées par rapport à la spéciation (PreSpec ou PostSpec) se trouvent dans des blocs synténiques le long de grandes sections ininterrompues de chromosomes (et peut-être même de petits chromosomes entiers) (Fig. 3). Par exemple, de longs blocs de synténie PreSpec sont conservés dans les deux génomes sur les six plus grands chromosomes (qui forment trois paires dérivées de WGD dans les deux espèces7,8 ; Fig. 3C), ce qui rend la duplication segmentaire à petite échelle avant la WGD spécifique à la lignée invraisemblable. explication de ces topologies, et en ajoutant un soutien supplémentaire à l'hypothèse selon laquelle elles reflètent un véritable signal évolutif provenant de WGD. Au total, ces observations sont expliquées avec parcimonie par une seule WGD ancestrale suivie d'une rediploïdisation ancestrale et spécifique à la lignée dans l'évolution des esturgeons et des polyodons.

Graphiques Circos du génome de l'esturgeon sterlet (A) et du génome du paddlefish américain (B) montrant les emplacements chromosomiques des paires d'ohnologues, avec des liens colorés selon la topologie de l'arbre PreSpec (bleu) ou PostSpec (rouge). Les microchromosomes <20 Mb ne sont pas marqués. C Graphique Circos des paires d'ohnologues dans les génomes de l'esturgeon et du polyodon, avec des liens PostSpec intra-spécifiques (rouge) et des liens PreSpec inter-spécifiques (bleu). Seuls les macrochromosomes > 40 Mb de chaque espèce sont marqués. Les données source sont fournies sous la forme d'un fichier de données source.

Ce résultat est valable même en examinant uniquement les macrochromosomes (> 40 Mb) (Fig. 4 supplémentaire) et pour les arbres ohnolog avec un support statistique progressivement plus strict (c'est-à-dire des scores de coupure UFBoot de ≥ 50%, ≥ 75% et 100%) ( Fig. 5 supplémentaire). Pendant ce temps, les arbres ohnolog de la catégorie "Autre" et des paires d'ohnolog d'esturgeon avec une seule séquence de polyodons, ont tendance à occuper des régions génomiques abritant des gènes avec la plus similaire des deux topologies principales (c'est-à-dire de type PreSpec et de type PreSpec aux côtés de PreSpec , et de type PostSpec et de type PostSpec aux côtés de PostSpec ; figures supplémentaires 3 et 6) comme prévu si ces topologies résultent principalement d'erreurs mineures.

La distribution des substitutions synonymes par site (Ks) entre les gènes paralogues au sein d'un génome est souvent appliquée comme base pour détecter les événements WGD et estimer leur synchronisation par rapport à la spéciation59,60,61. Ceci est généralement réalisé par une modélisation statistique et/ou une simple identification visuelle des pics de distribution dans les tracés Ks.

Lorsqu'une rediploïdisation asynchrone (y compris spécifique à la lignée) s'est produite, il s'ensuit naturellement qu'un fort pic unique de Ks ne peut pas être attendu - plutôt le signal des valeurs ohnolog Ks, dans la mesure où il peut être pris comme indicateur du temps, sera plutôt plus diffus entraînant un pic plus large et plus plat ou une série de pics faibles couvrant les valeurs de Ks tout au long de la période de rediploïdisation26.

Dans cet esprit, et pour explorer davantage les différences entre nos ensembles de données de topologie PreSpec, PostSpec et "Autre", nous avons calculé les valeurs Ks par paires pour les paires d'ohnologs spécifiques à l'espèce à partir des ensembles de données de type PreSpec, PostSpec et PreSpec et PostSpec, ainsi que tous ceux-ci combinés (lignes étiquetées "Tous" dans la Fig. 4). Nous avons également calculé les valeurs de Ks par paires pour deux ensembles de données de paires d'orthologues esturgeon-pagaie à des fins de comparaison - orthogroupes à copie unique et orthologues PreSpec. Nous récupérons une distinction claire entre les distributions Ks, les données de paires ohnolog PostSpec ayant le pic Ks le plus bas, les paires ohnolog PreSpec ayant le pic Ks le plus élevé et le pic ortholog Ks tombant entre ceux-ci (Fig. 4). Ce Ks plus élevé des ohnologs à rediploïdisation précoce (c'est-à-dire PreSpec) et Ks inférieur des ohnologs à rediploïdisation tardive (c'est-à-dire PostSpec), par rapport aux valeurs ortholog Ks, est cohérent avec nos prédictions et appuie davantage le scénario d'un WGD partagé suivi d'un asynchrone. processus de rediploïdisation.

Les densités de valeurs Ks de paires ohnolog spécifiques à l'espèce sont tracées pour chacune des quatre principales catégories de topologie (c'est-à-dire PostSpec, PreSpec, PostSpec-like et PreSpec-like) pour les données de paires ohnolog intra-espèces. À des fins de comparaison, nous avons également tracé deux ensembles de paires d'orthologues polyodons-esturgeon : (i) les orthogroupes à copie unique - séquences d'esturgeons et de polyodons présents dans les gènes à copie unique identifiés chez toutes les espèces par OrthoFinder, et (ii) les paires d'orthologues PreSpec - celles-ci dérivent de chaque ohnolog dans la topologie PreSpec de sorte qu'une seule topologie PreSpec contribue à deux paires d'orthologues dont la divergence correspond à la spéciation esturgeon-paddlefish. Les lignes verticales blanches divisent chaque distribution en quatre quantiles, et le nombre de valeurs Ks de la paire ohnolog/ortholog (n) sous-jacentes à chaque distribution est également affiché par jeu de données. Les valeurs Ks ≥ 0,3 ont été exclues, ainsi que les paires où une séquence codante a été signalée comme potentiellement problématique (par exemple, codon d'arrêt précoce) par l'outil logiciel wgd utilisé pour calculer les valeurs Ks. Les données source sont fournies sous la forme d'un fichier de données source.

Fait intéressant, les pics Ks des paires de type PostSpec et PreSpec se situent également entre les pics Ks des paires PostSpec et PreSpec, et sur un gradient avec le type PostSpec toujours plus proche de PostSpec et le type PreSpec toujours plus proche de PreSpec (Fig. 4) . Nous avons précédemment examiné si ces topologies «autres» pouvaient principalement provenir d'erreurs de branchement dues à un signal phylogénétique limité. Si, comme le suggère l'analyse Ks, ces paires de gènes divergeaient dans le temps près des événements de spéciation, alors nous anticiperions un signal phylogénétique limité pour distinguer les nœuds de spéciation et de duplication dans les sous-arbres de paires ohnolog, comme nous l'observons en effet pour les topologies "Autres" qui sont très rarement fortement soutenu (Fig. 2C).

Par comparaison avec les densités de Ks séparées par catégorie de topologie, nous avons trouvé des pics de densité de Ks plus larges et plus plats lors de l'analyse de toutes les paires d'ohnologues de chaque espèce, en particulier lorsqu'elles ne sont pas filtrées sur la base du support UFBoot (Fig. 4). Lors du filtrage pour un support UFBoot à 100%, une distribution bimodale claire peut être observée (Fig. 4), représentant probablement des résultats de rediploïdisation PreSpec et PostSpec fortement pris en charge. Ces résultats suivent nos attentes proposées pour les analyses de Ks sous rediploïdisation asynchrone, mais sont en contradiction avec les prédictions traditionnelles pour la détection et la synchronisation des événements WGD avec Ks. Dans ce contexte, nos résultats sont limités aux ensembles ohnolog plutôt qu'à tous les doublons, comme c'est généralement le cas lorsque de telles analyses sont effectuées, ce qui signifie que le signal serait probablement encore plus diffus dans un scénario de détection ab initio WGD.

Les pics Ks de la paire Ohnolog à des valeurs plus élevées (c'est-à-dire une plus grande divergence) sont systématiquement récupérés pour les polyodons que pour les esturgeons (Fig. 4). Cela peut indiquer un rythme plus rapide d'évolution de la séquence chez les spatulaires. Pour explorer cela, nous avons testé si les séquences de polyodons avaient en moyenne des longueurs de branche plus longues que leurs orthologues d'esturgeon dans les arbres génétiques PreSpec et Single-Copy Orthogroup et avons constaté qu'il y avait une différence significative pour les paires d'orthologues PreSpec uniquement (Fig. 7 supplémentaire). Cela suggère que le taux d'évolution de la séquence chez les polyodons peut être plus rapide que chez les esturgeons. Parallèlement à l'effondrement apparent de certaines régions ohnologues très similaires dans le génome du polyodon (ce qui réduirait artificiellement le nombre de paires d'ohnologues de polyodon avec de faibles valeurs de Ks), cela explique probablement la tendance à des valeurs de Ks plus élevées chez les polyodons.

Dans l'ensemble, ces résultats sont clairement cohérents avec une rediploïdisation asynchrone masquant un WGD ancestral partagé chez l'ancêtre esturgeon-spatule. De plus, ils indiquent que les approches reposant sur l'identification et la datation des événements WGD en détectant un seul pic Ks peuvent être compromises par des périodes de rediploïdisation prolongées.

La rediploïdisation asynchrone sépare temporellement la divergence ohnolog de la WGD, obscurcissant la datation des événements d'autopolyploïdie24,26,62. Notre arbre génétique et nos analyses de Ks suggèrent qu'il s'agit probablement d'un facteur majeur influençant la gamme disparate de dates précédemment proposées pour le WGD chez l'esturgeon et le spatulaire. Bien qu'imparfaite, l'estimation de la limite inférieure la plus fiable pour l'événement ancestral de WGD esturgeon-spatulaire peut être estimée à partir de paires d'ohnologues qui se sont rediploïdées avant la divergence esturgeon-spaddlefish, car celles-ci auront divergé plus près dans le temps de l'événement WGD62. Dans cet esprit, pour estimer une limite inférieure pour le WGD, nous avons adopté une approche phylogénomique bayésienne63 utilisant des paires d'ohnologues concaténées32,62 sur la base de l'ensemble de 81 arbres génétiques qui supportaient au maximum le WGD partagé et n'incluaient pas de doublons chez d'autres espèces. Nous avons analysé cinq ensembles de données distincts, comprenant toujours les 81 familles de gènes, mais mélangeant au hasard les ohnologues d'une paire pour une attribution arbitraire en tant que copie A ou B pour la concaténation, afin d'éviter les biais et d'évaluer la robustesse des résultats par rapport aux concaténations alternatives62. Nous avons analysé ces ensembles de données avec une horloge moléculaire relaxée autocorrélée64, et utilisé le modèle de substitution CAT-GTR hétérogène de site65, et envisagé deux stratégies d'étalonnage fossiles (Données supplémentaires 1). Le premier incorporant des preuves fossiles pour appliquer des étalonnages des limites supérieure et inférieure aux principales divergences entre les principales lignées de poissons à nageoires rayonnées, et le second laissant la plupart de ces divergences non calibrées étant donné la difficulté de placer phylogénétiquement d'importants fossiles de poissons à nageoires rayonnées du Paléozoïque (Données supplémentaires 1 , figure 5)66.

Les copies d'Ohnolog ont été classées au hasard comme (A ou B) et concaténées pour l'analyse phylogénomique. L'arbre temporel phylogénomique bayésien des vertébrés à mâchoires de l'une des cinq concaténations aléatoires est illustré (pour les cinq, voir les figures supplémentaires 8 et 9). Le CIR (intervalle de crédibilité) à 95 % est affiché pour chaque nœud en bleu. Les résultats du CIR à 95 % d'une analyse indépendante sous le prior sont affichés sous chaque nœud en rouge, ce qui vérifie que nos priors sur le temps de divergence WGD sont suffisamment diffus pour avoir évité de restreindre nos résultats au timing de la limite inférieure WGD inféré dans les analyses principales. Les calibrations fossiles des bornes supérieure et inférieure sont représentées par des triangles pour chaque divergence calibrée. Deux stratégies d'étalonnage ont été appliquées, la première (A) avec plus d'étalonnages de poissons à nageoires rayonnées (les triangles d'étalonnage avec remplissage blanc sont spécifiques à cette analyse) que la seconde (B), où une stratégie d'étalonnage détendue a été appliquée pour tenir compte de l'incertitude dans le placement phylogénétique de certains fossiles de poissons à nageoires rayonnées. Les analyses de concaténation aléatoire individuelles sont présentées dans les figures supplémentaires. 8 et 9. Les données sources, y compris les étalonnages et les résultats, sont fournies dans les données supplémentaires 1 et sur figshare106.

Dans le premier cas (c'est-à-dire incluant tous les étalonnages), nous déduisons un temps de divergence de ~171,6 Ma (moyenne moyenne des cinq concaténations aléatoires [AVG-5RC] ; plage d'intervalle de crédibilité à 95 % [CIR] : ~124,1–203,3 Ma) pour le séparation des esturgeons et des polyodons (c.-à-d. Acipenseriformes de la couronne ; compte tenu des deux paires d'ohnologues) (Données supplémentaires 1, Fig. 5A, Fig. 8 supplémentaires). Suite à la scission de Chondrostei (dont les esturgeons et les polyodons sont les seuls représentants vivants et forment les Acipenseriformes de la couronne) et les Neopterygii (c'est-à-dire les Actinopteri de la couronne) ~ 367,8 Ma (AVG-5RC ; 95 % CIR : ~ 360,6–374,8 Ma), nous estimons un limite inférieure pour le WGD partagé esturgeon-paddlefish à ~ 254, 7 Ma (AVG-5RC; 95% CIR: ~ 207, 1–289 Ma) (Données supplémentaires 1, Fig. 5A, Fig. 8 supplémentaires). Il est intéressant de noter que cette estimation bayésienne moyenne du moment de la limite inférieure ancestrale du WGD esturgeon-paddlefish se situe près de l'événement d'extinction de masse à la frontière Permien-Trias (P-Tr) ~ 251,9 Ma.

Cependant, notre deuxième série d'analyses, utilisant moins d'étalonnages de poissons à nageoires rayonnées, place la limite inférieure du WGD à ~ 241, 8 Ma (AVG-5RC; 95% CIR: ~ 202, 9–273, 4 Ma) (Données supplémentaires 1, Fig. 5B, Supplémentaire figure 9). Dans cette optique, d'autres divergences non calibrées sont également déplacées vers le présent, notamment les Neopterygii de la couronne (Teleostei et Holostei ; de 294,5 Ma [AVG-5RC ; 95 % CIR : ~270,8–319,9 Ma] à 278,5 Ma [AVG-5RC ; 95 % CIR : ~256,9–304,6 Ma]) et Holostei de la couronne (c.-à-d. gars et bowfin ; de 276,9 Ma [AVG-5RC ; 95 % CIR : ~251,4–306,4 Ma] à 263,4 Ma [AVG-5RC ; 95 % CIR : ~240,6–291,6 Ma]), ou sont plus radicalement décalés vers le présent, comme les Actinopterygii de la couronne (tous les poissons à nageoires rayonnées existants; de 378 Ma [AVG-5RC; 95% CIR: ~ 372,1–384 Ma] à 349,5 Ma [AVG-5RC ; 95 % CIR : ~329,4–370,9 Ma]) et Actinopteri couronne (de 367,8 Ma [AVG-5RC ; 95 % CIR : ~360,6–374,8 Ma] à 340,2 Ma [AVG-5RC ; 95 % CIR : ~320,3–361,7 Ma]) (Données supplémentaires 1, Fig. 5, Figs supplémentaires. 8 et 9). La divergence esturgeon-spatulaire (couronne Acipenseriformes) est également très légèrement plus récente dans cette analyse à ~ 167,5 Ma (AVG-5RC; 95% CIR: ~ 123,4–202,1 Ma) (Données supplémentaires 1, Fig. 5B, Fig. 9 supplémentaires ).

Des études antérieures ont favorisé des événements WGD indépendants dans les lignées d'esturgeons et de polyodons, malgré leur étroite relation phylogénétique8,35,38,44,45. En tenant compte de la possibilité d'un seul événement d'autopolyploïdie suivi d'une rediploïdisation spécifique à la lignée24, nos résultats rejettent les WGD indépendants, révélant qu'un WGD ancestral était suivi d'une spéciation à un moment où au moins 50 à 66% du génome restait tétraploïde. Cette proportion élevée de tétraploïdie au moment de la spéciation fournit une explication aux études antérieures inférant à tort des événements WGD indépendants8,35,38,44,45 et a des implications pour l'évolution et la biologie acipensériformes.

Bien que n'étant pas encadrée dans le contexte d'un WGD partagé, une similitude dans l'évolution des génomes de l'esturgeon et du polyodon a été précédemment notée8. Par exemple, les six plus grands chromosomes (trois paires de chromosomes dérivés du WGD) semblent présenter une homologie chromosomique particulièrement forte entre l'esturgeon et le polyodon (Fig. 3C)8 ; et nous constatons que ces mêmes chromosomes ont principalement subi une rediploïdisation avant la divergence esturgeon-spatulaire. Pour ces régions et d'autres du génome qui ont subi une rediploïdisation avant la spéciation, l'apparition de la séquence ohnolog et de la divergence fonctionnelle (au-delà de la variation allélique) aura également été ancestrale pour les deux lignées acipenseriformes existantes. Cette histoire de rediploïdisation partiellement partagée après un WGD partagé explique probablement au moins une partie de la similitude proposée dans l'évolution du génome entre les polyodons et les esturgeons et contribue peut-être à leur remarquable capacité à s'hybrider8,67.

À l'inverse, d'autres parties du génome - ces chromosomes et régions de chromosomes qui étaient tétraploïdes lorsque les esturgeons et les polyodons ont divergé - se sont rediploïdées indépendamment dans chaque lignée, avec des régions différentes (et de tailles différentes), et donc des ensembles de gènes différents, se rediploïdant à des moments différents. Les ohnologues qui se sont résolus à partir d'allèles après la spéciation doivent également avoir subi une sous-/néo-fonctionnalisation/régulation indépendamment24. Étant donné que plus de la moitié du génome semble s'être rediploïdisé après la divergence entre l'esturgeon et le spatulaire, il est probable que ces ohnologues rediploïdisés indépendamment et les réseaux qu'ils forment contribuent considérablement à la biologie unique de chaque lignée. Par exemple, une étude récente de la famille des gènes des récepteurs de l'ocytocine et de la vasotocine (OTR/VTR), qui jouent divers rôles, notamment dans le comportement social et la reproduction, a révélé que ces gènes dupliqués apparaissaient de manière cohérente avec des WGD indépendants dans chaque lignée68. Nos résultats indiquent plutôt que les gènes de la famille OTR/VTR pourraient être mieux interprétés comme suivant le modèle LORe24, s'étant rediploïdés indépendamment chez les esturgeons et les polyodons.

Notre estimation selon laquelle au moins 50 à 66 % du génome dupliqué est resté tétraploïde au point de divergence esturgeon-spatule, c'est-à-dire ~ 80 millions d'années après le WGD, est beaucoup plus longue que les estimations équivalentes pour les salmonidés (~ 60 à 70 % rediploïdisation achevée après environ 50 millions d'années24,26) et les téléostéens (rediploïdisation largement résolue après environ 60 millions d'années13,69) (Fig. 5, Fig. 8 et 9 supplémentaires). Nous suggérons que le taux d'évolution apparemment plus lent (en termes de substitutions et de réarrangements7,8) chez les esturgeons et les polyodons a contribué à une période de rediploïdisation plus prolongée chez les Acipenseriformes par rapport aux téléostéens à évolution plus rapide. Cela peut également aider à expliquer l'effondrement apparent de certaines régions ohnologues du génome du polyodon en une seule séquence d'assemblage, bien que nous ne puissions définitivement exclure le maintien de la tétraploïdie pour une très petite proportion du génome7,26,57. Malgré ce taux plus lent de réarrangement et de rediploïdisation du génome, et la présence de grands blocs de gènes partageant un historique de rediploïdisation cohérent dans nos analyses, nous trouvons des blocs ohnolog qui ont divergé avant et après la spéciation sur les mêmes chromosomes, similaires aux observations chez les salmonidés24,26. Cela semble s'être souvent produit par des événements de réarrangement intrachromosomique isolés dans le temps, facilitant peut-être la suppression de la recombinaison homologue et permettant la résolution des ohnologues à partir des allèles pour ce segment génomique. Ce scénario s'apparente à la formation par étapes de strates évolutives sur les chromosomes sexuels de mammifères14,58 et ajoute une couche de complexité au modèle existant de rediploïdisation segmentaire proposé pour l'esturgeon7.

Notre chronologie de limite inférieure WGD (~ 254,7 Ma; ~ 241,8 Ma avec moins d'étalonnages fossiles) est nettement plus ancienne que toutes les estimations précédentes7, 8, 38, 44, 45. Premièrement, des études antérieures ont généralement supposé ou déduit que le WGD n'était pas partagé et que des WGD indépendants se produisaient dans chaque lignée après la divergence esturgeon-paddlefish. Nos analyses d'arbre génétique, de synténie et de Ks réfutent cela et indiquent que le WGD doit être antérieur à l'émergence de ces lignées d'au moins assez longtemps pour qu'environ 33 à 50% du génome se soit rediploïdisé. Basé sur le plus ancien fossile acipenseriforme de la couronne, †Protopsephurus liui (un spatulaire de la tige)70, qui est daté d'au moins ~121 Ma71,72, ce minimum dur contredit directement toutes les estimations précédentes à l'exception de ~180 Ma basée sur l'esturgeon analyse du génome7. De plus, la rediploïdisation se produisant de manière asynchrone signifie que les approches courantes (par exemple, la phylogénomique ou les analyses basées sur l'horloge moléculaire) utilisées pour estimer directement la date absolue des événements WGD autopolyploïdes sont inévitablement problématiques, car elles confondent le(s) temps de rediploïdisation ohnolog avec le WGD lui-même24,26, 62. Cela signifie que toutes les paires d'ohnologues biaisent probablement la datation vers le présent, à moins qu'elles ne se rediploïdisent presque instantanément après WGD, mais cela sera plus problématique pour les ohnologues divergeant après la divergence esturgeon-pagaie (PostSpec). Comme les études précédentes ne tenaient pas compte de la rediploïdisation asynchrone, toutes les analyses de datation passées auront incorporé ces paires d'ohnologs PostSpec dans leur estimation du moment WGD. Nous avons exclu ces paires d'ohnologues de nos analyses et, contrairement aux études précédentes, nous avons estimé la limite inférieure du WGD à l'aide d'une approche phylogénomique sophistiquée. Ainsi, bien que notre timing de limite inférieure WGD estimé soit beaucoup plus ancien que les estimations précédentes, il devrait également être plus précis. De plus, en raison de la rediploïdisation asynchrone, il s'agit probablement encore d'une sous-estimation du véritable calendrier WGD.

Fait intéressant, nos résultats soutiennent un rôle potentiel de la polyploïdie et de la rediploïdisation asynchrone chez les Acipenseriformes survivant aux événements d'extinction de masse P-Tr et/ou Tr-J. Il a été proposé que les WGD dans les plantes puissent conférer une tolérance et une adaptabilité aux conditions environnementales extrêmes, augmentant ainsi la forme physique face aux événements d'extinction de masse34,73. Notre datation de la limite inférieure du WGD esturgeon-paddlefish suggère que l'événement peut s'être produit près de la période d'extinction de masse P-Tr, mais notre timing moyen dépend de la stratégie d'étalonnage et les intervalles de confiance sont larges.

Cependant, étant donné que la plupart des rediploïdisations sont postérieures à la divergence esturgeon-spatulaire, nos estimations de la limite inférieure du WGD et de la divergence esturgeon-spatulaire sont pleinement cohérentes avec un modèle où la flexibilité et la redondance fonctionnelle intrinsèques à un génome dans les premiers stades de la rediploïdisation autopolyploïde a contribué à la survie et au succès des Acipenseriformes à travers au moins l'extinction de masse Tr-J, sinon aussi l'extinction P-Tr. Cependant, un génome dupliqué n'est pas un bouclier général contre toute extinction, et nos anciennes estimations de la limite inférieure du WGD suggèrent qu'il peut s'être produit relativement tôt dans l'évolution des chondrostéens, ce qui implique que les Acipenseriformes souches (tels que †Peipiaosteidae et †Chondrosteidae)74,75,76 ,77 probablement séparé de l'ancêtre des Acipenseriformes existants avec des génomes encore au début du processus de rediploïdisation.

La rediploïdisation asynchrone exacerbe clairement la difficulté technique d'analyser les événements WGD - bouleversant les attentes traditionnelles pour les arbres génétiques WGD et les parcelles Ks et conduisant à certaines régions génomiques en double si similaires qu'elles sont regroupées en une seule région d'assemblage, ou peut-être même encore tétraploïde, longtemps après WGD (bien plus de 200 millions d'années après WGD chez les polyodons). Dans ce contexte, en identifiant des signaux distincts pour la rediploïdisation spécifique à la lignée (dans les analyses d'arbre génétique, de synténie et de Ks), nous proposons une voie à suivre pour détecter et analyser d'autres événements WGD affectés par une rediploïdisation asynchrone spécifique à la lignée. Nous notons que notre cadre pour distinguer le signal de distribution de l'arbre génétique pour la rediploïdisation spécifique à la lignée de celui de l'erreur phylogénétique n'exclut pas les phénomènes biologiques alternatifs (tri incomplet de la lignée ou hybridation78) comme source de la distribution conflictuelle de la topologie de l'arbre génétique. Cependant, même les scénarios les plus simples nécessaires pour impliquer ces facteurs plutôt que la rediploïdisation asynchrone sont beaucoup moins parcimonieux (Fig. 10 supplémentaire; Voir la note supplémentaire 1 pour une discussion détaillée).

La découverte d'un mélange de rediploïdisation ancestrale et spécifique à la lignée dans les lignées de poissons à nageoires rayonnées téléostéens13,24,26,27,28 et non téléostéens, suggère qu'il s'agit d'un phénomène général après le WGD, du moins pour les autopolyploïdes. Étant donné qu'aucun gène individuel ne peut être considéré comme dupliqué tant que la recombinaison n'est pas supprimée, un tel scénario génère des génomes constitués d'une mosaïque de duplications de gènes partagés et spécifiques à la lignée, même s'ils proviennent d'une seule duplication de génome. Cette relation complexe peut aider à expliquer la difficulté de longue date à résoudre le nombre et le moment des WGD au début de l'évolution des vertébrés9,11,12,79,80,81.

La rediploïdisation étendue spécifique à la lignée a des implications majeures pour notre compréhension de l'évolution du génome après la polyploïdie et pour notre interprétation de l'évolution des gènes en double, y compris leur rôle dans l'évolution adaptative. Ce cadre d'analyse et d'interprétation de l'évolution suite à la WGD incitera à réexaminer d'autres événements d'autopolyploïdie, y compris la WGD fondatrice à la base de tous les vertébrés.

Aucune approbation éthique ou autre permis n'était requis pour cette recherche.

Dans leur analyse du génome de l'esturgeon sterlet, Du et al.7 ont défini un ensemble de données de paires d'ohnologues de haute confiance pour l'espèce, ce qui constitue une base initiale pour nos analyses. Pour ajouter des polyodons (GCF_017654505.1)8 ohnologues à cet ensemble de données, nous avons utilisé OrthoFinder82 (v 2.5.4) pour déduire les orthogroupes hiérarchiques phylogénétiques (PHOG). Pour les analyses OrthoFinder, nous avons également inclus un ensemble de protéomes d'espèces couvrant la phylogénie des vertébrés à mâchoires, y compris le requin fantôme (Callorhinchus milii ; GCF_000165045.1)83 et le requin baleine (Rhincodon typus ; GCF_001642345.1)84 de Chondrichthyes, et l'homme (Homo sapiens ; GCF_000001405.39), poulet domestique (Gallus gallus ; GCF_000002315.6), grenouille africaine à griffes (Xenopus tropicalis ; GCF_000004195.4) et coelacanthe (Latimeria chalumnae ; GCF_000225785.1) de Sarcopterygii. Parmi les actinoptérygiens, nous avons sélectionné le poisson zèbre (Danio rerio; GCF_000002035.6), le fugu (Takifugu rubripes; GCF_901000725.2), le lépisosté tacheté (Lepisosteus oculeatus; GCF_000242695.1)39 et le poisson-castor (Amia Calva; JAAWVP01.1)35 comme représentants de Neopterygii, le groupe frère des esturgeons et des polyodons, et le bichir gris (Polypterus senegalus; GCF_016835505.1)35 comme groupe frère combiné. La séquence protéique la plus longue pour chaque gène a été utilisée pour ces analyses où des transcrits alternatifs ont été annotés. Les paramètres par défaut d'OrthoFinder ont été utilisés, à deux exceptions près. Tout d'abord, nous avons spécifié un arbre d'espèces, conformément aux relations acceptées des vertébrés à mâchoires7,8,35,85, pour augmenter l'inférence orthologique : "((GhostShark,WhaleShark),((Coelacanth,(Frog,(Human,Chicken))), (Bichir,((Paddlefish,Esturgeon),((Zebrafish,Fugu),(SpottedGar,Bowfin))))));". Deuxièmement, l'indicateur OrthoFinder -y a été spécifié pour diviser davantage les PHOG qui ont subi des duplications après l'ancêtre vertébré à mâchoires en PHOG séparés. Lors du post-traitement des résultats d'OrthoFinder, nous avons ensuite effectué une vérification supplémentaire en extrayant uniquement les PHOG comprenant des séquences d'autant d'espèces que possible, tout en incluant toujours deux séquences chacune d'esturgeons et de polyodons. Ceci a été réalisé en extrayant l'ensemble de séquences descendant du nœud d'espèces ancestrales le plus ancien dans l'arbre génétique réconcilié d'OrthoFinder pour ne pas inclure de séquences d'esturgeons ou de polyodons supplémentaires (basées sur les fichiers .tsv dans le dossier de sortie OrthoFinder Phylogenetic_Hierarchical_Orthogroups). À titre d'exemple simple, dans un orthogroupe avec une duplication de gène chez l'ancêtre d'Actinopterygii, les ohnologues de polyodons et d'esturgeon étant conservés dans les deux doublons d'actinoptérygiens, notre approche aboutit à deux PHOG résultants, divisés au niveau d'Actinopterygii, sans inclure de séquences. de l'autre duplicata ou de leurs co-orthologues de Sarcopterygii ou Chondrichthyes, et contenant chacun deux séquences d'esturgeons et deux de polyodons.

Ces PHOG ont ensuite été filtrés pour ne retenir que ceux qui correspondaient à une paire ohnolog de haute confiance d'esturgeon précédemment déduite, ainsi que ceux comprenant au moins un groupe externe pour permettre l'enracinement du sous-arbre de la paire ohnolog esturgeon-paddlefish, et donc l'inférence du temps de nœud de duplication relatif. à la spéciation. Nous avons également exclu les familles de gènes où les deux ohnologues du polyodon ou de l'esturgeon étaient présents sur le même chromosome, ou où une séquence de polyodon ou d'esturgeon était présente sur un échafaudage non attribué à l'un des 60 chromosomes d'esturgeon ou de polyodon. Enfin, nous avons vérifié que les séquences d'esturgeons et de polyodons formaient un groupe monophylétique dans les arbres de gènes PHOG inférés (voir ci-dessous la section sur l'inférence du temps de duplication d'Ohnolog). 5439 PHOG répondaient à ces critères (et forment notre ensemble de paires d'ohnologues), dont 5372 comprenaient également au moins une séquence de Neopterygii et un groupe externe plus éloigné, tout en veillant à ce que les deux séquences de polyodons et d'esturgeons divergent après la séparation de Neopterygii.

Au total, cela aurait dû aboutir à un ensemble de données fortement enrichi pour les paires d'ohnologues chez l'esturgeon et le polyodon. Cependant, nous notons que l'ensemble ne comprend que des paires d'ohnologues où les deux ohnologues sont conservés dans les deux espèces et exclut les PHOG qui ont subi des duplications ou des pertes supplémentaires chez les esturgeons, les polyodons ou leur lignée de tige ancestrale. De même, il est possible qu'un très petit sous-ensemble de nos paires d'ohnologues puisse dériver de scénarios complexes de multiples pertes d'ohnologues et de duplications interchromosomiques qui ont échappé à nos filtres (ainsi que la preuve de synténie doublement conservée pour l'ensemble d'ohnologues d'esturgeon original) et a laissé une paire de sosies ohnolog chez les polyodons et les esturgeons. Cependant, nous nous attendons à ce que les PHOG où cela s'est produit soient extrêmement rares dans notre ensemble de données final de 5439 paires d'ohnologues d'esturgeons et de spatulaires.

Pour estimer le temps de rediploïdisation (c'est-à-dire le temps de nœud de duplication) par rapport à la spéciation pour chaque paire d'ohnologues d'esturgeons et de spatulaires, nous avons effectué des analyses phylogénétiques pour chaque famille de gènes à partir des PHOG de la paire d'ohnologues d'esturgeons et de spatulaires pré-monophyliquement filtrés décrits ci-dessus (5590 arbres). Des alignements de séquences multiples ont été effectués avec MAFFT v7.487 avec l'indicateur --auto spécifié et l'indicateur --anysymbol pour les ensembles de données qui comprenaient des séquences contenant de la sélénocystéine (symbole U). L'inférence phylogénétique a été réalisée à l'aide de IQ-tree86 (v. 2.1.4-beta COVID-edition), avec le drapeau -m JTT + G pour utiliser le modèle de substitution d'acides aminés JTT87 avec quatre catégories gamma discrètes, ainsi que le -bb 1000 flag pour spécifier 1000 répliques d'amorçage ultrarapides48. Les arbres de maximum de vraisemblance résultants ont été extraits pour le prétraitement et l'inférence du temps de duplication. Pour prétraiter ces arbres, nous avons utilisé la bibliothèque python ETE (v3) toolkit88 pour vérifier que les séquences d'esturgeons et de polyodons formaient un clan monophylétique (dans un sens non enraciné)89 dans chaque arbre de gènes PHOG, puis enraciné chaque arbre avec le plus éloigné. séquence relative aux esturgeons et polyodons (c'est-à-dire généralement requin fantôme/requin baleine). Dans un script python séparé, la boîte à outils ETE a ensuite été utilisée pour effectuer une réconciliation stricte entre l'arbre des gènes et l'arbre des espèces88,90 pour déduire les nœuds/événements de spéciation et de duplication, avant de classer (PreSpec, PostSpec, 'Other' [PreSpec-like, PostSpec-like ]) et résumant les différentes topologies et fréquences des arbres génétiques des sous-arbres de l'esturgeon et du spatulaire récupérées.

Pour interroger la possibilité que l'un des arbres génétiques PreSpec ou PostSpec dérive d'une erreur, ainsi que pour mieux comprendre la source des topologies "Autres", nous avons effectué une série d'analyses. Tout d'abord, nous avons effectué des analyses AU-test47 non enracinées dans IQ-tree86. Pour ce faire, nous avons classé les trois topologies non enracinées possibles de notre sous-arbre d'esturgeon à quatre pointes en tant que type PostSpec ou type PreSpec selon qu'elles deviendraient PostSpec (-like) ou PreSpec (-like) si elles étaient enracinées. Pour chacune des quatre catégories de topologie enracinée (c'est-à-dire PostSpec, PreSpec et les deux catégories "Autres" de type PreSpec et PostSpec), nous avons extrait le sous-alignement pour les quatre séquences d'esturgeons/paddlefish de chaque PHOG dans cette catégorie, puis a effectué une analyse de test AU pour chaque ensemble de paires d'ohnologs en spécifiant les trois topologies non enracinées possibles. La fréquence à laquelle le type de topologie non racine correspondant n'a pas été rejeté pour les sous-alignements de chaque catégorie de topologie arborescente racine a ensuite été calculée et tracée.

Ensuite, à l'aide d'un script python et de la boîte à outils ETE88, nous avons évalué l'influence que le filtrage de nos comptes PHOG de paires d'ohnologs par des seuils de pourcentage de bootstrap ultrarapides de plus en plus élevés (considérés pour les deux valeurs de support dans le clade à quatre pointes paddlefish-esturgeon uniquement) aurait avoir sur les fréquences de topologie enracinée. En partant d'un seuil de 0 % et en augmentant de 5 %, jusqu'à 100 %, nous avons évalué le nombre total et les pourcentages de topologies arborescentes PostSpec, PreSpec et "Autres" récupérées à chaque seuil, puis évalué les tendances dans fréquence de la topologie à mesure que la coupure devenait plus stricte. Nous avons également calculé et tracé l'écart de pli par rapport au hasard (c'est-à-dire si les 15 topologies ont été récupérées à fréquence égale) à laquelle chaque catégorie d'arbre enraciné a été récupérée pour PostSpec (attendu au hasard 1/15 fois), PreSpec (attendu au hasard 2/15 fois) et Les topologies "Autres" (prévues au hasard 12/15 fois) sur la même série de coupures bootstrap ultrarapides et ont évalué les tendances observées.

Pour évaluer si les familles de gènes prenant en charge une topologie fonctionnent mal pour récupérer d'autres clades généralement acceptés49,50, et sont donc plus susceptibles d'induire en erreur, nous avons utilisé un script python ETE toolkit88 personnalisé pour évaluer la monophylie de trois clades largement acceptés ; Tétrapodes (tétrapodes ; monophylie de l'humain, du poulet et de la grenouille), Teleostei (poissons téléostéens ; monophylie du fugu et du poisson zèbre) et Chondrichthyes (poissons cartilagineux ; monophylie du requin fantôme/éléphant et du requin baleine). Ce script exigeait également qu'au moins une séquence soit présente pour chaque espèce dans ce clade monophylétique, ce qui signifie que certains négatifs peuvent également provenir de la perte ou de l'absence de gènes de notre PHOG déduit.

Pour détecter les signes d'éventuelles erreurs systématiques, nous avons comparé une gamme de statistiques au niveau de l'alignement des séquences, de la modélisation et des arbres phylogénétiques déduits, entre les arbres génétiques correspondant aux topologies d'arbres PostSpec, PreSpec et "Autre" en utilisant le test de Wilcox bilatéral avec Correction de Bonferroni dans R (version 4.1.2 [2021-11-01])91. La longueur d'alignement et le pourcentage moyen d'identité par paires ont été calculés à l'aide du programme esl-alistat du package Hmmer [version 3.1b2; http://hmmer.org]92, tandis que le nombre de sites informatifs sur la parcimonie52 a été extrait de la sortie de l'arbre IQ. PhyKIT (v. 1.11.3)51 a été utilisé pour calculer le nombre de sites variables52, le taux d'évolution (c'est-à-dire la longueur totale de l'arbre/le nombre de nœuds feuilles)53, l'arborescence (c'est-à-dire la somme des longueurs des branches internes/la longueur totale de l'arbre)54, variabilité compositionnelle relative (RCV)54, arborescence/RCV52,54 et niveau de saturation55.

Pour explorer plus en détail si nos résultats pouvaient dériver d'une erreur systématique, nous avons testé l'utilisation de modèles de mélange hétérogènes de site précalculés sur l'ensemble de PHOG qui avaient un support maximal pour toute topologie de sous-clade d'esturgeon-paddlefish (bootstrap ultrarapide = 100% pour les deux valeurs de support dans le sous-arbre esturgeon-spatulaire). Plus précisément, nous avons testé l'ajustement et influencé les modèles UL393, EX_EHO94 et JTT + C2095, ce qui peut aider à atténuer les biais systématiques et s'adapte souvent bien aux alignements de familles de gènes uniques96,97.

Nous avons analysé l'ensemble des ohnologues où les deux gènes de la paire étaient présents chez l'esturgeon et un seul gène était présent chez le spatulaire. Cela a été réalisé en suivant de près l'approche des ensembles de données Ohnolog-pair et des sections d'inférence du temps de duplication Ohnolog ci-dessus, mais cette fois en choisissant des PHOG qui ne contiennent qu'une seule séquence de paddlefish. Un script python distinct, par rapport à celui utilisé pour l'analyse principale des paires d'ohnologues, a été utilisé pour classer le sous-arbre esturgeon-spatulaire en type PreSpec ou en type PostSpec (notez qu'il n'y a que trois arbres enracinés au total pour ce sous-arbre à trois pointes , un PostSpec[-like] et deux PreSpec[-like]). Pour mieux comprendre la distribution des arbres de type PreSpec et de type PostSpec observés, nous avons examiné si les gènes du polyodon dans les arbres de type PostSpec (où les régions ohnologues sont susceptibles d'être plus similaires, n'ayant divergé qu'après la spéciation esturgeon-polyodon) peuvent dans fait résulter de l'effondrement de deux ohnologs en une seule région d'assemblage plutôt que d'être une copie unique. Pour tester cela, nous avons cartographié les lectures de séquençage de l'ADN du génome du paddlefish (obtenues à partir des expériences CNGBdb CNX0162203-5, du projet CNP0000867 disponible sur https://db.cngb.org/search/project/CNP0000867/)8 à l'assemblage du génome du paddlefish en utilisant Noeud papillon (v. 2.4.2). Un fichier BAM trié a été généré pour les données alignées à l'aide de SAMtools (v. 1.16.1)98. Pour trois ensembles de gènes distincts (gènes de paires ohnolog à deux copies [ensemble de données principal] et gènes de type PreSpec et de type PostSpec qui sont à copie unique chez le spatulaire mais forment une paire ohnolog chez l'esturgeon), la couverture génétique a été calculée en extrayant la profondeur de lecture brute par gène (c'est-à-dire une valeur moyenne du début à la fin pour chaque gène ; couverture de gène) du BAM en utilisant le drapeau --by dans mosdepth (v. 0.3.3)99.

La commande ksd de l'outil wgd59 a été utilisée, avec les paramètres par défaut, pour calculer les valeurs Ks par paires pour dix ensembles de données de paires ohnolog/ortholog différentes ; dont huit étaient les paires intra-espèces PostSpec, PostSpec-like, PreSpec et PreSpec-like ohnolog de polyodons et d'esturgeons, les deux autres étant constituées de paires d'orthologues de (i) les deux paires d'orthologues d'esturgeon-spaddlefish de chaque Arbre génétique PreSpec, et (ii) les orthogroupes à copie unique présents dans toutes les espèces, comme déduit dans notre analyse OrthoFinder. Ce dernier ensemble d'orthogroupes à copie unique pourrait potentiellement incorporer certains ohnologs cachés s'il y a des cas de perte différentielle d'ohnolog PreSpec entre l'esturgeon et le polyodon, et est donc plus sujet aux biais, mais reste une comparaison utile. Dans chaque cas, la séquence codante correspondante aux séquences d'acides aminés utilisées dans les analyses d'arbres génétiques a été appliquée, et les paires où l'une ou l'autre des séquences était signalée par un avertissement par wgd ont été supprimées et wgd réexécutées. Les paires avec des valeurs Ks ≥ 0,3 n'ont pas été incluses dans les données finales pour la visualisation. Pour compléter les analyses des différences de pic Ks de paires d'orthologues entre les polyodons et les esturgeons, les longueurs des branches orthologues des esturgeons et des polyodons ont été comparées pour évaluer les différences de taux d'évolution des acides aminés dans les substitutions par site chez chaque espèce. Pour cette analyse, nous nous sommes assurés que tous les arbres génétiques étaient enracinés conformément à la phylogénie des vertébrés à mâchoires plus larges et que les séquences d'esturgeons et de polyodons formaient un groupement monophylétique (conformément à la sous-section ci-dessus sur les méthodes des ensembles de données de paires d'Ohnolog). Nous avons ensuite extrait les longueurs de branche pour l'esturgeon et le polyodon de chacun des deux orthologues esturgeon-polyodon PreSpec, ainsi que des orthogroupes à copie unique (pour lesquels les alignements et les arbres génétiques ont été construits en suivant les paramètres MAFFT et IQ-tree utilisés dans la duplication Ohnolog sous-section des méthodes d'inférence temporelle ci-dessus) à l'aide d'un script python personnalisé de la boîte à outils ETE. La monophylie du clade esturgeon-spadon vérifie et se concentre sur les orthologues PreSpec et (dans une moindre mesure) les orthogroupes à copie unique doivent garantir que la divergence de la paire de séquences esturgeon et spatulaire reflète la divergence orthologue depuis la spéciation. Ainsi, la variation de ces longueurs de branches entre les espèces capture spécifiquement la variation du taux de substitution. Une mise en garde à cet égard existe pour les orthogroupes à copie unique, où la perte différentielle d'ohnolog produisant des ohnologs cachés pourrait induire en erreur les analyses de cet ensemble de données. Nous avons comparé les longueurs des branches des esturgeons et des polyodons à l'aide du test de Wilcox pour échantillons appariés dans R (version 4.1.2 [2021-11-01])91. Les paires d'orthologues extrêmes avec des valeurs de longueur de branche ≥ 0,15 n'ont pas été incluses dans les données finales à des fins de visualisation ou de comparaison statistique.

Les coordonnées génomiques de chaque gène d'une paire d'ohnologues ont été utilisées pour ancrer les liens entre les ohnologues sur des tracés circos (dessinés avec circos-0.69-9100) des génomes d'esturgeons et de polyodons. Tous les membres d'une paire ohnolog devaient être présents sur les 60 plus grands chromosomes à inclure. Pour tracer les deux espèces dans une seule parcelle de circos, les paires d'ohnologs PreSpec ont été divisées en ohnologs séparés pour être tracées en tant qu'orthologues entre les espèces, tandis que les paires d'ohnologs PostSpec ont été tracées en tant qu'ohnologs au sein des espèces selon les parcelles d'espèces individuelles.

Pour estimer une limite inférieure pour le WGD esturgeon-spatulaire, nous avons extrait l'ensemble d'arbres génétiques récupérant la topologie de la paire ohnolog esturgeon-spaddle PreSpec avec un support maximal (bootstrap ultra-rapide = 100% pour les deux valeurs de support dans le sous-arbre esturgeon-spaddlefish). Pour simplifier la préparation de l'analyse phylogénomique et réduire le temps de calcul des analyses de datation, nous avons ensuite filtré les familles de gènes qui étaient autrement une copie unique, ce qui a donné un ensemble de 81 familles de gènes. Nous avons généré cinq ensembles de données distincts en attribuant au hasard des ohnologues d'une paire en tant que copie A ou B avant la concaténation des 81 alignements de séquences multiples de la famille de gènes existants. Cela évite le biais d'une seule concaténation arbitraire, tout en permettant également d'évaluer la robustesse des résultats aux variations des concaténations ohnolog62.

Lors de la concaténation, chaque super-matrice a ensuite été filtrée à l'aide de trimAl101 (-nogaps) et BMGE102 (-m BLOSUM62) pour couper les sites riches en lacunes et saturés, après quoi 42 126 sites d'alignement d'acides aminés sont restés dans chaque ensemble de données.

La datation des divergences phylogénomiques a ensuite été effectuée (sur chacune des cinq super-matrices alternatives) dans Phylobayes63 (version 4.1c), en spécifiant le modèle de substitution CAT-GTR + G465 site-hétérogène ainsi qu'un modèle d'horloge relaxée lognormale autocorrélée64 (qui s'adapte et effectue bien dans la phylogénomique des vertébrés à mâchoires85), et un a priori naissance-décès avec des limites souples103,104 sur les calibrations fossiles. Des priors d'étalonnage des fossiles (données supplémentaires 1) ont été définis pour la plupart des nœuds de l'arbre, à l'exception notable du nœud de synchronisation de la limite inférieure du WGD esturgeon-spaddlefish et du nœud séparant les esturgeons et les spatulaires (Acipenseriformes) de Neopterygii. Les calibrations, y compris une divergence minimale de 121 Ma70,71 pour les esturgeons et les polyodons, ont suivi Benton et al.72, à l'exception de la limite inférieure sur les Chondrichthyes de la couronne qui a été fixée à 381 Ma105. Une deuxième analyse a également été réalisée avec moins de nœuds de poissons à nageoires rayonnées calibrés en fonction de la difficulté de placer phylogénétiquement les fossiles paléozoïques de cette lignée66, en particulier les nœuds couronne Actinopterygii, couronne Neopterygii et couronne Holostei. Une topologie arborescente fixe ("((GhostShark,WhaleShark),((Coelacanth,(Frog,(Human,Chicken))),(Bichir,(((PaddlefishA,SturgeonA),(PaddlefishB,SturgeonB)),((Zebrafish, Fugu), (Gar, Amia))))));") a été spécifié sur la base de la phylogénie acceptée des vertébrés à mâchoires7,8,35,85 et de notre inférence d'un WGD partagé, et les représentants des Chondrichthyes, le requin fantôme et le requin baleine, étaient défini comme l'exogroupe. Nous avons vérifié cette topologie pour chacun de nos cinq ensembles de données en effectuant une analyse phylogénomique concaténée de base dans IQ-tree86 sous le modèle JTT + G487 avec 1000 réplicats de bootstrap UFBoot48.

Chaque analyse Monte Carlo de la chaîne de Markov de Phylobayes a été échantillonnée pendant au moins 10 000 cycles, les 5 000 premiers étant rejetés comme rodage avant le calcul des dates de divergence déduites et des intervalles de crédibilité à 95 %. Les exécutions sous le prior ont été effectuées en utilisant les mêmes paramètres, à l'exception du passage à un modèle de substitution de Poisson homogène au site pour une efficacité de calcul puisque le prior sur les temps de divergence est indépendant des priors du modèle de substitution, pour vérifier que le prior sur le WGD esturgeon-paddlefish inférieur les délais liés étaient suffisamment diffus pour être non informatifs.

De plus amples informations sur la conception de la recherche sont disponibles dans le résumé des rapports sur le portefeuille Nature lié à cet article.

Les alignements, les arbres génétiques, les supermatrices de concaténation aléatoire et les chronogrammes de datation phylogénomique générés dans cette étude sont fournis sur figshare (https://doi.org/10.6084/m9.figshare.19762963.v1)106. Les étalonnages de nœuds de datation phylogénomique et les âges inférés générés dans cette étude sont fournis dans les données supplémentaires 1. Les catégories de topologie inférées, les résultats des tests AU, les seuils UFBoot, la récupération de clade hors cible, l'alignement, la modélisation et les statistiques d'arbre génétique, les données de synténie , les valeurs Ks, la couverture de profondeur de lecture à travers les ohnologs de polyodons et les données de longueur de branche orthologue générées dans cette étude sont fournies dans le fichier Source Data. Les données de lecture de séquençage d'ADN utilisées pour évaluer l'effondrement possible de l'assemblage des régions ohnologues dans le génome du polyodlon dans cette étude sont disponibles dans la base de données CNGBdb sous les codes d'accès CNX0162203-5 (du projet CNP0000867 disponible sur https://db.cngb.org/ recherche/projet/CNP0000867/). Les données sources sont fournies avec ce document.

Tous les scripts python d'analyse d'arbre génétique personnalisés basés sur ETE3 sont disponibles sur figshare (https://doi.org/10.6084/m9.figshare.19762963.v1)106.

Mandáková, T. & Lysak, MA Diploïdisation post-polyploïde et diversification par des changements dysploïdes. Courant. Avis. Végétal Biol. 42, 55–65 (2018).

Article PubMed Google Scholar

Blanc, G. & Wolfe, KH Paléopolyploïdie généralisée chez les espèces végétales modèles déduite des distributions d'âge des gènes en double. Cellule végétale 16, 1667–1678 (2004).

Article CAS PubMed PubMed Central Google Scholar

Soltis, PS & Soltis, DE Anciens événements WGD en tant que moteurs d'innovations clés dans les angiospermes. Courant. Avis. Végétal Biol. 30, 159-165 (2016).

Article PubMed Google Scholar

Clark, JW & Donoghue, PCJ Duplication du génome entier et macroévolution végétale. Tendances Plant Sci. 23, 933–945 (2018).

Article CAS PubMed Google Scholar

Wolfe, KH & Shields, DC Preuve moléculaire d'une ancienne duplication de l'ensemble du génome de la levure. Nature 387, 708–713 (1997).

Article ADS CAS PubMed Google Scholar

Marcet-Houben, M. & Gabaldón, T. Au-delà de la duplication du génome entier : preuves phylogénétiques d'une ancienne hybridation interspécifique dans la lignée de levure de boulanger. PLOS Biol. 13, e1002220 (2015).

Article PubMed PubMed Central Google Scholar

Du, K. et al. La séquence du génome de l'esturgeon sterlet et les mécanismes de rediploïdisation segmentaire. Nat. Écol. Évol. 4, 841–852 (2020).

Article PubMed PubMed Central Google Scholar

Cheng, P. et al. Le génome du spatulaire américain fournit de nouvelles informations sur l'évolution chromosomique et la minéralisation osseuse chez les premiers vertébrés. Mol. Biol. Évol. 38, 1595-1607 (2021).

Article CAS PubMed Google Scholar

Furlong, RF & Holland, PWH Les vertébrés étaient-ils octoploïdes ? Philos. Trans. R. Soc. B Biol. Sci. 357, 531–544 (2002).

Article CAS Google Scholar

Meyer, A. & Van de Peer, Y. De 2R à 3R : preuves d'une duplication du génome spécifique aux poissons (FSGD). BioEssays N. Rev. Mol. Cellule. Dév. Biol. 27, 937–945 (2005).

CAS Google Scholar

Nakatani, Y. et al. La reconstruction des génomes de proto-vertébrés, proto-cyclostome et proto-gnathostome fournit de nouvelles informations sur l'évolution précoce des vertébrés. Nat. Commun. 12, 4489 (2021).

Article ADS CAS PubMed PubMed Central Google Scholar

Simakov, O. et al. La synténie profondément conservée résout les événements précoces de l'évolution des vertébrés. Nat. Écol. Évol. 4, 820–830 (2020).

Article PubMed PubMed Central Google Scholar

Parey, E. et al. Un atlas de l'évolution du génome des poissons révèle une rediploïdisation retardée suite à la duplication du génome entier des téléostéens. Génome Res. 32, 1685–1697 (2022).

Hokamp, ​​K., McLysaght, A. & Wolfe, KH L'hypothèse 2R et la séquence du génome humain. dans Genome Evolution (eds. Meyer, A. & Van de Peer, Y.) 95–110 (Springer Pays-Bas, 2003). https://doi.org/10.1007/978-94-010-0263-9_10.

Taylor, RS, Daniels, RR, Morata, DP, Gundappa, MK & Macqueen, DJ Évolution des génomes de poissons à nageoires rayonnées : statut et orientations avec une amorce sur la caractérisation des microARN. dans Cellular and Molecular Approaches in Fish Biology 309–346 (Elsevier, 2022).

Xu, P. et al. L'origine allotétraploïde et l'évolution asymétrique du génome de la carpe commune Cyprinus carpio. Nat. Commun. 10, 4625 (2019).

Article ADS PubMed PubMed Central Google Scholar

Session, AM et al. Évolution du génome chez la grenouille allotétraploïde Xenopus laevis. Nature 538, 336–343 (2016).

Article ADS CAS PubMed PubMed Central Google Scholar

Lien, S. et al. Le génome du saumon atlantique donne un aperçu de la rediploïdisation. Nature 533, 200-205 (2016).

Article ADS CAS PubMed PubMed Central Google Scholar

Van de Peer, Y., Maere, S. & Meyer, A. La signification évolutive des anciennes duplications du génome. Nat. Révérend Genet. 10, 725–732 (2009).

Article PubMed Google Scholar

Van de Peer, Y., Mizrachi, E. & Marchal, K. La signification évolutive de la polyploïdie. Nat. Révérend Genet. 18, 411–424 (2017).

Article PubMed Google Scholar

Conant, GC & Wolfe, KH Transformer un passe-temps en travail : comment les gènes dupliqués trouvent de nouvelles fonctions. Nat. Révérend Genet. 9, 938–950 (2008).

Article CAS PubMed Google Scholar

Li, Z. et al. Modèles et processus de diploïdisation chez les plantes terrestres. Annu. Rév. Plant Biol. 72, 387–410 (2021).

Article CAS PubMed Google Scholar

Wolfe, KH Les polyploïdes d'hier et le mystère de la diploïdisation. Nat. Révérend Genet. 2, 333–341 (2001).

Article CAS PubMed Google Scholar

Robertson, FM et al. La rediploïdisation spécifique à la lignée est un mécanisme permettant d'expliquer les décalages temporels entre la duplication du génome et la diversification évolutive. Génome Biol. 18, 111 (2017).

Article PubMed PubMed Central Google Scholar

Conant, GC, Birchler, JA & Pires, JC Dosage, duplication et diploïdisation : clarifier l'interaction de plusieurs modèles pour l'évolution des gènes en double au fil du temps. Courant. Avis. Végétal Biol. 19, 91–98 (2014).

Article CAS PubMed Google Scholar

Gundappa, MK et al. Reconstruction à l'échelle du génome de la rediploïdisation après l'autopolyploïdisation sur cent millions d'années d'évolution des salmonidés. Mol. Biol. Évol. 39, msab310 (2022).

Article CAS PubMed Google Scholar

Martin, KJ & Holland, PWH Relations d'orthologie énigmatiques entre les grappes Hox du poisson-papillon africain et d'autres téléostéens suite à une ancienne duplication du génome entier. Mol. Biol. Évol. 31, 2592-2611 (2014).

Article CAS PubMed PubMed Central Google Scholar

Rozenfeld, C. et al. Le transcriptome de novo de l'anguille européenne donne un aperçu de l'histoire évolutive des gènes dupliqués dans les lignées de téléostéens. PLOS ONE 14, e0218085 (2019).

Article CAS PubMed PubMed Central Google Scholar

Hughes, AL L'évolution de protéines fonctionnellement nouvelles après la duplication de gènes. Proc. R. Soc. Londres. B Biol. Sci. 256, 119–124 (1994).

Article ADS CAS Google Scholar

Ohno, S. Évolution par duplication de gènes. (Springer-Verlag, 1970).

Scannell, DR, Byrne, KP, Gordon, JL, Wong, S. & Wolfe, KH Plusieurs cycles de spéciation associés à une perte de gène réciproque chez les levures polyploïdes. Nature 440, 341-345 (2006).

Article ADS CAS PubMed Google Scholar

Clark, JW & Donoghue, PCJ Contraindre le moment de la duplication du génome entier dans l'histoire évolutive des plantes. Proc. R. Soc. B Biol. Sci. 284, 20170912 (2017).

Article Google Scholar

Chen, Y.-C. et coll. Le génome de Litsea et l'évolution de la famille des lauriers. Nat. Commun. 11, 1675 (2020).

Article ADS PubMed PubMed Central Google Scholar

Carretero‐Paulet, L. & Van de Peer, Y. L'énigme évolutive de la duplication du génome entier. Suis. J.Bot. 107, 1101-1105 (2020).

Article PubMed PubMed Central Google Scholar

Bi, X. et al. Traçage des empreintes génétiques de l'atterrissage des vertébrés chez les poissons à nageoires rayonnées non téléostéens. Cellule 184, 1377–1391.e14 (2021).

Article CAS PubMed Google Scholar

Thompson, AW et al. Le génome de la nageoire arc-en-ciel éclaire l'évolution du développement des poissons à nageoires rayonnées. Nat. Genet. 53, 1373-1384 (2021).

Article CAS PubMed PubMed Central Google Scholar

Dehal, P. & Boore, JL Deux cycles de duplication du génome entier chez le vertébré ancestral. PLoS Biol. 3, e314 (2005).

Article PubMed PubMed Central Google Scholar

Cheng, P. et al. Ébauche du génome et caractérisation complète du Hox-Cluster du Sterlet (Acipenser ruthenus). Devant. Genet. 10, 776 (2019).

Article CAS PubMed PubMed Central Google Scholar

Braasch, I. et al. Le génome du gar tacheté éclaire l'évolution des vertébrés et facilite les comparaisons homme-téléostéen. Nat. Genet. 48, 427–437 (2016).

Article CAS PubMed PubMed Central Google Scholar

Fontana, F. Régions organisatrices nucléolaires chromosomiques chez 4 espèces d'esturgeons comme marqueurs de l'évolution du caryotype chez les Acipenseriformes (poissons). Génome 37, 888–892 (1994).

Article CAS PubMed Google Scholar

Havelka, M., Hulák, M., Bailie, DA, Prodöhl, PA et Flajšhans, M. Duplications étendues du génome chez les esturgeons : nouvelles preuves à partir de données microsatellites. J. Appl. Ichtyol. 29, 704–708 (2013).

Article Google Scholar

Ohno, S. et al. Microchromosomes chez les poissons holocéphales, chondrostéens et holostéens. Chromosome 26, 35–40 (1969).

Article CAS PubMed Google Scholar

Zhang, H. et al. Extinction de l'un des plus grands poissons d'eau douce du monde : leçons pour la conservation de la faune menacée du Yangtsé. Sci. Environ. 710, 136242 (2020).

Article ADS CAS PubMed Google Scholar

Crow, KD, Smith, CD, Cheng, J.-F., Wagner, GP et Amemiya, CT Une duplication indépendante du génome déduite des paralogues de Hox chez le spatulaire américain - un poisson à nageoires rayonnées basales représentatif et une référence comparative importante. Génome Biol. Évol. 4, 937–953 (2012).

Article PubMed PubMed Central Google Scholar

Symonova, R. et al. Différenciation cytogénétique moléculaire des paralogues des paralogues Hox dans le génome dupliqué et rediploïdisé du spatulaire nord-américain (Polyodon spathula). BMC Genet. 18, 19 (2017).

Article PubMed PubMed Central Google Scholar

Dingerkus, G. & Howell, WM Analyse caryotypique et preuve de tétraploïdie chez le spatulaire nord-américain, Polyodon spathula. Sciences 194, 842–844 (1976).

Article ADS CAS PubMed Google Scholar

Shimodaira, H. Un test approximativement impartial de sélection d'arbres phylogénétiques. Syst. Biol. 51, 492–508 (2002).

Article PubMed Google Scholar

Hoang, DT, Chernomor, O., von Haeseler, A., Minh, BQ & Vinh, LS UFBoot2 : amélioration de l'approximation bootstrap ultrarapide. Mol. Biol. Évol. 35, 518–522 (2018).

Article CAS PubMed Google Scholar

Siu-Ting, K. et al. L'inclusion involontaire de paralogues entraîne des topologies artificielles et des estimations d'arbre temporel en phylogénomique. Mol. Biol. Évol. 36, 1344–1356 (2019).

Article CAS PubMed PubMed Central Google Scholar

Philippe, H. et al. L'atténuation des effets anticipés des erreurs systématiques soutient la relation de groupe sœur entre Xenacoelomorpha et Ambulacraria. Courant. Biol. CB 29, 1818–1826.e6 (2019).

Article CAS PubMed Google Scholar

Steenwyk, JL et al. PhyKIT : une boîte à outils shell UNIX largement applicable pour le traitement et l'analyse des données phylogénomiques. Bioinformatique 37, 2325–2331 (2021).

Article CAS PubMed PubMed Central Google Scholar

Shen, X.-X., Salichos, L. & Rokas, A. Une enquête à l'échelle du génome sur l'influence de la séquence, de la fonction et des propriétés des gènes à base d'arbres sur l'inférence phylogénétique. Génome Biol. Évol. 8, 2565-2580 (2016).

Article CAS PubMed PubMed Central Google Scholar

Telford, MJ et al. L'analyse phylogénomique des relations de classe des échinodermes soutient Asterozoa. Proc. R. Soc. B Biol. Sci. 281, 20140479 (2014).

Article Google Scholar

Phillips, MJ & Penny, D. La racine de l'arbre mammifère déduite des génomes mitochondriaux entiers. Mol. Phylogénète. Évol. 28, 171-185 (2003).

Article CAS PubMed Google Scholar

Philippe, H. et al. Résoudre les questions phylogénétiques difficiles : pourquoi plus de séquences ne suffisent pas. PLOS Biol. 9, e1000602 (2011).

Article CAS PubMed PubMed Central Google Scholar

Lartillot, N., Brinkmann, H. & Philippe, H. Suppression des artefacts d'attraction à longues branches dans la phylogénie animale à l'aide d'un modèle hétérogène de site. BMC Évol. Biol. 7, S4 (2007).

Article PubMed PubMed Central Google Scholar

Varadharajan, S. et al. Le génome Grayling révèle une sélection sur la régulation de l'expression génique après duplication du génome entier. Génome Biol. Évol. 10, 2785–2800 (2018).

Article CAS PubMed PubMed Central Google Scholar

Lahn, BT & Page, DC Quatre strates évolutives sur le chromosome X humain. Sciences 286, 964–967 (1999).

Article CAS PubMed Google Scholar

Zwaenepoel, A. & Van de Peer, Y. wgd—outils de ligne de commande simples pour l'analyse d'anciennes duplications du génome entier. Bioinformatique 35, 2153–2155 (2019).

Article CAS PubMed Google Scholar

Tiley, GP, Barker, MS & Burleigh, JG Évaluation des performances des tracés Ks pour la détection des anciennes duplications du génome entier. Génome Biol. Évol. 10, 2882–2898 (2018).

PubMed PubMed Central Google Scholar

Zwaenepoel, A., Li, Z., Lohaus, R. & Peer, YV de. Trouver des preuves de duplications du génome entier : une réévaluation. Mol. Usine 12, 133–136 (2019).

Article CAS PubMed Google Scholar

Macqueen, DJ & Johnston, IA Une estimation bien limitée du moment de la duplication du génome entier des salmonidés révèle un découplage majeur de la diversification des espèces. Proc. Biol. Sci. 281, 20132881 (2014).

PubMed PubMed Central Google Scholar

Lartillot, N., Lepage, T. & Blanquart, S. PhyloBayes 3 : un progiciel bayésien pour la reconstruction phylogénétique et la datation moléculaire. Bioinformatique 25, 2286-2288 (2009).

Article CAS PubMed Google Scholar

Thorne, JL, Kishino, H. & Painter, IS Estimation du taux d'évolution du taux d'évolution moléculaire. Mol. Biol. Évol. 15, 1647–1657 (1998).

Article CAS PubMed Google Scholar

Lartillot, N. & Philippe, H. Un modèle de mélange bayésien pour les hétérogénéités inter-sites dans le processus de remplacement des acides aminés. Mol. Biol. Évol. 21, 1095-1109 (2004).

Article CAS PubMed Google Scholar

Giles, S., Xu, G.-H., Near, TJ et Friedman, M. Les premiers membres de la lignée des «fossiles vivants» impliquent une origine plus tardive des poissons à nageoires rayonnées modernes. Nature 549, 265-268 (2017).

Article ADS CAS PubMed Google Scholar

Kaldy, J. et al. Hybridation de l'esturgeon russe (Acipenser gueldenstaedtii, Brandt et Ratzeberg, 1833) et du spatulaire américain (Polyodon spathula, Walbaum 1792) et évaluation de leur descendance. Gènes 11, 753 (2020).

Article PubMed PubMed Central Google Scholar

Ocampo Daza, D., Bergqvist, CA et Larhammar, D. L'évolution des gènes des récepteurs de l'ocytocine et de la vasotocine chez les vertébrés à mâchoires : un cas clair de duplications de gènes par des duplications ancestrales du génome entier. Devant. Endocrinol. 12, 792644 (2022).

Article Google Scholar

Davesne, D. et al. Les structures cellulaires fossilisées identifient une origine ancienne pour la duplication du génome entier des téléostéens. Proc. Natl Acad. Sci. 118, e2101780118 (2021).

Article CAS PubMed PubMed Central Google Scholar

Grande, L., Jin, F., Yabumoto, Y. & Bemis, WE Protopsephurus liui, un spatule primitif bien conservé (Acipenseriformes : Polyodontidae) du Crétacé inférieur de Chine. J. Vertébr. Paléontol. 22, 209–237 (2002).

Article Google Scholar

Swisher, CC et al. Appui supplémentaire à un âge crétacé pour les lits de dinosaures à plumes du Liaoning, Chine : nouvelle datation 40Ar÷39Ar des formations Yixian et Tuchengzi. Menton. Sci. Taureau. 47, 136–139 (2002).

Google Scholar

Benton, MJ et al. Contraintes sur l'échelle de temps de l'histoire évolutive des animaux. Paléontol. Électron 18, 1–107 (2015).

Google Scholar

Fawcett, JA, Maere, S. & Van de Peer, Y. Les plantes à double génome auraient peut-être eu de meilleures chances de survivre à l'événement d'extinction du Crétacé-Tertiaire. Proc. Natl Acad. Sci. États-Unis 106, 5737–5742 (2009).

Article ADS CAS PubMed PubMed Central Google Scholar

Bemis, WE, Findeis, EK & Grande, L. Un aperçu des Acipenseriformes. Environ. Biol. Poissons 48, 25–71 (1997).

Article Google Scholar

Hilton, EJ & Forey, PL Redescription de † Chondrosteus acipenseroides Egerton, 1858 (Acipenseriformes, † Chondrosteidae) du Lias inférieur de Lyme Regis (Dorset, Angleterre), avec des commentaires sur l'évolution précoce des esturgeons et des polyodons. J. Syst. Paléontol. 7, 427–453 (2009).

Lu, L., Tan, K. & Wang, X. Redescription d'Eochondrosteus sinensis (Acipenseriformes, Actinopterygii) et de son âge géologique. Terre Sci. Devant. 27, 371–381 (2020).

Google Scholar

Bemis, WE & Kynard, B. Rivières Sturgeon: une introduction à la biogéographie acipenseriforme et à l'histoire de la vie. Environ. Biol. Poissons 48, 167–183 (1997).

Hibbins, MS & Hahn, MW Approches phylogénomiques pour détecter et caractériser l'introgression. Génétique 220, iyab173 (2022).

Article PubMed Google Scholar

Smith, JJ et al. Le séquençage du génome de la lamproie marine (Petromyzon marinus) donne un aperçu de l'évolution des vertébrés. Nat. Genet. 45, 415–421 421e1-2 (2013).

Article CAS PubMed PubMed Central Google Scholar

Smith, JJ & Keinath, MC La carte méiotique de la lamproie marine améliore la résolution des anciennes duplications du génome des vertébrés. Génome Res. 25, 1081-1090 (2015).

Article CAS PubMed PubMed Central Google Scholar

Kuraku, S., Meyer, A. & Kuratani, S. Moment des duplications du génome par rapport à l'origine des vertébrés : les cyclostomes ont-ils divergé avant ou après ? Mol. Biol. Évol. 26, 47–59 (2009).

Article CAS PubMed Google Scholar

Emms, DM & Kelly, S. OrthoFinder : inférence d'orthologie phylogénétique pour la génomique comparative. Génome Biol. 20, 238 (2019).

Article PubMed PubMed Central Google Scholar

Venkatesh, B. et al. Le génome du requin éléphant fournit des informations uniques sur l'évolution du gnathostome. Nature 505, 174–179 (2014).

Article ADS CAS PubMed PubMed Central Google Scholar

Tan, M. et al. Le génome du requin baleine révèle des schémas d'évolution de la famille des gènes des vertébrés. eLife 10, e65394 (2021).

Article CAS PubMed PubMed Central Google Scholar

Irisarri, I. et al. Consolidation phylotranscriptomique de l'arbre temporel des vertébrés à mâchoires. Nat. Écol. Évol. 1, 1370-1378 (2017).

Article PubMed PubMed Central Google Scholar

Minh, BQ et al. IQ-TREE 2 : Nouveaux modèles et méthodes efficaces d'inférence phylogénétique à l'ère génomique. Mol. Biol. Évol. 37, 1530-1534 (2020).

Article CAS PubMed PubMed Central Google Scholar

Jones, DT, Taylor, WR & Thornton, JM La génération rapide de matrices de données de mutation à partir de séquences protéiques. Calcul. Appl. Biosci. CABIOS 8, 275–282 (1992).

CAS PubMed Google Scholar

Huerta-Cepas, J., Serra, F. & Bork, P. ETE 3 : Reconstruction, analyse et visualisation des données phylogénomiques. Mol. Biol. Évol. 33, 1635-1638 (2016).

Article CAS PubMed PubMed Central Google Scholar

Wilkinson, M., McInerney, JO, Hirt, RP, Foster, PG & Embley, TM Des clades et des clans : termes pour les relations phylogénétiques dans les arbres non racinés. Tendances Écol. Évol. 22, 114-115 (2007).

Article PubMed Google Scholar

Page, RD & Charleston, MA Du gène à la phylogénie des organismes : les arbres réconciliés et le problème de l'arbre à gènes/arbre à espèces. Mol. Phylogénète. Évol. 7, 231-240 (1997).

Article CAS PubMed Google Scholar

Équipe de base R. R : Un langage et un environnement pour le calcul statistique. (Fondation R pour le calcul statistique, 2021).

Eddy, SR Accélération des recherches de profil HMM. Calcul PLOS. Biol. 7, e1002195 (2011).

Article ADS MathSciNet CAS PubMed Central Google Scholar

Le, SQ, Lartillot, N. & Gascuel, O. Modèles de mélanges phylogénétiques pour les protéines. Philos. Trans. R. Soc. B Biol. Sci. (2008) https://doi.org/10.1098/rstb.2008.0180.

Le, SQ & Gascuel, O. La prise en compte de l'accessibilité des solvants et de la structure secondaire dans la phylogénétique des protéines est clairement bénéfique. Syst. Biol. 59, 277-287 (2010).

Article CAS PubMed Google Scholar

Si Quang, L., Gascuel, O. & Lartillot, N. Modèles de mélange de profils empiriques pour la reconstruction phylogénétique. Bioinformatique 24, 2317-2323 (2008).

Article Google Scholar

Redmond, AK & McLysaght, A. Preuve que les éponges sont sœurs de tous les autres animaux à partir de la phylogénomique partitionnée avec des modèles de mélange et du recodage. Nat. Commun. 12, 1783 (2021).

Article ADS CAS PubMed PubMed Central Google Scholar

Redmond, AK, Macqueen, DJ & Dooley, H. Phylotranscriptomics suggère que l'ancêtre vertébré à mâchoires pourrait générer divers sous-ensembles de lymphocytes T auxiliaires et régulateurs. BMC Évol. Biol. 18, 169 (2018).

Article CAS PubMed PubMed Central Google Scholar

Danecek, P. et al. Douze ans de SAMtools et BCFtools. GigaScience 10, giab008 (2021).

Article PubMed PubMed Central Google Scholar

Pedersen, BS & Quinlan, AR Mosdepth : calcul de couverture rapide pour les génomes et les exomes. Bioinformatique 34, 867–868 (2018).

Article CAS PubMed Google Scholar

Krzywinski, MI et al. Circos : Une esthétique de l'information pour la génomique comparative. Génome Res. (2009) https://doi.org/10.1101/gr.092759.109.

Capella-Gutiérrez , S. , Silla-Martínez , JM & Gabaldón , T. trimAl : un outil pour l'ajustement automatisé de l'alignement dans les analyses phylogénétiques à grande échelle. Bioinformatique 25, 1972–1973 (2009).

Article PubMed PubMed Central Google Scholar

Criscuolo, A. & Gribaldo, S. BMGE (Block Mapping and Gathering with Entropy): un nouveau logiciel pour la sélection de régions informatives phylogénétiques à partir d'alignements de séquences multiples. BMC Évol. Biol. 10, 210 (2010).

Article PubMed PubMed Central Google Scholar

Yang, Z. & Rannala, B. Estimation bayésienne des temps de divergence des espèces sous une horloge moléculaire à l'aide de multiples étalonnages fossiles avec des limites souples. Mol. Biol. Évol. 23, 212–226 (2006).

Article CAS PubMed Google Scholar

Inoue, J., Donoghue, PCJ & Yang, Z. L'impact de la représentation des calibrations fossiles sur l'estimation bayésienne des temps de divergence des espèces. Syst. Biol. 59, 74–89 (2010).

Article PubMed Google Scholar

Frey, L. et al. L'élasmobranche précoce Phoebodus : relations phylogénétiques, écomorphologie et nouvelle échelle de temps pour l'évolution des requins. Proc. R. Soc. B Biol. Sci. 286, 20191336 (2019).

Article Google Scholar

Redmond, A., Casey, D., Gundappa, MK, Macqueen, DJ et McLysaght, A. Sturgeon-Paddlefish Whole Genome Duplication Data. (2023) https://doi.org/10.6084/m9.figshare.19762963.v1.

Télécharger les références

Nous remercions le Dr Matthias Stöck d'avoir partagé l'annotation du génome de l'esturgeon sterlet. Nous remercions le Dr Sam Giles d'avoir souligné la nécessité de tenir compte de l'impact de l'exclusion de certains étalonnages fossiles. AKR est soutenu par une bourse postdoctorale du Conseil irlandais de la recherche du gouvernement irlandais (GOIPD / 2021/466). Ce travail a été soutenu par un financement du Conseil européen de la recherche, accord de subvention 771419 (A.McL.).

Smurfit Institute of Genetics, Trinity College Dublin, Dublin, Irlande

Anthony K. Redmond, Dearbhaile Casey et Aoife McLysaght

The Roslin Institute and Royal (Dick) School of Veterinary Studies, Université d'Édimbourg, Édimbourg, Royaume-Uni

Manu Kumar Gundappa et Daniel J. Macqueen

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

AKR et A. McL. a conçu l'étude avec la contribution de DJM et MKGAKR et DC a effectué des analyses. AKR et A. McL. résultats analysés et interprétés. AKR, A.McL., DJM et DC ont rédigé l'article.

Correspondance à Aoife McLysaght.

Les auteurs ne déclarent aucun intérêt concurrent.

Nature Communications remercie les évaluateurs anonymes pour leur contribution à l'évaluation par les pairs de ce travail. Un dossier d'examen par les pairs est disponible.

Note de l'éditeur Springer Nature reste neutre en ce qui concerne les revendications juridictionnelles dans les cartes publiées et les affiliations institutionnelles.

Libre accès Cet article est sous licence Creative Commons Attribution 4.0 International, qui permet l'utilisation, le partage, l'adaptation, la distribution et la reproduction sur n'importe quel support ou format, à condition que vous accordiez le crédit approprié à l'auteur ou aux auteurs originaux et à la source, fournissez un lien vers la licence Creative Commons et indiquez si des modifications ont été apportées. Les images ou tout autre matériel tiers dans cet article sont inclus dans la licence Creative Commons de l'article, sauf indication contraire dans une ligne de crédit au matériel. Si le matériel n'est pas inclus dans la licence Creative Commons de l'article et que votre utilisation prévue n'est pas autorisée par la réglementation légale ou dépasse l'utilisation autorisée, vous devrez obtenir l'autorisation directement du détenteur des droits d'auteur. Pour voir une copie de cette licence, visitez http://creativecommons.org/licenses/by/4.0/.

Réimpressions et autorisations

Redmond, AK, Casey, D., Gundappa, MK et al. Des masques de rediploïdisation indépendants partageaient la duplication du génome entier chez l'ancêtre esturgeon-spairyon. Nat Commun 14, 2879 (2023). https://doi.org/10.1038/s41467-023-38714-z

Télécharger la citation

Reçu : 11 juillet 2022

Accepté : 12 mai 2023

Publié: 19 mai 2023

DOI : https://doi.org/10.1038/s41467-023-38714-z

Toute personne avec qui vous partagez le lien suivant pourra lire ce contenu :

Désolé, aucun lien partageable n'est actuellement disponible pour cet article.

Fourni par l'initiative de partage de contenu Springer Nature SharedIt

En soumettant un commentaire, vous acceptez de respecter nos conditions d'utilisation et nos directives communautaires. Si vous trouvez quelque chose d'abusif ou qui ne respecte pas nos conditions ou directives, veuillez le signaler comme inapproprié.