Outil d’identification génétique des sous-espèces d’abeilles domestiques européennes

June Gorrochategui, Melanie Parejo, Andone Estonba (Applied Genomics and Bioinformatics taldeko ikertzaileak, EHU), Egoitz Galartza (ERBEL)

Protéger la diversité des abeilles domestiques

Les abeilles mellifères (Apis mellifera) présentent des variations considérables dans leur zone de distribution biogéographique et sont composées d’au moins 30 sous-espèces appartenant à différentes lignées évolutives. L’Europe héberge une grande partie de cette diversité avec de nombreuses sous-espèces endémiques représentant quatre de ces lignées évolutives, à savoir la lignée africaine (A), la lignée d’Europe centrale et orientale (C), la lignée d’Europe occidentale et septentrionale (M) et la lignée du Proche-Orient et d’Asie centrale (O). Cependant, l’activité humaine a progressivement réduit à la fois la diversité génétique et la zone de distribution naturelle de certaines abeilles européennes. L’une des craintes liées au commerce et à l’importation de reines à grande échelle, ainsi qu’à la transhumance sur de longues distances, est que les populations d’abeilles domestiques indigènes adaptées à l’environnement soient réduites ou perdues en raison de leur remplacement par des abeilles non indigènes ou simplement par hybridation. Il a été démontré que les abeilles mellifères adaptées localement ont une meilleure capacité de survie. La promotion de l’élevage d’abeilles locales est donc une étape importante vers la durabilité des abeilles à long terme.

De nombreux projets de conservation et de sélection des abeilles mellifères indigènes ont été lancés dans toute l’Europe, y compris des programmes d’élevage. Leur succès dépend de l’accouplement contrôlé et de la surveillance continue de l’ascendance génétique de la population. Cela nécessite un outil d’analyse génétique rapide, précis et facile à utiliser.

Le projet SmartBees a été lancé dans le but de développer de nouveaux outils pour élever et conserver la diversité des abeilles domestiques en Europe. Sur la base d’un échantillonnage exhaustif de la diversité génétique des abeilles domestiques, nous avons conçu un outil moléculaire composé de marqueurs génétiques mononucléotidiques (SNP) hautement informatifs, qui permet de déterminer la sous-espèce d’origine de toute abeille domestique européenne analysée.

Procédure

Au total, 22 populations ont été échantillonnées, représentant les quatre lignées évolutives européennes ainsi que 14 sous-espèces réparties de manière native en Europe et dans les régions adjacentes (Figure 1). Chaque population sélectionnée comprenait une centaine d’abeilles ouvrières provenant de colonies non apparentées, soit au total plus de 2000 échantillons finaux, ce qui constitue l’échantillonnage le plus complet des abeilles européennes à ce jour.

Figure 1. Origine des 22 populations échantillonnées initialement. Dans chaque population, ~100 abeilles ouvrières ont été obtenues. Tous proviennent de colonies non apparentées et, si possible, de ruchers différents. Au total, >2000 abeilles ont été échantillonnées.

Sur la base des données de séquençage, nous avons sélectionné les marqueurs génétiques les plus informatifs pour l’ascendance. C’est-à-dire les marqueurs génétiques qui distinguent le mieux les 14 sous-espèces d’abeilles européennes. Au total, il existe plus de 4 000 polymorphismes nucléotidiques simples (SNP). Nous avons ensuite génotypé individuellement les 100 échantillons de chaque population, avec un total de >2000 abeilles. Ces données de génotypage ont été visualisées à l’aide d’un diagramme appelé «t-SNE manifold plot», qui tente de regrouper les échantillons de manière aussi compacte que possible dans une carte bidimensionnelle dans laquelle chaque individu est représenté par un symbole différent (figure 2). Les échantillons sont regroupés en fonction de leur lignée évolutive ou de leur sous-espèce dans des clusters isolés (nuages de points). La seule sous-espèce de la lignée A dans notre étude, A. m. ruttneri, est placée au milieu, intermédiaire aux autres clusters. Dans la lignée O, les abeilles A. m. cypria sont complètement séparées de A. m. anatoliaca, A. m. caucasia et A. m. remipes, qui sont moins différenciées. Les deux sous-espèces de la lignée M sont bien différenciées, les populations d’A. m. mellifera étant regroupées en trois sous-ensembles représentant des régions d’échantillonnage éloignées (région de Burzyan, Russie, sous-groupe supérieur d’A. m. mellifera dans la figure 2) ou isolées (île de Læsø, Danemark, sous-groupe inférieur d’A. m. mellifera). Les échantillons de la lignée C sont regroupés en trois sous-groupes : (i) A. m. ligustica, (ii) A. m. carnica incluant une partie des échantillons d’A. m. carpatica et (iii) un sous-groupe hétérogène d’A. m. macedonica, A. m. cecropia, A. m. adami, A. m. rodopica et le reste des abeilles A. m. carpatica.

Figure 2 : Visualisation (t-SNE manifold plot, similaire à l’analyse en composantes principales, ACP) des données de génotypage des échantillons de la figure 1 génotypés individuellement pour >4000 SNP. Il est important de noter que ce type de graphique tente de regrouper les échantillons de manière aussi compacte que possible afin d’obtenir un regroupement optimal. Pour cette raison, les distances relatives entre les clusters et les échantillons individuels ne représentent pas la différenciation évolutive ou la parenté génétique. Par exemple, A. m. cypria et le sous-groupe supérieur de A. m. mellifera sont génétiquement très éloignés, même s’ils apparaissent comparativement proches dans ce graphique t-SNE.

Échantillons de test supplémentaires et modèle d’apprentissage automatique

En outre, 1900 autres échantillons d’abeilles ouvrières provenant de différents ruchers d’élevage SmartBees à travers l’Europe ont été génotypés. Ces 1900 échantillons, ainsi que les 2000 déjà génotypés (au total >3900 échantillons) ont été utilisés pour construire un modèle statistique qui classifie les abeilles européennes en utilisant des algorithmes d’apprentissage automatique. Ce modèle calcule la probabilité qu’un échantillon donné appartienne à l’une des 14 sous-espèces différentes. L’avantage d’utiliser un modèle d’apprentissage automatique est qu’il ne repose sur aucune hypothèse préalable, ce qui permet de révéler des différences subtiles. Ceci était particulièrement pertinent pour notre étude en raison du grand nombre de sous-espèces étroitement liées que nous voulions discriminer. Plus de détails sur les méthodes de classification spécifiques peuvent être trouvés dans notre publication scientifique (Momeni et al. 2021).

Précision de la classification des sous-espèces

Le modèle a correctement classé la majorité des échantillons avec une précision moyenne de 96,2%. Ces résultats sont mieux visualisés par une matrice de confusion, qui indique les pourcentages d’échantillons dont le modèle a prédit correctement ou incorrectement la présence (figure 3). Les chiffres de la diagonale centrale indiquent le pourcentage d’échantillons correctement classés, tandis que les triangles supérieurs et inférieurs indiquent les échantillons mal classés. Une classification erronée est considérée comme telle lorsque les échantillons prédits par le modèle sont une sous-espèce différente de celle étiquetée. Ces erreurs sont dues à un étiquetage incorrect des échantillons de test ou à une différenciation limitée entre les populations de référence en raison de la proximité géographique ou de l’intervention humaine.

Pour l’application du modèle dans les programmes de conservation et de reproduction, nous avons fixé un seuil minimum de 90%. Si la prédiction d’un échantillon est inférieure au seuil de 90%, il est considéré comme « non attribué », tandis que s’il dépasse le seuil, il est attribué à la sous-espèce correspondante.

Figure 3 : Matrice de confusion pour les échantillons analysés, reflétant les pourcentages (arrondis) d’individus réellement assignés (diagonale) et les pourcentages d’individus assignés à une sous-espèce différente en utilisant un seuil de 90%. Certains échantillons sont considérés comme « non attribués » et sont exclus de la matrice de confusion, comme c’est le cas pour Ruttneri, où 100% des échantillons ont été correctement classés mais où il y avait deux échantillons non attribués. C’est également le cas pour Carnica, avec 99% des échantillons correctement attribués mais 70 non attribués. Ce n’est pas le cas avec Cecropia, où 92% des échantillons ont été correctement attribués, tandis que 4% ont été mal classés comme Macedonica ou Mellifera.

Les défis de la diversité et les prochaines étapes

La diversité considérable des abeilles européennes a constitué un défi pour la conception d’un outil d’identification des sous-espèces. La grande divergence entre les lignées évolutives permet une distinction génétique facile à l’aide de quelques SNP. Cependant, la différenciation des sous-espèces a été plus difficile, car la divergence entre les sous-espèces de la même lignée évolutive s’est produite récemment et, par conséquent, elles sont génétiquement très similaires. En outre, il existe certaines régions d’Europe où la variation des sous-espèces d’A. mellifera n’a pas encore été décrite de manière exhaustive, tandis que dans d’autres, l’introduction artificielle d’autres sous-espèces brouille les frontières naturelles entre les sous-espèces. Les programmes nationaux d’élevage ont également pu perturber le flux génétique naturel, altérant ainsi le fond génétique des sous-espèces d’origine. Pour cette raison, certaines sous-espèces étaient plus faciles à classer que d’autres et certains échantillons n’ont pas été attribués avec notre outil d’identification. Cependant, il s’agit d’un outil modifiable dynamiquement qui permet d’affiner la base de données de référence et/ou d’inclure davantage de sous-espèces. À cet égard, les recherches en cours indiquent que cette méthode est applicable à A. m. siciliana de Sicile.

Utilité

Grâce à cet outil, il est donc possible de tester de nouveaux échantillons d’abeilles et de déterminer leur origine génétique, ce qui peut être utile dans des applications telles que : pour les apicultrices et apiculteurs qui souhaitent connaître la sous-espèce de leurs abeilles ou savoir si elles sont croisées/hybridées ; pour les gestionnaires de la conservation en Europe, où l’identification des sous-espèces est essentielle pour surveiller le taux d’hybridation des colonies dans les zones protégées ; pour les vétérinaires afin de contrôler le commerce des reines ; pour les éleveuses afin de certifier la parenté de leurs reines avec la sous-espèce ; et pour les apiculteurs afin de documenter que leur miel a été produit à partir d’une sous-espèce particulière.

Remerciements

Ce travail n’a été possible que grâce aux précieux échantillons fournis par de nombreux apiculteurs, éleveurs d’abeilles et autres collaborateurs, à qui nous adressons nos sincères remerciements. Le projet SmartBees a été financé par la Commission européenne dans le cadre de son programme FP7 KBBE (2013.1.3-02, Grant nr. 613960). Melanie Parejo a reçu une subvention du Gouvernement Basque (IT1233-19).

Pour accéder à la publication scientifique complète: https://bmcgenomics.biomedcentral.com/articles/10.1186/s12864-021-07379-7

Laisser un commentaire