Vous n'êtes pas identifié(e).
- Contributions : Récentes | Sans réponse
Pages : 1
#1 Optimisation » Choix de l'index » 18/11/2018 20:05:58
- ikit
- Réponses : 2
Bonjour,
Je suis en train de concevoir une base de données qui va collecter des données génétiques, et je me demande quel index sera le plus efficace.
Le contexte: en génétique, on va analyser ce qu'on appelle les variants, c'est c'est à dire les parties du génome qui diffèrent par rapport à un autre génome de référence. En moyenne chacun de nous a son génome qui différent d'environ 1% par rapport à celui de référence, ce qui représente environs 1 million de variants par individu.
Un variant se représente sous la forme :
- chr : (chromosome) un entier entre 1 et 25
- pos : (position) un entier entre 1 et MAX_INT64
- ref : (référence) un varchar(32)
- alt : (alternative) un varchar(32)
ce sont ces 4 informations qui définissent de manière unique un variant. et donc c'est là dessus qu'il faut un index pour ensuite pouvoir faire des jointures avec les autres tables qui contiendrons des informations relatives à ces variants.
Qu'est-ce qui est le plus rapide pour chercher un variant : un index sur une nouvelle colonne "hash" qui serait une empreinte calculée avec les 4 autres ? ou bien un index composite sur chr, pos, ref, alt ?
Pages : 1