Vous n'êtes pas identifié(e).
- Contributions : Récentes | Sans réponse
#1 15/02/2013 18:49:12
- archer
- Membre
Dimensionnement d'une base de données de très grande taille
Bonjour,
Je trouve des difficulté pour monter une configuration en terme de matériel et logiciel pour une base de données dans laquelle on va stocker des fichiers à raison de 100 Go par jour sur une durée de 5 ans, ce qui fait un peu près 180 To.
A vrai dire j'ai aucune idée sur la configuration nécessaire pour Postegresql afin de stocker toute cette capacité. Donc je vous demande si vous avez une idée de la partager avec moi.
J'ai entendu dire que Wikipédia utilise aussi Postgresql, mais j'ai pas trouvé comment ils font.
Merci d'avance
Hors ligne
#2 17/02/2013 13:29:00
- gleu
- Administrateur
Re : Dimensionnement d'une base de données de très grande taille
D'une part, quel est votre problème réel ? parce que là, tout ce que je peux vous dire, c'est qu'il vous faudra beaucoup de disques
D'autre part. pour une telle volumétrie, je suppose que vous allez stocker des fichiers dans la base. Ça ne va pas vous faciliter la vie. Êtes-vous certain que vous ne pouvez pas les stocker en dehors de la base et que la base ne contienne que le chemin vers les fichiers ?
Guillaume.
Hors ligne
#3 17/02/2013 16:35:00
- archer
- Membre
Re : Dimensionnement d'une base de données de très grande taille
Merci pour la réponse,
En fait, j'ai trouvé une comparaison entre le stockage de fichiers dans une base de données et le système de fichier (de l'OS) qui favorise la base de données.
Mon problème c'est que je ne sais pas quelle configuration faire. Est ce possible de répartir la base de données sur plusieurs machines? si oui, que dois je installer, et comment dois je le configurer.
Merci encore une fois.
Hors ligne
#4 17/02/2013 19:10:43
- gleu
- Administrateur
Re : Dimensionnement d'une base de données de très grande taille
En fait, j'ai trouvé une comparaison entre le stockage de fichiers dans une base de données et le système de fichier (de l'OS) qui favorise la base de données.
Qui la favorise à quel niveau ? on peut avoir un lien vers cet article ?
En fait, c'est généralement une très mauvaise idée. Ça complique toutes les opérations de maintenance (sauvegarde, VACUUM, ANALYZE, etc), ça n'a pas d'intérêt direct (style recherche dans le champ du document vu qu'il s'agit souvent de documents non "cherchables", comme une image ou un fichier binaire, etc).
Bref, avant d'aller plus loin, il faut s'assurer que les avantages dépassent les inconvénients... et il faut que les avantages que vous avez trouvé sont vraiment intéressants car les inconvénients sont bien réels.
Guillaume.
Hors ligne