Vous n'êtes pas identifié(e).

#1 17/10/2011 10:34:36

kenrio
Membre

Slony error timeout

Bonjour,

J'ai un petit soucis avec slony, je suppose que vous avez déjà été confronté à ce problème.
J'ai un serveur distant qui se retrouve coupé du réseau ( livebox down ?) pendant quelques minutes !

Et slony ne parvient pas à reprendre la réplication, j'ai cette erreur :

ERROR: remoteListenThread_%d: timeout for event selection

d'après la doc, un simple restart suffit à remettre tout d'aplomb ! mais bon ça m'arrange pas...

et d'après la doc toujours :

Par ailleurs, ceci peut se produire lorsque le démon slon(1) de ce nœud a été en panne pendant longtemps, et qu'il y a une quantité énorme de lignes dans la table sl_event sur ce nœud ou sur d'autres, en attente d'être traitées et qu'il faut plus de slon_conf_remote_listen_timeout secondes pour exécuter la requête SQL

sauf que j'avais que 300 évènements en attente et que le noeud n'était non accéssible que pendant 4min !

Donc si vous avez des infos je suis preneur smile

merci ++

Dernière modification par kenrio (17/10/2011 10:34:48)

Hors ligne

#2 17/10/2011 10:44:34

Marc Cousin
Membre

Re : Slony error timeout

Une perte brutale de connectivité, c'est souvent pas trop bien traité par les programmes réseau: la session reste mort-vivante, et le processus en attente tant qu'il ne s'est pas rendu compte que tout est tombé.

Tu peux peut-être t'en sortir en activant le keepalive tcp dans slony, et en le rendant suffisamment agressif pour qu'il détecte rapidement les sessions TCP qui sont tombées ?
Il faut passer le tcp_keepalive à on et mettre un tcp_keepalive_idle à quelque chose comme 1 minute par exemple. Comme ça toute session inactive depuis une minute sera automatiquement testée par la pile IP.


Marc.

Hors ligne

#3 17/10/2011 11:50:08

kenrio
Membre

Re : Slony error timeout

ok merci Marc, je suis en train de voir aussi du coté du watchdog que j'ai trouvé dans la doc.
Je vais voir tout ça.

Hors ligne

Pied de page des forums