Bon j'ai remis un coup de force-lock et
ai regardé plus en détail les logs pour comprendre ce qui se
passait.
L'opération forget prend un lock exclusif sur le repository (pour
tous les clients). Si le forget de 0h05 dure plus de 5 minutes, le
forget de 0h10 échoue et pour une raison non identifiée, laisse un
lock derrière.
Comme solution j'ai revu le planning des différentes actions :
- backup H -> B -> Q -> H toutes les 4 heures entre
1h et 21h désormais (au lieu de toutes les 2 heures entre 1h
et 23h)
- backup H <- B <- Q <- H toutes les 4 heures entre
3h et 23h désormais (au lieu de toutes les 2 heures entre 0h
et 22h)
- forget H -> B -> Q -> H à 0h25 désormais (au lieu
de 0h05)
- forget H <- B <- Q <- H à 2h30 désormais (au lieu
de 0h10)
Cf le diff
https://wiki.federez.net/admin:services:backup?do=diff&rev2%5B0%5D=1455664530&rev2%5B1%5D=1456390208&difftype=sidebyside
Ça permet de laisser au minimum environ une heure entre les
opérations de backup et de forget, les opérations de forget étant
espacées de 2 heures et celle de backup de 2 heures aussi.
En espérant que ça ira mieux comme ça.
--
Zertrin
On 25.02.2016 07:41, Cron Daemon wrote: