Femke Morsch
Productmanager SURFconext & team lead trust en identity @SURF Meer over Femke Morsch
Bij SURFconext streven we naar 100% beschikbaarheid. Zo is SURFconext redundant uitgevoerd en draait het platform op 3 verschillende locaties. Het volgende dat we willen verbeteren, is het voorkomen van verstoringen na releases. Ondanks uitgebreide testen en een solide releaseproces, kunnen we momenteel geen 100% zekerheid geven dat alles voor iedereen blijft werken. Daarom gaan we werken met rolling updates: updates die geleidelijk worden uitgevoerd, per groep gebruikers. Zo blijven problemen beheersbaar en hoeft oude software niet teruggezet te worden als er iets misgaat. Hoe werken rolling updates en welke problemen lossen ze op?
In de loop van de jaren is het test- en releaseproces van SURFconext steeds beter geworden. Dit komt omdat we het proces steeds verder aanscherpen en regelmatig releases uitvoeren. Het afgelopen collegejaar hebben we bijvoorbeeld al 18 keer gereleased.
Voordat de software in productie is genomen, is er al heel wat gebeurd:
Nieuwe releases worden altijd een week van tevoren aangekondigd, zodat bij eventuele problemen instellingen en dienstaanbieders weten dat er aan onze zijde iets veranderd is
Dit proces loopt goed, maar toch zijn er een aantal nadelen aan deze methode:
We willen deze nadelen graag wegnemen en hiervoor is een andere manier van releasen nodig: rolling updates.
Bij een rolling update gebruikt eerst een klein percentage van de gebruikers de nieuwe software en als de monitoring aangeeft dat er geen problemen zijn, wordt dit percentage opgeschroefd. Als dit succesvol verloopt – geen afwijkingen in de monitoring en geen klachten van gebruikers – dan gaan steeds meer gebruikers de nieuwe software gebruiken. Dit is een voorspelbaar en geautomatiseerd proces.
Als de nieuwe software niet succesvol blijkt, dan kan direct naar de oude versie teruggeschakeld worden. Beide versies zijn naast elkaar beschikbaar en kunnen de volledige belasting aan. Het terugzetten van oude software is dan niet meer nodig. Zo zorgen rolling updates ervoor dat de nadelen van de huidige releasemethode worden weggenomen.
In juni zijn we begonnen met rolling updates voor een aantal niet-kritische applicaties. Dit is goed verlopen en het plan is om na september deze manier van updaten ook toe te passen voor de rest van het platform. Voordat we dit gaan doen, zijn er nog een aantal uitdagingen waarmee we aan de slag gaan:
We hebben nog een aantal vragen die we graag samen de aangesloten instellingen willen beantwoorden. Wat is bijvoorbeeld het beste moment om een rolling update uit te voeren? Hoe lang moet een rolling update duren? Hoe zorg ik dat mijn supportdesk op de hoogte is? Ben jij een ICT-manager, service manager of supportdesk medewerker en wil je met ons meedenken over hoe het rolling update proces er uit zou kunnen zien? Stuur een mail naar femke.morsch@surfnet.nl
Productmanager SURFconext & team lead trust en identity @SURF Meer over Femke Morsch
0 Praat mee