Afleveringen af det nye net fra leverandøren Alcatel-Lucent går fremad, men desværre med en vis forsinkelse, så nettet bliver tidligst klar til at overtage produktionstrafikken i midten af marts.
Sådan som forløbet med afleveringen har været planlagt, var det meningen at der først skulle være en funktionsprøve, og siden en stabilitets- og driftsprøve. Som vi tidligere har skrevet om, har der været en række forsinkelser med at få nettet færdigt, men d. 17/12 var vi i den situation at alle dele af funktionsprøven kunne bestås med undtagelse af management-systemet.
Alle, der var til stede i Kolding til vores indvielses-event, vil have set mig demonstrere en lille del af dette system, hvor man på en grafisk brugergrænseplade kan se status og parametre for alle nettets enheder.
Dets væsentligste problem med systemet - både dengang og nu - er at de enkelte enheder kan tabe forbindelsen til management-systemet, og den eneste måde at få liv i styringen igen, er ved at lave en hard reset af kontrol-kortet ved at rejse ud til enhederne og tage det relevante printkort ud og stoppe det ind igen.
Medens Alcatel har arbejdet på at løse problemet, har vi accepteret at gennemføre stabilitets- og driftsprøverne, for ikke at tabe alt for meget tid. Efter lidt startvanskeligheder med at finde nogle passende test-konfigurationer kom disse tests igang, og de var afsluttet med godt resultat i vinterferien.
I mellemtiden skulle man have opgraderet hardware og software, så problemet med managementsystemet skulle være løst, og alt så også perfekt ud ind til den allersidste prøve hvor en af de to management-servere blev udsat for en strømafbrydelse (med vilje). Den anden management-server tog fint over, men da den første blev tændt igen, mistede vi forbindelsen til en række ILA'er.
Når det sker, påvirker det ikke kørende trafik, men vi kører i blinde, så vi ikke får alarmer mv., og derfor mener vi ikke at systemet er produktionsklart endnu.
Endnu en gang fløj Alcatel et større hold folk fra deres udviklingsafdeling herop for at stille en sikker diagnose, og i fredags (d. 20/2-09) kunne Alcatel meddele at de havde fundet præcis hvad det var for en fejl, vi udløste. Det viser sig at ske når to management-servere kæmper om kontrollen over en enhed og en første
umiddelbar work-around er at vi simpelthen kun kører med et management-system ad gangen.
Det skal vi så prøve medens vi konfigurerer de sidste dele af det kommende produktionsnet og starter med at flytte forbindelser over på nettet som er dækket af redundans andre steder. I midten af marts har
Alcatel så lovet at der kommer en rettelse til den software, der kører på de management-boards, der oplever problemet i dag. Når den rettelse er modtaget, installeret og testet, vil vi formodentlig være klar til produktion, og leverancen fra Alcatel vil være afsluttet.
Kort sagt: Det optiske net kører, men fortsat uden produktionstrafik, og vi har derfor besluttet at forlænge driften af det eksisterende net yderligere i tre måneder.