Miért omlott össze a marsjáró szoftvere?

Miért omlott össze a marsjáró szoftvere?

2004. február 18. 20:12, Szerda
A gép minden különösebb ok nélkül lefagy. Megpróbál újraindulni, de soha nem sikerül teljesen befejezni a bootolást. Egy ilyen folyamatba beleszaladni a Földön is elég kiábrándító, de ez a számítógép több mint százmillió kilométerre, a Marson van.

Már majdnem végeztél egy terjedelmes e-mail megírásával, vagy egy jelentéssel a munkahely felé, amikor a gép minden különösebb ok nélkül lefagy. Megpróbál újraindulni, de soha nem sikerül teljesen befejezni a bootolást. Ezután újra és újra összeomlik, ez minden felhasználó rémálma. Pontosan ez volt az, amivel a földi irányítás szembe találta magát, amikor múlt hónapban a Spirit hirtelen megszakította kommunikációját. A hiba kijavítása, ami megmentette a marsjárót - habár az egész világ őket figyelte - nem sokban különbözött egy földi PC javításától. Az egyetlen különbség az volt, hogy a hardvert a Marsra küldő csapat jobban fel volt készülve a katasztrófahelyzetekre.


Az alaplap a marsjáró rádióizotopokkal melegen tartott belsejében van

Egy 820 millió dolláros küldetés technikai támogatása kényes dolog. A hibákat javító eszközöket még kilövés előtt bele kell építeni a rendszerbe, ezen túl pedig tökéletesen ismerni kell a rendszerek viselkedését. "Szerencsére a tervezési időszak során felkészültünk egy ilyen helyzetre is" - mondta Glenn Reeves, aki a marsjárók szoftvereit ellenőrzi a NASA Sugárhajtómű Laboratóriumában. A stabilitás, megbízhatóság és kiszámíthatóság érdekében a küldetés tervezői nem a semmiből kezdték el a hardver és a szoftver tervezését. Ehelyett olyan eszközökhöz nyúltak, melyeket már használtak az űrben, és a Földön is bizonyítottak.


Jennifer Trosper, a Spirit küldetésvezetője és Glenn Reeves

"A kereskedelmi szoftver használatának előnye, hogy jól ismert és jól alkalmazható" - mondta Mike Deliman, az Almeda központú Wind River Systems Inc. mérnöke, ez a cég készítette a marsjárók operációs rendszerét. "Világszerte többszázezer alkalmazásban használják." A VxWorks nevű operációs rendszer gyökerei egy olyan szoftverig nyúlnak vissza, melyet Francis Ford Coppolának készítettek filmvágáshoz. Azonban a fejlesztők, David Wilner és Jerry Fiddler nagyobb lehetőséget láttak alkotásukban és megalapították a Wind Rivert. A VxWorks 1987-ben jelent meg hivatalosan. Az operációs rendszer olyan rendszerekbe van beágyazva, melyek repülőgépeket, részecskegyorsítókat, gépjárművek blokkolásgátló rendszereit, sőt még szívritmus-szabályzókat is vezérelnek. Ami az űralkalmazásokat illeti sikeresen működött a Mars Pathfinder leszállóegységben, és működik a Mars Odyssey és a Stardust űrszondák esetében is. "Ezek olyan dolgok, melyek nem engedhetnek meg egy meghibásodást" - mondta Deliman.


A manőverek nyomai a marsi porban

A VxWorks fő előnye a Windowszal vagy a Unixszal szemben, hogy elég gyors ahhoz, hogy bármilyen felmerülő helyzetre szinte azonnal reagáljon. "Ha a szívverés szabálytalanná válik, az ember nem akar eltölteni öt percet azzal, hogy megállapítsa mitől vált szabálytalanná" - magyarázta Deliman. "Azonnal meg kell állapítani a rendellenesség okát." Ez jelenleg egyszerűen lehetetlen a Windows és a Unix esetében.

"Biztos vagyok benne, hogy mindenkivel megesett már az, hogy valamilyen műveletet végzett a Windowszal, kiment a hűtőhöz egy italért, készített egy szendvicset, és amikor visszaült a gép elé az még mindig várakozott" - mondta Deliman. "Hasonló a Unix is. Szeret visszatérni a felhasználóhoz, hogy megkérdezze mit is kellene most csinálni." A VxWorks mindössze 32 MB RAM-mal üzemel és részei távolról módosíthatók anélkül, hogy a teljes rendszert újra kellene indítani, emellett pedig könnyen alkalmazkodik a különböző hardverekhez. A marsjárókban a hardver egy RAD6000 elnevezésű számítógép, amit eredetileg a kilencvenes évek elején fejlesztett ki az IBM egyik részlege a Légierő kutatólaborjával és a NASA Sugárhajtómű Laboratóriummal közösen. Jelenleg ez a részleg a BAE Systems Inc. tulajdona.

;
A Spirit által készített panorámakép - egérrel elhúzható!

A RAD6000 sugárvédelmétől eltekintve hasonló az IBM RS6000 szerveréhez, ami jó egy évtizede igen népszerű volt a munkában. Processzora az Apple által 1994 óta használt PowerPC elődje. "Ma 145 darab RAD6000 működik 77 műholdban" - nyilatkozta Vic Scuderi, a BAE Systems űrprogram igazgatója. Annyira megbízható, hogy csupán egy-egy üzemel belőlük a marsjárókban, illetve akárcsak a VxWorks, megtalálható a Mars Pathfinderben és a Stardustban is. A 300.000 dollárba kerülő számítógép a jelenlegi asztali számítógépek sebességének csupán töredékén üzemel, emellett egyéb korlátai is akadnak, mint például a 128 MB RAM, ami ezen a téren a felső határt jelenti. A Spirit és az Opportunity azonban ennél jóval nagyobb flash memóriákat kapott, ugyanolyanokat, mint amiket a digitális fényképezőgépeknél használunk, és mint kiderült ez okozta a Spirit átmeneti leállását is.


Frank Hartman, a nyolc "sofőr" egyike. Az irányítás egy speciális vizualizációs program segítségével történik

Operációs rendszerén keresztül minden számítógépnek nyomon kell követni file-jait, legyen az merevlemezen, vagy a mostani esetben flash memóriában. A hét hónapnyi utazás során több ezer file gyülemlett fel a flashben, gyorsan felemésztve az operációs rendszer számára lefoglalt 32 MB helyet. Több mint kéthétnyi Marson tartózkodás után a Spirit számítógépe alaphelyzetbe állította önmagát, újra és újra. A földi irányítás szemszögéből nézve úgy tűnt, hogy a gép megszakította a kommunikációt. Minden alkalommal, amikor megpróbálta betölteni szoftverét telített memóriával találta szembe magát, ami újabb indításhoz vezetett. Végül az akkuk lemerültek és a gép eljutott ahhoz az esethez, amikor az úgynevezett "Safe Mode" aktiválódik, azaz csak a szükséges file-ok töltődnek be indításkor.

"Amikor eljutott ehhez a diagnosztikai módhoz elkezdtük visszahozni az adatokat, és ekkor kezdünk rájönni mi is történt valójában" - mondta Deliman. A mérnökök elismerték hogy a problémát nem idézhették elő az előzetes tesztelésekkor, mivel az lelassította volna az amúgy is szoros határidővel rendelkező program fejlesztését. "A teljes memória felemésztése a jármű esetében rendkívül súlyos hiba" - ismerte el Reeves. "A szoftver valójában pontosan úgy viselkedett, ahogy vártuk."

Kapcsolódó linkek

Listázás a fórumban 
Adatvédelmi beállítások