2011.08.29 15:21
Szerző: gerbomoncsi
Tinu!
Ez volt a tanyás blogra írva (bemásolom):
Üzenet a rendszergazdától
Sziasztok!
Végre üzent a rendszergazda, még én is csak átfutottam, bemásolom Nektek:
-----------------------------------------
Kedves Barátom, Tisztelt Ügyfelem!
Elnézésedet kérem, hogyha az utóbbi napokban próbáltál bármilyen módon
elérni, azonban több ok miatt, ez nem volt lehetséges.
Egyrészt nem nagyon voltam az otthoni számítógépem (így MSN, Skype,
e-mail) közelében, másrészt pedig a telefonom nem volt nálam, mivel a
hívások mennyisége hátráltatta volna a munkát és egyszerűen nem
engedhettem meg, hogy fél napokat telefonálással töltsek, de ennek oka
ebből a levélből kiderül.
A kérdés, ami mindenkiben ott van, hogy mi történt.
Szerdáról csütörtökre tartó éjszaka az egyik szerverünk eltünt az
internetről. Az eseményről én azonnal értesültem, kértem az Adatpark
munkatársait, hogy a gépet indítsák újra. A gép újraindítása után
semmilyen rendellenességet nem tapasztaltam, a gép napója semmi hibát
nem jelzett. Az időpontokat és eseményeket összeegyeztetve arra
jutottam, hogy a problémát az okozhatta, hogy éjjel elindult a gépről
a biztonsági mentés és közben más feladatok is történtek,
feltételeztem, hogy a gép túl lett terhelve, ezért fagyott le. A gép
újraindítása után hajnalig vártam, hogy a probléma előjön-e, de nem
jött. Ekkor újra elindítattam a biztonsági mentést, a gép pedig
azonnal eltűnt az internetről.
Az Adatparkos kollégák segítségével a gép újraindítását kértem,
azonban nem jött vissza az internetre. Mint kiderült a gép lefagyott
indulás közben és többszöri újraindítást követően sem indult el. Az
Adatparkos kollégák segítségét kérve kiderítették, hogy merevlemez
probléma van. Mivel a gép az Adatpark tulajdona (mi béreljük őket),
ezért úgymond garanciális probléma, azonnal kértem őket, hogy akkor
cseréljék ki. Ekkor leállították (csütörtök reggel) és a
merevlemezeket kivették megvizsgálásra. Mivel nagy mennyiségű adatról
volt szó, ez elég sokáig tartott.
Sajnos a végén azt mondták, hogy szerintük mindkét merevlemez
tönkrement. A gépben ez a két merevlemez úgynevezett RAID tömbben
volt, azaz úgy volt kialakítva a rendszer, hogy minden adat egyszerre
mindkét merevlemezen rajta van, hogyha esetleg az egyik tönkremegy,
akkor a másikon meglegyenek az adatok. Annak valószínűsége, hogy a két
merevlemez egyszerre megy tönkre, az esély kb. 0. Miután közölték az
eredményt, én azonnal személyesen bementem a szerverhez, hogy helyben
oldjuk meg a problémát, mivel ilyen szintű adatvesztést nem
engedhetünk meg magunknak. A rendszer biztonságát figyelembe véve volt
még egy biztonsági mentésünk, ami egy külső gépen helyezkedett el,
gondolva arra, hogy bármilyen katasztrófa esetén a gép tartalma
meglegyen egy független helyen is. Azonban ide (technikai okokból) 1
nappal korábbi állapot került mindig lementésre.
A személyes állapotfelmérés után rájöttem, hogy valószínűleg nem a
merevlemezek mentek tönkre, hanem a számítógép RAID vezérlője, az az
alkatrész, amely a fentebb említett módon mindkét merevlemezre rárakja
az adatokat bármilyen művelet esetén. Ennek meghibásodása okozhatta
azt, hogy az Adatpark munkatársai úgy érzékelték, hogy mindkét
merevlemez meghibásodott, mivel a vezérlő meghibásodása miatt mindkét
merevlemez tartalmát elkezdte összekutyulni.
Gyors gondolkodás után úgy döntöttünk, hogy egy vadonatúj gépbe
belehelyezzük a két merevlemezt, hátha az abban lévő vezérlő helyre
tudja állítani az adatokat, ám ez péntek reggelig nem történt meg,
ezért ekkor úgy döntöttem, hogy a rendszert visszaállítom a külső
biztonsági mentés segítségével az 1 nappal korábbi helyzetbe. Miközben
ez készült, ekkor derült ki, hogy a vezérlőkártya már korábban
tönkremehetett, mivel a külső biztonsági mentés tartalma is hibás
lett.
A rendszerünkben többszintű biztonsági riasztás van beállítva, ezért
is értesültem azonnal a gép lefagyásáról, az adatok lementése minden
nap sikeresen megtörtént, sajnos az adatok mennyisége miatt az adatok
helyességét ellenőrizni sajnos lehetetlen volt.
Röviden. Pénteken kiderült, hogy a rendszer biztonsági mentése
meghibásodott, amiről vissza tudtam volna állítani a rendszert. Ez
azonban elfogadhatatlan hiba, a rendszer alapján visszaállítottam,
hogy a DNS szolgáltatások beinduljanak, majd pedig az Adatpark
munkatársai segítségével nekiálltunk az adatmentésnek.
Gyakorlatilag az életemet csütörtök óta az Adatparkban töltöm, ahol
folyamatosan az adatok visszanyerésén dolgozunk. Jelenleg ott tartunk,
hogy levelezést sikerült visszaállítani szerdai állapotra. Sajnos az
email címek jelszavai nem állnak rendelkezésemre, így átmeneti jelszó
lett beállítva, hogy a levelek beérkezhessenek. A weboldalak és az
adatbázisok mentése folyik jelenleg, próbálunk minden lehetséges
eszközt megragadni, hogy a weboldalak minél hamarabb működhessenek.
Mivel hétvégén az emberek nagy része nem dolgozik, ezért hétvégén az
Adatpark kollégái segítségével dolgoztunk a dolgon, ma pedig külsős
segítséget kapunk, amivel új lehetőségeink lesznek. Az adatok
mentésének és a probléma komplexitása miatt ez a folyamat elég lassú
sajnos és a kimenetele is kétséges. De biztosíthatok mindenki arról,
hogy minden tőlem telhetető megteszek,hogy az adatok sértetlenül meg
legyenek mentve.
Ha időközben esetleg valakinek a teljes tárhelyét sikerül
visszaállítani, akkor azonnal jelezni fogom és a weboldalakat
elindítom.
Addig is megértéseteket és türelmeteket kérem.
Köszönettel:
Nagy Dániel