10-12-2017، 02:13 PM
قابلیت ASR در سرور های HP یکی از ابزارهای مفید جهت حل مشکل crash در سیستم عامل های مختلف میباشد . در این مستند سعی شده است تا در مورد ASR مطالبی بیان شود.
1 مقدمه
ASR قابلیتی است که به صورت دائم یک سیستم را از جنبههای مختلف مورد ارزیابی قرار میدهد تا در صورت بروز مشکل و خطا، جهت تشخیص و رفع آن به صورت خودکار اقدام نماید.این ویژگی توسط شرکت hp، در سرورهای تولید خود به کار گرفته شده است تا در صورت بروز مشکل در عملکرد سختافزار و سیستم عامل، سیستم را به یک وضعیت مناسب برگرداند.
2 معرفی ASR
تکنولوژی ASR یا Automatic System Recovery این امکان را به سیستم می دهد تا در صورت بروز مشکلات حاد در سیستم عامل نظیر (Blue Screen of death ، ABEND (abnormal end و یاKernel panic سیستم را restart نماید، عمل repair خودکار memory را انجام دهد و یا در صورت fail شدن یک process سیستم را recover کند. در هنگام load شدن سیستم عامل، درایور خاصی تحت عنوان System Management Driver یا همان Health Driver همراه با آن load می شود. هنگامی که سیستم عامل بدون مشکل در حال کار کردن است timer خاصی به نام ASR timer ، که زمان پیش فرض آن10 دقیقه است، به طور مداوم توسط این driverدر فاصله زمانی مشخصی restart می شود. در صورتی که سیستم عامل به درستی عمل نکند و یا به شکلی قفل نماید، این timer پس از اتمام دوره چک کردن، expire شده و سیستم restart می شود. همزمان با restart شدن سیستم یک پیغام log در قسمت login نرم افزار Insight Manager در ویندوز و همچنین در IML در لینوکس درج خواهد شد. به طور پیشفرض قابلیتASR در سرور های hp فعال است و می توان آنرا از طریق نرم افزار Insight Manager در ویندوز و یا(RBSU (ROM-Based Setup Utility در BIOS غیر فعال نمود و زمان پیشفرض مربوط به Timer را تغییر داد.
3 تنظیم ASR در منوی RBSU(Rom-Based Setup Utility)
تنظیم ASR علاوه بر نرمافزارInsight Manager از طریق BIOS سیستم نیز قابل انجام می باشد.برای این کار بایستی در زمان بوت شدن سرور از طریق کلید F9 وارد BIOS سرور شویم.تنظیمات ASR درگزینه Server Availability در منویRBSU در دسترس است.
Server Avalability شامل دو گزینه برای تنظیم ASR می باشد:
1. ASR Status :جهت فعال و غیر فعال کردن ویژگیASR.
2. ASR Timeout: تنظیم زمان تایمر ASR که به صورت پیشفرض 10 دقیقه می باشد.
زمانی که سیستم عامل در وضعیت مناسبی قرار داشته باشد،Health Driver به صورت پیوسته تایمر ASR را ریست میکند تا از صفر شدن تایمر جلوگیری کند. در صورتی که سیستم عامل نتواند جواب دهد و به دلایلی که بعداً ذکر می شود سیستم عامل قفل کرده باشد این تایمر بعد از گذشت زمان تعیین شده صفر شده و Health Driver فرض را بر قفل کردن سیستم عامل گرفته و سرور را reboot خواهد نمود.در اغلب مواردی که ASR عمل می کند یک Log به IML سیستم نیز ارسال می شود.
4 دلایل قفل شدن سیستم عامل
1. خطای یکی از اجزای سخت افزاری سیستم
2. نرم افزار سطح بالا یا Process ای که تمام منابعCPU سیستم را اشغال کرده و اجازه نمیدهد تا CPU به Health Driver تخصیص داده شود تا بتواند تایمر ASR را ریست نماید.
3. نرمافزار یا Process ای که تمام منابع Swape,RAM سیستم را اشغال کرده واجازه تخصیص Memory به Health Driver را نمی دهد.
4. خرابی یکی از اجرای سیستم عامل، مانند خرابی فایل سیستم یا درایور یکی از اجزا
و هر اتفاقی که باعث ایجاد وقفه در عملکرد سیستم عامل شود.
5 عیب یابی جهت رفع و تشخیص نوع خطا
همانطور که در قسمت قبل هم توضیح داده شد ASR ممکن است به دلایل نرم افزاری و یا سخت افزاری اتفاق بیافتد.
مراحل عیب یابی جهت رفع و تشخیص نوع خطای اتفاق افتاده(سختافزار – نرمافزار).
به موارد زیردر مواقع اتفاق افتادن ASR توجه نماید:
1. آیاASR بعد از اضافه کردن یک سختافزار جدید اتفاق افتاده هست؟
2. آیاASR بعد از نصب Patch جدید سیستم عامل،درایور یا Firmware جدید اتفاق افتاده است؟
3. در صورت امکان سختافزار جدید نصب شده،درایور جدید و یا Patch جدید سیستم عامل را حذف کنید.
4. در صورت امکان iLO , Firmware , BIOS سرور را بروزرسانی نمایید.
5. ( SPP (Support Pack for Proliant ) ,PSP (Proliant Support Pack را بسته به مدل سرور بروزرسانی نمایید.
6. NVRAM سرور را از طریق BRSU (همان BIOS سرور) پاک نمایید.منبع : سرور اچ پی
عیب یابی و Log ها:
7. اجرا کردن نرمافزار Insight Diagnostics از CD همراه سرور برای سرورهای G7 و پایین تر.
8. در سرورهای G8 , G9 از iLO سرور استفاده نمایید یا Health System را از iLO فعال نمایید.
9. IML ،Integrated Management Log را از طریق رابط کاربری iLO یا Insight Diagnostics چک نمایید.
10. برای سرورهای ویندوزی میتوان از نرمافزار HPS Report جهت گزارش گیری از تمام قسمتهای سیستم استفاده نمود.
11. برای سرورهای لینوکسی از ابزار Cfg2html برای گزارش گیری کامل استفاده می شود.
1 مقدمه
ASR قابلیتی است که به صورت دائم یک سیستم را از جنبههای مختلف مورد ارزیابی قرار میدهد تا در صورت بروز مشکل و خطا، جهت تشخیص و رفع آن به صورت خودکار اقدام نماید.این ویژگی توسط شرکت hp، در سرورهای تولید خود به کار گرفته شده است تا در صورت بروز مشکل در عملکرد سختافزار و سیستم عامل، سیستم را به یک وضعیت مناسب برگرداند.
2 معرفی ASR
تکنولوژی ASR یا Automatic System Recovery این امکان را به سیستم می دهد تا در صورت بروز مشکلات حاد در سیستم عامل نظیر (Blue Screen of death ، ABEND (abnormal end و یاKernel panic سیستم را restart نماید، عمل repair خودکار memory را انجام دهد و یا در صورت fail شدن یک process سیستم را recover کند. در هنگام load شدن سیستم عامل، درایور خاصی تحت عنوان System Management Driver یا همان Health Driver همراه با آن load می شود. هنگامی که سیستم عامل بدون مشکل در حال کار کردن است timer خاصی به نام ASR timer ، که زمان پیش فرض آن10 دقیقه است، به طور مداوم توسط این driverدر فاصله زمانی مشخصی restart می شود. در صورتی که سیستم عامل به درستی عمل نکند و یا به شکلی قفل نماید، این timer پس از اتمام دوره چک کردن، expire شده و سیستم restart می شود. همزمان با restart شدن سیستم یک پیغام log در قسمت login نرم افزار Insight Manager در ویندوز و همچنین در IML در لینوکس درج خواهد شد. به طور پیشفرض قابلیتASR در سرور های hp فعال است و می توان آنرا از طریق نرم افزار Insight Manager در ویندوز و یا(RBSU (ROM-Based Setup Utility در BIOS غیر فعال نمود و زمان پیشفرض مربوط به Timer را تغییر داد.
3 تنظیم ASR در منوی RBSU(Rom-Based Setup Utility)
تنظیم ASR علاوه بر نرمافزارInsight Manager از طریق BIOS سیستم نیز قابل انجام می باشد.برای این کار بایستی در زمان بوت شدن سرور از طریق کلید F9 وارد BIOS سرور شویم.تنظیمات ASR درگزینه Server Availability در منویRBSU در دسترس است.
Server Avalability شامل دو گزینه برای تنظیم ASR می باشد:
1. ASR Status :جهت فعال و غیر فعال کردن ویژگیASR.
2. ASR Timeout: تنظیم زمان تایمر ASR که به صورت پیشفرض 10 دقیقه می باشد.
زمانی که سیستم عامل در وضعیت مناسبی قرار داشته باشد،Health Driver به صورت پیوسته تایمر ASR را ریست میکند تا از صفر شدن تایمر جلوگیری کند. در صورتی که سیستم عامل نتواند جواب دهد و به دلایلی که بعداً ذکر می شود سیستم عامل قفل کرده باشد این تایمر بعد از گذشت زمان تعیین شده صفر شده و Health Driver فرض را بر قفل کردن سیستم عامل گرفته و سرور را reboot خواهد نمود.در اغلب مواردی که ASR عمل می کند یک Log به IML سیستم نیز ارسال می شود.
4 دلایل قفل شدن سیستم عامل
1. خطای یکی از اجزای سخت افزاری سیستم
2. نرم افزار سطح بالا یا Process ای که تمام منابعCPU سیستم را اشغال کرده و اجازه نمیدهد تا CPU به Health Driver تخصیص داده شود تا بتواند تایمر ASR را ریست نماید.
3. نرمافزار یا Process ای که تمام منابع Swape,RAM سیستم را اشغال کرده واجازه تخصیص Memory به Health Driver را نمی دهد.
4. خرابی یکی از اجرای سیستم عامل، مانند خرابی فایل سیستم یا درایور یکی از اجزا
و هر اتفاقی که باعث ایجاد وقفه در عملکرد سیستم عامل شود.
5 عیب یابی جهت رفع و تشخیص نوع خطا
همانطور که در قسمت قبل هم توضیح داده شد ASR ممکن است به دلایل نرم افزاری و یا سخت افزاری اتفاق بیافتد.
مراحل عیب یابی جهت رفع و تشخیص نوع خطای اتفاق افتاده(سختافزار – نرمافزار).
به موارد زیردر مواقع اتفاق افتادن ASR توجه نماید:
1. آیاASR بعد از اضافه کردن یک سختافزار جدید اتفاق افتاده هست؟
2. آیاASR بعد از نصب Patch جدید سیستم عامل،درایور یا Firmware جدید اتفاق افتاده است؟
3. در صورت امکان سختافزار جدید نصب شده،درایور جدید و یا Patch جدید سیستم عامل را حذف کنید.
4. در صورت امکان iLO , Firmware , BIOS سرور را بروزرسانی نمایید.
5. ( SPP (Support Pack for Proliant ) ,PSP (Proliant Support Pack را بسته به مدل سرور بروزرسانی نمایید.
6. NVRAM سرور را از طریق BRSU (همان BIOS سرور) پاک نمایید.منبع : سرور اچ پی
عیب یابی و Log ها:
7. اجرا کردن نرمافزار Insight Diagnostics از CD همراه سرور برای سرورهای G7 و پایین تر.
8. در سرورهای G8 , G9 از iLO سرور استفاده نمایید یا Health System را از iLO فعال نمایید.
9. IML ،Integrated Management Log را از طریق رابط کاربری iLO یا Insight Diagnostics چک نمایید.
10. برای سرورهای ویندوزی میتوان از نرمافزار HPS Report جهت گزارش گیری از تمام قسمتهای سیستم استفاده نمود.
11. برای سرورهای لینوکسی از ابزار Cfg2html برای گزارش گیری کامل استفاده می شود.