فهرست مطالب

نحوه تنظیم مجدد HPE MSA به تنظیمات کارخانه ( reset factory default HPE MSA )

تنظیم مجدد یا راه‌اندازی مجدد سیستم ذخیره‌سازی HPE MSA (Modular Smart Array) برای حل مشکلات یا بازگرداندن آن به حالت پیش‌فرض استفاه می شود . در بعضی از موارد این مشکل پیش می آید که یک گروه دیسک در MSA شما در حالت قرنطینه (QTCR) قرار گرفته باشد و به شما اجازه حذف یا تغییر آن را ندهد در این زمان باید از دستورات “restore defaults” استفاده نمایید . این دستور تنظیمات پیش‌فرض را به کنترلرها برمی‌گرداند از راه‌اندازی مجدد تک تک کنترلرها گرفته تا پاک کردن ابرداده دیسک و حتی بازگرداندن سیستم به تنظیمات پیش‌فرض کارخانه.و سپس هر کنترلر مدیریتی را مجدداً راه‌اندازی می‌کند. تغییرات در تنظیمات رابط میزبان ممکن است باعث از دست رفتن دسترسی به داده‌ها شود و نیاز به پیکربندی مجدد برای بازیابی دسترسی میزبان به ولوم‌ها دارد.

نکته : در استوریج های MSA 2062 ، 2052  که لایسنس در آنها ادد شده است لایسنس ها پاک می شود باید فایل لایسنس را داشته باشید .

دستورات مورد نیاز CLI در استوریج MSA HPE به دسته های زیر تقسیم می شود  :

  1. CLI and users
  2. LDAP and user groups
  3. Disks, disk groups, pools, tiers, and spares
  4. Full disk encryption
  5. Volumes, initiators, hosts, and mapping
  6. Volume groups
  7. Host groups
  8. Snapshots, volume copy, and rollback
  9. Scheduled tasks
  10. Notifications (alerts and events)
  11. System configuration and utilities
  12. Service utilities
  13. API specific
  14. Remote systems
  15. Peer connections and replication
  16. Statistics
  17. Metrics
  18. Update server
  19. Proxy server
  20. Security
  21. Redfish support

برای راهنمای مرجع CLI MSA به آدرس  https://support.hpe.com/hpesc/public/docDisplay?docId=a00105313en_us&docLocale=en_US مراجه نمایید .

برای راه اندازی مجدد MSA HPE باید به چه مواردی توجه کنیم ؟

  1. داشتن کابل اتصال پورت USB CLI
  2.  روش جداسازی خطا
  3. توقف ورودی/خروجی
  4. خرابی کنترلر
  5. جداسازی خطای اتصال سمت میزبان
  6. جداسازی خطای اتصال پورت توسعه ماژول کنترلر
  7. جداسازی خطاهای تکثیر snap از راه دور
  8. رفع هشدارهای ولتاژ و دما
  9. لینک به اسناد مرتبط با محصول

اتصال پورت USB CLI

این رویه‌ها فقط برای استفاده در پیکربندی اولیه و به منظور تأیید موفقیت‌آمیز بودن راه‌اندازی سخت‌افزار در نظر گرفته شده‌اند.

این رویه‌ها برای استفاده به عنوان رویه‌های عیب‌یابی برای سیستم‌های پیکربندی‌شده با استفاده از داده‌های عملیاتی و ورودی/خروجی در نظر گرفته نشده‌اند.

کنترل‌کننده‌های MSA دارای یک پورت CLI با استفاده از فاکتور فرم mini-USB نوع B هستند. اگر پس از کابل‌کشی کامپیوتر به دستگاه USB با مشکل در برقراری ارتباط با پورت مواجه شدید، ممکن است نیاز به دانلود درایور دستگاه (ویندوز) یا تنظیم پارامترهای مناسب از طریق یک دستور سیستم عامل (لینوکس) می باشد.

روش جداسازی خطا

کنترلرهای MSA روش‌های زیادی برای جداسازی خطاها ارائه می‌دهند. این بخش روش‌شناسی اساسی مورد استفاده برای یافتن خطاها در یک سیستم ذخیره‌سازی و شناسایی واحدهای قابل تعویض فیلد (FRU) مرتبط با آن را ارائه می‌دهد.

از SMU برای پیکربندی و آماده‌سازی سیستم پس از تکمیل نصب سخت‌افزار استفاده کنید. به عنوان بخشی از این فرآیند، اعلان رویداد را پیکربندی و فعال کنید تا سیستم در صورت بروز مشکلی که شدت آن در حد یا بالاتر از حد پیکربندی شده است، به کاربر اطلاع دهد. با پیکربندی و فعال‌سازی اعلان رویداد، کاربر می‌تواند اقدامات توصیه شده در پیام اعلان را برای حل مشکل دنبال کند، همانطور که در گزینه‌های ارائه شده در زیر بیشتر مورد بحث قرار گرفته است.

مراحل اولیه جداسازی خطا در زیر فهرست شده‌اند:

جمع‌آوری اطلاعات خطا، از جمله استفاده از LEDهای سیستم.

تعیین محل وقوع خطا در سیستم.

بررسی گزارش‌های رویداد.

در صورت لزوم، خطا را به یک جزء یا پیکربندی مسیر داده ایزوله کنید.

سیستم‌های کابل‌کشی برای فعال کردن استفاده از ویژگی مجاز Remote Snap برای تکثیر حجم‌ها، یکی دیگر از ملاحظات مهم جداسازی خطا مربوط به نصب اولیه سیستم است.

ارورهای رایج ذخیره‌ ساز ام اس ای و نحوه بر طرف کردن آنها برای انجام راه اندازی اولیه

هنگام انجام مراحل جداسازی خطا و عیب‌یابی، گزینه یا گزینه‌هایی را انتخاب کنید که به بهترین وجه با محیط سایت مطابقت دارند. استفاده از هر گزینه (چهار گزینه در زیر شرح داده شده است) منحصر به فرد برای استفاده از گزینه دیگر نیست. کاربر می‌تواند از SMU برای بررسی آیکون‌ها/مقادیر سلامت سیستم و اجزای آن استفاده کند تا مطمئن شود که همه چیز خوب است یا به یک جزء مشکل‌دار بپردازد. اگر کاربر مشکلی را کشف کند، SMU و CLI هر دو متن اقدام پیشنهادی را به صورت آنلاین ارائه می‌دهند. گزینه‌های انجام مراحل اولیه بر اساس دفعات استفاده فهرست شده‌اند:

  1. استفاده از SMU.
  2. استفاده از CLI.
  3. نظارت بر اعلان رویداد.
  4. مشاهده LEDهای محفظه.

استفاده از SMU

SMU از آیکون‌های سلامت برای نمایش وضعیت‌های OK، Degraded، Fault یا Unknown برای سیستم و اجزای آن استفاده می‌کند. SMU کاربر را قادر می‌سازد تا سلامت سیستم و اجزای آن را رصد کند. اگر هر جزء مشکلی داشته باشد، سلامت سیستم Degraded، Fault یا Unknown خواهد بود. از SMU برای یافتن هر جزء دارای مشکل استفاده کنید و اقدامات موجود در فیلد Recommendation را برای حل مشکل آن جزء دنبال کنید.

استفاده از CLI

به عنوان جایگزینی برای استفاده از SMU، کاربر می‌تواند دستور show system را در CLI اجرا کند تا سلامت سیستم و اجزای آن را مشاهده کند. اگر هر جزء مشکلی داشته باشد، سلامت سیستم Degraded، Fault یا Unknown خواهد بود و آن اجزا به عنوان Unhealthy Components فهرست می‌شوند. اقدامات توصیه شده در فیلد توصیه سلامت جزء را برای حل مشکل دنبال کنید.

نظارت بر اعلان رویداد

با پیکربندی و فعال کردن اعلان رویداد، کاربر می‌تواند گزارش‌های رویداد را برای نظارت بر سلامت سیستم و اجزای آن مشاهده کند. اگر پیامی به کاربر بگوید که بررسی کند آیا رویدادی ثبت شده است یا اطلاعات مربوط به یک رویداد را در گزارش مشاهده کند، می‌تواند این کار را با استفاده از SMU یا CLI انجام دهد. با استفاده از SMU، کاربر گزارش رویداد را مشاهده کرده و سپس روی پیام رویداد کلیک می‌کند تا جزئیات مربوط به آن رویداد را مشاهده کند. با استفاده از CLI، کاربر دستور show events detail (با پارامترهای اضافی برای فیلتر کردن خروجی) را اجرا می‌کند تا جزئیات یک رویداد را مشاهده کند.

مشاهده LEDهای محفظه

LEDها را می‌توان روی سخت‌افزار (با مراجعه به توضیحات LED برای مدل محفظه) مشاهده کرد تا وضعیت اجزا را شناسایی کند. اگر مشکلی مانع دسترسی به SMU یا CLI شود، این تنها گزینه موجود است. با این حال، نظارت/مدیریت اغلب در یک کنسول مدیریتی با استفاده از رابط‌های مدیریت ذخیره‌سازی انجام می‌شود، نه اینکه به LEDهای اجزای سخت‌افزاری رک‌شده در خط دید تکیه شود.

انجام مراحل اولیه

از هر گزینه موجود می‌توان در انجام مراحل اولیه شامل روش جداسازی خطا استفاده کرد.

جمع‌آوری اطلاعات خطا

هنگامی که یک خطا رخ می‌دهد، جمع‌آوری هرچه بیشتر اطلاعات مهم است. انجام این کار به کاربر کمک می‌کند تا اقدام صحیح مورد نیاز برای رفع خطا را تعیین کند.

با بررسی خطای گزارش شده شروع کنید:

آیا خطا مربوط به یک مسیر داده داخلی است یا یک مسیر داده خارجی؟

آیا خطا مربوط به یک جزء سخت‌افزاری مانند ماژول درایو دیسک، ماژول کنترلر یا منبع تغذیه است؟

با جداسازی خطا به یکی از اجزای درون سیستم ذخیره‌سازی، کاربر قادر خواهد بود اقدامات لازم را سریع‌تر تعیین کند.

تعیین محل وقوع خطا

هنگامی که کاربر از خطای گزارش شده مطلع شد، LED های محفظه را بررسی کنید. LED های محفظه برای هشدار به کاربران در مورد هرگونه خطای سیستم طراحی شده‌اند و ممکن است همان چیزی باشند که در وهله اول کاربر را از وجود خطا مطلع کرده است.

هنگامی که یک خطا رخ می‌دهد، LED وضعیت شناسه خطا در گوش راست محفظه روشن می‌شود. LED های پشت محفظه را بررسی کنید تا خطا را به FRU، اتصال یا هر دو محدود کنید. LED ها همچنین به کاربر کمک می کنند تا محل FRU گزارش دهنده خطا را شناسایی کند.

از SMU برای تأیید هرگونه خطای یافت شده هنگام مشاهده LED ها استفاده کنید. SMU همچنین ابزار خوبی برای تعیین محل وقوع خطا است اگر LED ها به دلیل موقعیت سیستم قابل مشاهده نباشند. SMU نمایش بصری از سیستم و محل وقوع خطا را در اختیار کاربر قرار می دهد. همچنین می تواند اطلاعات دقیق تری در مورد FRU ها، داده ها و خطاها ارائه دهد.

گزارش های رویداد را بررسی کنید

گزارش‌های رویداد، تمام رویدادهای سیستم را ثبت می‌کنند. هر رویداد دارای یک کد عددی است که نوع رویداد رخ داده را مشخص می‌کند و یکی از شدت‌های زیر را دارد:

بحرانی. خرابی رخ داده که ممکن است باعث خاموش شدن کنترل‌کننده شود. مشکل را فوراً برطرف کنید.

خطا. خرابی رخ داده که ممکن است بر یکپارچگی داده‌ها یا پایداری سیستم تأثیر بگذارد. مشکل را در اسرع وقت برطرف کنید.

هشدار. مشکلی رخ داده که ممکن است بر پایداری سیستم تأثیر بگذارد، اما بر یکپارچگی داده‌ها تأثیری ندارد. مشکل را ارزیابی کرده و در صورت لزوم آن را اصلاح کنید.

اطلاعاتی. تغییر پیکربندی یا حالت رخ داده است، یا مشکلی رخ داده که سیستم آن را اصلاح کرده است. نیازی به اقدام فوری نیست.

گزارش‌های رویداد، تمام رویدادهای سیستم را ثبت می‌کنند. بررسی گزارش‌ها، نه تنها برای شناسایی خطا، بلکه برای جستجوی رویدادهایی که ممکن است باعث بروز خطا شده باشند، بسیار مهم است. به عنوان مثال، اگر کاربر تنظیمات کانال را بدون در نظر گرفتن منابع ذخیره‌سازی اختصاص داده شده به آن تغییر دهد، یک میزبان می‌تواند اتصال به یک گروه دیسک را از دست بدهد. علاوه بر این، نوع خطا می‌تواند به کاربر کمک کند تا مشکل را به سخت‌افزار یا نرم‌افزار تفکیک کند.

جداسازی خطا

گاهی اوقات ممکن است جداسازی یک خطا ضروری باشد. این امر به ویژه در مورد مسیرهای داده صادق است، به دلیل تعداد اجزای تشکیل دهنده مسیر داده. به عنوان مثال، اگر خطای داده سمت میزبان رخ دهد، می‌تواند توسط هر یک از اجزای موجود در مسیر داده ایجاد شود: ماژول کنترلر، کابل، کانکتورها، سوئیچ یا میزبان داده.

گزارش‌های رویداد، تمام رویدادهای سیستم را ثبت می‌کنند. هر رویداد دارای یک کد عددی است که نوع رویداد رخ داده را مشخص می‌کند و یکی از شدت‌های زیر را دارد:

بحرانی. خرابی رخ داده که ممکن است باعث خاموش شدن کنترل‌کننده شود. مشکل را فوراً برطرف کنید.

خطا. خرابی رخ داده که ممکن است بر یکپارچگی داده‌ها یا پایداری سیستم تأثیر بگذارد. مشکل را در اسرع وقت برطرف کنید.

هشدار. مشکلی رخ داده که ممکن است بر پایداری سیستم تأثیر بگذارد، اما بر یکپارچگی داده‌ها تأثیری ندارد. مشکل را ارزیابی کرده و در صورت لزوم آن را اصلاح کنید.

اطلاعاتی. تغییر پیکربندی یا حالت رخ داده است، یا مشکلی رخ داده که سیستم آن را اصلاح کرده است. نیازی به اقدام فوری نیست.

گزارش‌های رویداد، تمام رویدادهای سیستم را ثبت می‌کنند. بررسی گزارش‌ها، نه تنها برای شناسایی خطا، بلکه برای جستجوی رویدادهایی که ممکن است باعث بروز خطا شده باشند، بسیار مهم است. به عنوان مثال، اگر کاربر تنظیمات کانال را بدون در نظر گرفتن منابع ذخیره‌سازی اختصاص داده شده به آن تغییر دهد، یک میزبان می‌تواند اتصال به یک گروه دیسک را از دست بدهد. علاوه بر این، نوع خطا می‌تواند به کاربر کمک کند تا مشکل را به سخت‌افزار یا نرم‌افزار تفکیک کند. اگر محفظه راه‌اندازی اولیه نشد

اگر محفظه راه‌اندازی اولیه نشد باشد ممکن است راه‌اندازی اولیه محفظه‌ها تا دو دقیقه طول بکشد.

اسکن مجدد انجام دهید.

سیستم را روشن کنید.

مطمئن شوید که سیم برق به درستی وصل شده است و منبع تغذیه‌ای که به آن متصل است را بررسی کنید.

گزارش رویدادها را برای خطاها بررسی کنید.

تصحیح شناسه‌های محفظه

هنگام نصب سیستمی با محفظه‌های درایو متصل، ممکن است شناسه‌های محفظه با ترتیب کابل‌کشی فیزیکی مطابقت نداشته باشند. این به این دلیل است که ممکن است کنترلر قبلاً در طول آزمایش کارخانه به برخی از همان محفظه‌ها متصل شده باشد و در صورت امکان سعی می‌کند شناسه‌های محفظه قبلی را حفظ کند. برای اصلاح این وضعیت، مطمئن شوید که هر دو کنترلر روشن هستند و با استفاده از SMU یا CLI اسکن مجدد انجام دهید. این کار محفظه‌ها را دوباره مرتب می‌کند، اما اصلاح شناسه‌های محفظه می‌تواند تا دو دقیقه طول بکشد.

برای انجام اسکن مجدد با استفاده از رابط خط فرمان (CLI)، دستور زیر را تایپ کنید:

برای اسکن مجدد با استفاده از SMU:

مطمئن شوید که هر دو کنترلر به طور عادی کار می‌کنند.

یکی از موارد زیر را انجام دهید:

به برگه سیستم اشاره کنید و کانال‌های دیسک اسکن مجدد را انتخاب کنید.

در بخش سیستم، اکشن > کانال‌های دیسک اسکن مجدد را انتخاب کنید.

روی اسکن مجدد کلیک کنید.

ایزوله کردن خطا

گاهی اوقات ممکن است جداسازی یک خطا ضروری شود. این امر به ویژه در مورد مسیرهای داده صادق است، به دلیل تعداد اجزای تشکیل دهنده مسیر داده. به عنوان مثال، اگر خطای داده سمت میزبان رخ دهد، می‌تواند توسط هر یک از اجزای موجود در مسیر داده ایجاد شود: ماژول کنترلر، کابل، کانکتورها، سوئیچ یا میزبان داده.

توقف ورودی/خروجی
هنگام عیب‌یابی خطاهای درایو دیسک و اتصال، به عنوان یک اقدام احتیاطی برای حفاظت از داده‌ها، ورودی/خروجی به گروه‌های دیسک آسیب‌دیده را از همه میزبان‌ها و سیستم‌های راه دور متوقف کنید. به عنوان یک اقدام احتیاطی اضافی برای حفاظت از داده‌ها، توصیه می‌شود که به‌طور منظم از داده‌ها پشتیبان‌گیری برنامه‌ریزی‌شده انجام دهید.

توجه: توقف ورودی/خروجی به یک گروه دیسک یک کار سمت میزبان است و خارج از محدوده این سند قرار می‌گیرد.

هنگام حضور در محل، کاربر می‌تواند با نظارت مختصر بر LEDهای سیستم، تأیید کند که هیچ فعالیت ورودی/خروجی وجود ندارد. هنگام دسترسی از راه دور به سیستم ذخیره‌سازی، این امکان وجود ندارد. از راه دور، کاربر می‌تواند از دستور show disk-group-statistics CLI برای تعیین اینکه آیا ورودی و خروجی متوقف شده است یا خیر، استفاده کند. این مراحل را انجام دهید:

با استفاده از CLI، دستور show disk-group-statistics را اجرا کنید. خروجی‌های Reads و Writes تعداد این عملیات‌هایی را که از آخرین تنظیم مجدد آمار یا از زمان راه‌اندازی مجدد کنترلر رخ داده‌اند، نشان می‌دهند. اعداد نمایش داده شده را ثبت کنید.

دستور show disk-group-statistics را برای بار دوم اجرا کنید. این یک بازه زمانی خاص (فاصله بین درخواست آمار) را برای تعیین اینکه آیا داده‌ها در حال نوشتن یا خواندن از گروه دیسک هستند، فراهم می‌کند. اعداد نمایش داده شده را ثبت کنید.

برای تعیین اینکه آیا در این فاصله زمانی خواندن یا نوشتنی رخ می‌دهد، مجموعه اعداد ثبت شده در مرحله 1 را از اعداد ثبت شده در مرحله 2 کم کنید.

اگر اختلاف حاصل صفر باشد، I/O متوقف شده است.

اگر اختلاف حاصل صفر نباشد، یک میزبان هنوز در حال خواندن یا نوشتن از این گروه دیسک است. به توقف I/O از میزبان‌ها ادامه دهید و مرحله 1 و مرحله 2 را تکرار کنید تا اختلاف در مرحله 3 صفر شود.

برای مشاهده اینجا کلیک کنید. برای اطلاعات بیشتر در مورد کتابخانه اطلاعات سازمانی Hewlett Packard، به راهنمای مرجع CLI مراجعه کنید.

برای اطلاعات بیشتر اینجا کلیک کنید تا عنوان مقاله “روش‌های تشخیصی” را مشاهده کنید.

خرابی کنترلر

در صورت خرابی کنترلر یا قطع برق، حافظه کش به CompactFlash منتقل می‌شود. در طول فرآیند نوشتن در CompactFlash، فقط اجزای مورد نیاز برای نوشتن کش در CompactFlash توسط ابرخازن تغذیه می‌شوند. این فرآیند معمولاً به ازای هر ۱ گیگابایت حافظه کش ۶۰ ثانیه طول می‌کشد. پس از کپی شدن کش در CompactFlash، از برق باقی مانده در ابرخازن برای تازه‌سازی حافظه کش استفاده می‌شود. در حالی که کش توسط ابرخازن نگهداری می‌شود، چراغ LED وضعیت کش با سرعت ۱/۱۰ ثانیه روشن و ۹/۱۰ ثانیه خاموش چشمک می‌زند.

توجه: کش قابل حمل فقط برای پیکربندی‌های تک کنترلری اعمال می‌شود. در پیکربندی‌های دو کنترلری، نیازی به انتقال کش از یک کنترلر خراب به یک کنترلر جایگزین نیست زیرا کش بین کنترلرهای همتا کپی می‌شود (منوط به تنظیمات بهینه‌سازی نوشتن حجم).

اگر کنترلر خراب شده باشد یا شروع به کار نکند، آیا چراغ LED وضعیت کش روشن/چشمک می‌زند؟

  1. در صورتی که وضعیت LED مربوط به حافظه پنهان (Cache) خاموش باشد و کنترلر بوت نشود در صورتی که داده‌های معتبر در فلش وجود داشته باشد به حافظه پنهان انتقال می یابد ؛ در غیر این صورت، ماژول کنترلر را تعویض کنید.
  2. در صورتی که وضعیت LED حافظه پنهان خاموش است و کنترلر بوت می‌شود سیستم داده‌ها را روی دیسک‌ها تخلیه کرده است. اگر مشکل همچنان ادامه داشت، ماژول کنترلر را تعویض کنید.
  3. در صورتی که وضعیت LED حافظه پنهان با نرخ ۱:۱۰ – ۱ هرتز، و کنترلر بوت نمی‌شود به بخش حمل و نقل حافظه پنهان در زیر مراجعه کنید.
  4. در صورتی که وضعیت LED حافظه پنهان با نرخ ۱:۱۰ – ۱ هرتز، و کنترلر بوت می‌شود سیستم در حال انتقال داده‌ها به CompactFlash است. اگر مشکل همچنان ادامه داشت، ماژول کنترلر را تعویض کنید.
  5. در صورتی که وضعیت LED حافظه پنهان با نرخ پلک زدن ۱:۱ – ۱ هرتز، و کنترلر بوت نمی‌شود به بخش حمل و نقل حافظه پنهان در زیر مراجعه کنید.
  6. در صورتی که وضعیت LED حافظه پنهان با سرعت ۱:۱ – ۱ هرتز، و کنترلر بوت می‌شود سیستم در حالت خود-رفرش (self-refresh) است. اگر مشکل همچنان ادامه داشت، ماژول کنترلر را تعویض کنید.

انتقال حافظه پنهان

برای حفظ داده‌های موجود ذخیره شده در CompactFlash، کاربر باید CompactFlash را از کنترلر خراب به کنترلر جایگزین با استفاده از روشی که در دستورالعمل‌های جایگزینی ماژول کنترلر HPE MSA که همراه با ماژول کنترلر جایگزین ارائه شده است، منتقل کند. عدم استفاده از این روش منجر به از دست رفتن داده‌های ذخیره شده در ماژول حافظه پنهان خواهد شد.

توجه: ماژول کنترلر را تنها پس از اتمام فرآیند کپی، که با خاموش بودن یا چشمک زدن LED وضعیت حافظه پنهان با سرعت ۱:۱۰ نشان داده می‌شود، حذف کنید.

جداسازی خطای اتصال سمت میزبان

در حین عملکرد عادی، هنگامی که یک پورت میزبان ماژول کنترلر به یک میزبان داده متصل است، LED وضعیت لینک/فعالیت لینک پورت‌ها سبز است. اگر فعالیت I/O وجود داشته باشد، LED سبز چشمک می‌زند. اگر میزبان‌های داده در دسترسی به سیستم ذخیره‌سازی مشکل دارند و کاربر نمی‌تواند یک خطای خاص را پیدا کند یا نمی‌تواند به گزارش‌های رویداد دسترسی پیدا کند، از روش زیر استفاده کنید. این روش نیاز به زمان از کار افتادگی برنامه‌ریزی شده دارد.

توجه: بیش از یک مرحله را در یک زمان انجام ندهید. تغییر بیش از یک متغیر در یک زمان می‌تواند فرآیند عیب‌یابی را پیچیده کند.

عیب‌یابی اتصال سمت میزبان با پورت‌های میزبان دارای SFP

روش زیر برای محفظه‌های کنترلر SAN مدل MSA 2050 که از کانکتورهای فرستنده-گیرنده قابل اتصال با فرم فاکتور کوچک (SFP) در پورت‌های رابط میزبان 8/16 Gb FC، 10GbE iSCSI یا 1 Gb iSCSI استفاده می‌کنند، اعمال می‌شود. در روش زیر، از SFP و کابل میزبان برای اشاره به هر یک از گزینه‌های SFP واجد شرایط که از پورت‌های کنترل‌کننده شبکه همگرا برای ورودی/خروجی یا تکثیر پشتیبانی می‌کنند، استفاده می‌شود.

توجه: هنگام بروز مشکل در تشخیص مشکلات عملکرد، تعویض یک SFP را در هر زمان در نظر بگیرید تا ببینید آیا عملکرد بهبود می‌یابد یا خیر.

  1. تمام ورودی/خروجی‌ها به سیستم ذخیره‌سازی را همانطور که در بخش «توقف ورودی/خروجی؟» توضیح داده شده است، متوقف کنید.
  2. چراغ LED وضعیت/فعالیت لینک میزبان را بررسی کنید. در صورت وجود فعالیت، تمام برنامه‌هایی که به سیستم ذخیره‌سازی دسترسی دارند را متوقف کنید.
  3. چراغ LED وضعیت حافظه پنهان را بررسی کنید تا مطمئن شوید که داده‌های ذخیره شده در حافظه پنهان کنترل‌کننده به درایوهای دیسک منتقل شده‌اند.

ثابت – حافظه پنهان حاوی داده‌هایی است که هنوز روی دیسک نوشته نشده‌اند.

چشمک‌زن – داده‌های حافظه پنهان در CompactFlash نوشته می‌شوند.

چشمک‌زن در ۱/۱۰ ثانیه روشن و ۹/۱۰ ثانیه خاموش – حافظه پنهان توسط ابرخازن در حال تجدید است.

خاموش – حافظه پنهان تمیز است (هیچ داده نانوشته‌ای وجود ندارد).

4. کابل SFP و میزبان را جدا کرده و از نظر آسیب بررسی کنید.

5. کابل SFP و میزبان را دوباره نصب کنید. آیا چراغ LED وضعیت/فعالیت لینک میزبان روشن است؟

بله – وضعیت را بررسی کنید تا مطمئن شوید که هیچ خطای متناوبی وجود ندارد. اگر خطا دوباره رخ داد، اتصالات را تمیز کنید تا مطمئن شوید که کانکتور کثیف با مسیر داده تداخل ندارد.

خیر – به مرحله بعدی بروید.

6. کابل SFP و میزبان را به پورتی با وضعیت لینک سالم منتقل کنید. این مرحله مشکل را به مسیر داده خارجی (SFP، کابل میزبان و دستگاه‌های سمت میزبان) یا به پورت ماژول کنترلر ایزوله می‌کند. آیا چراغ LED وضعیت لینک/فعالیت لینک میزبان روشن است؟

بله – کاربر اکنون می‌داند که SFP، کابل میزبان و دستگاه‌های سمت میزبان به درستی کار می‌کنند. SFP و کابل را به پورت اصلی برگردانید. اگر چراغ LED وضعیت لینک/فعالیت لینک خاموش باقی بماند، کاربر مشکل را به پورت ماژول کنترلر ایزوله کرده است. ماژول کنترلر را تعویض کنید.

خیر – به مرحله بعدی بروید.

7. SFP را با SFP سالم تعویض کنید. آیا چراغ LED وضعیت لینک/فعالیت لینک میزبان روشن است؟

بله – کاربر مشکل را به SFP ایزوله کرده است. SFP را تعویض کنید.

خیر – به مرحله بعدی بروید.

8. SFP اصلی را دوباره وارد کنید و کابل را با یک کابل سالم تعویض کنید. آیا چراغ LED وضعیت لینک/فعالیت لینک میزبان روشن است؟

بله – کاربر مشکل را به کابل ایزوله کرده است. کابل را تعویض کنید.

خیر – به مرحله بعدی بروید.

9. در صورت وجود، مطمئن شوید که سوئیچ به درستی کار می‌کند. در صورت امکان، با پورت دیگری آزمایش کنید.

10. مطمئن شوید که HBA کاملاً در جای خود قرار گرفته و اسلات PCI روشن و قابل استفاده است.

11. HBA را با یک HBA سالم جایگزین کنید، یا کابل سمت میزبان و SFP را به یک HBA سالم منتقل کنید. آیا چراغ LED وضعیت لینک/فعالیت لینک میزبان روشن است؟

بله – کاربر مشکل را به HBA ایزوله کرده است. HBA را تعویض کنید.

خیر – احتمالاً ماژول کنترلر نیاز به تعویض دارد.

12. کابل و SFP را به پورت اصلی خود برگردانید. آیا چراغ LED وضعیت لینک/فعالیت لینک میزبان روشن است؟

خیر – پورت ماژول کنترلر خراب شده است. ماژول کنترلر را تعویض کنید.

بله – اتصال را برای مدتی تحت نظر داشته باشید. ممکن است این یک مشکل متناوب باشد که می‌تواند با SFPها، کابل‌ها و HBAهای آسیب‌دیده رخ دهد.

جداسازی خطای اتصال پورت توسعه ماژول کنترلر
در طول عملکرد عادی، هنگامی که یک پورت توسعه ماژول کنترلر به محفظه درایو متصل است، چراغ LED وضعیت پورت توسعه سبز است. اگر چراغ LED پورت توسعه پورت‌های متصل خاموش باشد، لینک از کار افتاده است. برای جداسازی خطا از روش زیر استفاده کنید.

این روش نیاز به زمان از کار افتادگی برنامه‌ریزی شده دارد.

توجه: بیش از یک مرحله را در یک زمان انجام ندهید. تغییر بیش از یک متغیر در یک زمان می‌تواند فرآیند عیب‌یابی را پیچیده کند.

  1. تمام ورودی/خروجی‌ها به سیستم ذخیره‌سازی را متوقف کنید.
  2. چراغ LED فعالیت میزبان را بررسی کنید. در صورت وجود فعالیت، تمام برنامه‌هایی که به سیستم ذخیره‌سازی دسترسی دارند را متوقف کنید.
  3. چراغ LED وضعیت حافظه پنهان را بررسی کنید تا تأیید کنید که داده‌های ذخیره شده در حافظه پنهان کنترلر به درایوهای دیسک منتقل شده‌اند.

ثابت – حافظه پنهان حاوی داده‌هایی است که هنوز باید روی دیسک نوشته شوند.

چشمک زن – داده‌های حافظه پنهان در CompactFlash نوشته می‌شوند.

چشمک زن در ۱/۱۰ ثانیه روشن و ۹/۱۰ ثانیه خاموش – حافظه پنهان توسط ابرخازن در حال تجدید است.

خاموش – حافظه پنهان تمیز است (هیچ داده نانوشته‌ای وجود ندارد).

4. کابل انبساط را دوباره نصب کنید و آن را از نظر آسیب بررسی کنید. آیا چراغ LED وضعیت پورت انبساط روشن است؟

بله – وضعیت را بررسی کنید تا مطمئن شوید هیچ خطای متناوبی وجود ندارد. اگر خطا دوباره رخ داد، اتصالات را تمیز کنید تا مطمئن شوید که یک کانکتور کثیف با مسیر داده تداخل ندارد.

خیر – به مرحله بعدی بروید.

5. کابل انبساط را به پورتی روی محفظه کنترلر با وضعیت اتصال خوب منتقل کنید. این مرحله مشکل را به کابل انبساط یا پورت انبساط ماژول کنترلر ایزوله می‌کند. آیا چراغ LED وضعیت پورت انبساط روشن است؟

بله – کاربر اکنون می‌داند که کابل انبساط سالم است. کابل را به پورت اصلی برگردانید. اگر چراغ LED وضعیت پورت انبساط همچنان خاموش باشد، کاربر مشکل را به پورت انبساط ماژول کنترلر ایزوله کرده است. ماژول کنترلر را تعویض کنید.

خیر – به مرحله بعدی بروید.

6. کابل انبساط را به پورت اصلی روی محفظه کنترلر برگردانید.

7.کابل انبساط روی محفظه درایو را به یک پورت انبساط سالم روی محفظه درایو منتقل کنید. آیا چراغ LED وضعیت پورت انبساط روشن است؟

بله – کاربر مشکل را به پورت محفظه درایو ایزوله کرده است. ماژول انبساط را تعویض کنید.

خیر – به مرحله بعدی بروید.

8. کابل را با یک کابل سالم تعویض کنید و مطمئن شوید که کابل به پورت‌های اصلی مورد استفاده کابل قبلی متصل است. آیا چراغ LED وضعیت لینک میزبان روشن است؟

بله – کابل اصلی را تعویض کنید. مشکل ایزوله شده است.

خیر – احتمالاً ماژول کنترلر باید تعویض شود.

رفع هشدارهای ولتاژ و دما

با خاموش بودن چراغ LED ولتاژ/خطای فن/نیاز به سرویس روی هر منبع تغذیه، یا با استفاده از SMU برای بررسی وضعیت سلامت محفظه، از کارکرد همه فن‌ها اطمینان حاصل کنید.

در گوشه پایین پاورقی، وضعیت کلی سلامت محفظه با یک نماد وضعیت سلامت نشان داده شده است. برای اطلاعات بیشتر، به برگه سیستم اشاره کرده و View System را انتخاب کنید تا پنل سیستم را ببینید. کاربر می‌تواند از بین نماهای جلو، عقب و جدول در پنل سیستم انتخاب کند. اگر کاربر به یک قطعه اشاره کند، ابرداده و وضعیت سلامت مرتبط با آن روی صفحه نمایش داده می‌شود.

مطمئن شوید که همه ماژول‌ها به طور کامل در اسلات‌های خود با قفل بودن قفل‌ها قرار گرفته‌اند.

مطمئن شوید که هیچ اسلاتی بیش از دو دقیقه باز نمانده است. اگر کاربر نیاز به تعویض ماژول دارد، ماژول قدیمی را در جای خود بگذارید تا ماژول جایگزین را دریافت کند یا از یک ماژول خالی برای پر کردن اسلات استفاده کند. باز گذاشتن یک اسلات بر جریان هوا تأثیر منفی می‌گذارد و می‌تواند باعث گرم شدن بیش از حد محفظه شود.

مطمئن شوید که جریان هوای مناسبی وجود دارد و هیچ کابل یا مانع دیگری جلو یا عقب آرایه را مسدود نکرده است.

سعی کنید هر ماژول منبع تغذیه را یکی یکی تعویض کنید.

ماژول‌های کنترلر را یکی یکی تعویض کنید.

SFPها را یکی یکی تعویض کنید.

مکان‌های حسگرها

سیستم ذخیره‌سازی، شرایط را در نقاط مختلف هر محفظه نظارت می‌کند تا کاربر را از مشکلات مطلع سازد. حسگرهای برق، فن خنک‌کننده، دما و ولتاژ در نقاط کلیدی محفظه قرار دارند. در هر ماژول کنترل‌کننده و ماژول توسعه، پردازنده مدیریت محفظه (EMP) وضعیت این حسگرها را برای انجام عملکردهای خدمات محفظه SCSI (SES) نظارت می‌کند.

بخش‌های زیر هر عنصر و حسگرهای آن را شرح می‌دهند.

سنسورهای منبع تغذیه

هر محفظه دارای دو منبع تغذیه کاملاً افزونه با قابلیت اشتراک‌گذاری بار است. حسگرهای منبع تغذیه شرح داده شده در جدول زیر، ولتاژ، جریان، دما و فن‌ها را در هر منبع تغذیه نظارت می‌کنند. اگر حسگرهای منبع تغذیه ولتاژی را گزارش دهند که کمتر یا بیشتر از آستانه است، ولتاژ ورودی را بررسی کنید.

هر منبع تغذیه شامل دو فن است. محدوده طبیعی سرعت فن ۴۰۰۰ تا ۶۰۰۰ دور در دقیقه است. هنگامی که سرعت فن به زیر ۴۰۰۰ دور در دقیقه کاهش می‌یابد، EMP آن را یک خرابی در نظر می‌گیرد و یک هشدار در گزارش رویداد سیستم ذخیره‌سازی ارسال می‌کند. جدول زیر شرح، محل و وضعیت هشدار برای هر فن را فهرست می‌کند. اگر سرعت فن زیر آستانه ۴۰۰۰ دور در دقیقه باقی بماند، ممکن است دمای محفظه داخلی همچنان افزایش یابد. منبع تغذیه‌ای را که خطا را گزارش می‌دهد، تعویض کنید.

در طول خاموش شدن، فن‌های خنک‌کننده خاموش نمی‌شوند. این امر به محفظه اجازه می‌دهد تا به خنک‌سازی ادامه دهد.

سنسورهای دما

دمای بسیار بالا و پایین در صورت عدم توجه، می‌توانند خسارات قابل توجهی ایجاد کنند. هنگامی که یک خطای دما گزارش می‌شود، باید در اسرع وقت برطرف شود تا از آسیب به سیستم جلوگیری شود. این کار را می‌توان با گرم یا سرد کردن محل نصب انجام داد.

وقتی یک حسگر منبع تغذیه از محدوده خارج می‌شود، چراغ LED خطا/شناسایی به رنگ کهربایی روشن می‌شود و یک رویداد ثبت می‌شود.

سنسورهای ولتاژ ماژول منبع تغذیه

سنسورهای ولتاژ منبع تغذیه اطمینان حاصل می‌کنند که ولتاژ منبع تغذیه محفظه در محدوده طبیعی است. در هر منبع تغذیه سه سنسور ولتاژ وجود دارد.

لطفا به محتوای ما امتیاز بدهید

0 / 5 نتایج رأی گیری 0 تعداد رأی دهندگان 0

رتبه صفحه شما: