معرفی قابلیت VMCP و مفاهیم PDL و APD

Telegram_GEEKBOY

در این مقاله قصد دارم به شما قابلیت جدیدی که در مجموعه VSphere 6.0 اضافه شده است و شما آن را به عنوان VMCP می شناسید را معرفی و تجزیه و تحلیل کنیم، این قابلیت به عنوان یک مکانیزم جدید شناسایی مشکلات مربوط به عدم دسترسی به Host ها در سرویس High Availability معرفی شده است تا نقاط ضعفی که در مکانیزم های شناسایی خطا در HA وجود داشت را برطرف کند. قابلیت VMCP به VSphere این قابلیت را می دهد که بتواند مشکلات مربوط به در دسترس نبودن Storage ها را تشخیص دهد، این قابلیت می تواند بصورت ویژه فرآیند های Permanent Device Loss یا PDL و All Paths Down یا APD که از مفاهیم مهم در سرویس HA هستند.

Timeline

PDL یا Permanent Device Loss چیست؟

Permanent به معنی ثابت و پایدار، Device به معنی دستگاه و Loss هم یعنی از بین رفتن، این ترکیب در واقع یک Event یا یک رخداد در سرویس HA محسوب می شود که ما بصورت خلاصه آنرا PDL می نامیم. زمانی PDL اتفاق می افتد که Storage Array ما کدی از سرویس دریافت می کند که به معنی در دسترس نبود دستگاه مورد نظر است. ساده ترین مثالی که من می توانم برای شما بزنم در مواقعی است که یک LUN خراب می شود و در حالت Failed قرار می گیرد، یا در مثالی دیگر مدیر شبکه ممکن است به اشتباه یا تصادفی از تنظیمات Zone شما WWN را حذف کند. در حالت PDL دستگاه Storage Array ما همچنان می تواند با VSphere ارتباط برقرار کند یا بهتر بگوییم با VSphere Host ها ارتباط برقرار کند اما برای دستگاه پیام های هشدار یا SCSI Sense هایی ارسال می کند و آن را از وضعیت خودش آگاه می کند. زمانیکه وضعیت PDL شناسایی شد Host های موجود و مرتبط با Storage Array ما دیگر دستورات I/O برای Storage ما ارسال نخواهند کرد و Host نیز متوجه می شود که دستگاه مورد نظر در دسترس نمی باشد و نیازی به ارسال کردن اطلاعات I/O به این دستگاه دیگر نمی باشد.

APD یا All Path Down چیست؟

اگر VSphere Host های ما نتوانند با دستگاه Storage ما ارتباط برقرار کنند و هیچگونه کد PDL ای نیز به از طریق SCSI Code به سمت Host ما ارسال نشود از نظر سیستم دستگاه در حالت APD می باشد. این حالت کاملا با حالت PDL متفاوت است زیرا در حالت PDL دستگاه Host ما از وضعیت Storage Array ما با استفاده از کدهای SCSI Code آگاه می شود اما در حالت APD سیستم Host ما هیچ اطلاعاتی در خصوص وضعیت Storage ما نخواهد داشت و درکی از این مورد ندارد که این اتفاق موقتی است یا بصورت دائمی ارتباط قطع شده است. دستگاه ممکن است به مدار برگردد یا هرگز در مدار قرار نگیرد. در زمانیکه حالت APD اتفاق می افتد سیستم Host ما همچنان دستورات I/O خودش را به سمت Storage Device ما ارسال می کند و اینکار تا زمانیکه مهلت زمانی به نام APD Timeout به دست نیاید ادامه پیدا می کند. زمانیکه APD Timeout فرا رسید Host ما دیگر دستورات I/O مربوط به Virtual Machine ها را سمت Storage ارسال نمی کند اما یک نوع I/O خاص فقط برای شناسایی بازگشت Storage همچنان برای Storage ارسال می کند که به هیچ عنوان شامل ترافیک ماشین های مجازی نمی باشد. این ترافیک در واقع بیشتر مربوط به Mount کردن NFS Volume هایی است که بر روی Storage مورد نظر ایجاد شده اند. در اینجاست که ترافیک مربوط به ماشین های مجازی به سمت Storage بصورت کامل قطع خواهند شد. بصورت پیشفرض زمان APD Timeout بصورت 140 ثانیه در نظر گرفته شده است اما شما می توانید با استفاده از پارامتر Misc.APDTimeout در تنظیمات Advanced Settings هر Host این مقدار را تغییر بدهید.

VMCP یا VM Component Protection چیست؟

در حال حاضر قابلیت VSphere HA امکان شناسایی PDL و APD و اعمال برخورد مناسب با آنها را در صورت پیکربندی مناسب را دارد. یعنی به زبان ساده می تواند این اتفاق ها را شناسایی کند و برخورد متناسب با آنها را انجام دهد. اولین گامی که شما باید در ساختار HA انجام دهید این است که قابلیت HA را به همراه VMCP فعال کنید. فعال کردن VMCP بر روی VSphere به این معنی است که شما می خواهید با استفاده از HA Agent های خودتان ماشین های مجازی را در برابر PDL و APD محافظت کنید. فعال کردن VMCP بر روی VSPhere به سادگی تیک زدن چک باکسی است که به همین نام در صفحه مربوطه مشاهده می کنید و هیچ پیچیدگی خاصی ندارد.

16239054148_5a7f40cbae_z

نویسنده: محمد نصیری

اگر شما نیز به رشد دانش خود و به اشتراک گزاری آن با دیگران علاقه مندید می توانید به ما بپیوندید
1 نظر
  1. اشکان می گوید

    مطلب بسیار روان و خوب نگارش شده بود… سپاسگزارم از نویسنده

ارسال یک نظر

آدرس ایمیل شما منتشر نخواهد شد.

این سایت از اکیسمت برای کاهش هرزنامه استفاده می کند. بیاموزید که چگونه اطلاعات دیدگاه های شما پردازش می‌شوند.