רמות התשתית (Tier System) של חוות שרתים

Yigal Schneider - מרץ 3, 2018 - 0 comments

בעולם חוות השרתים (Data Centers) נהוג לסווג את רמת תשתית החשמל ומיזוג האוויר במתקן לפי רמה או מדרג הקרויה Tier. המדרג מגדיר למעשה את יכולת התשתית לתמוך ברציפות התפקודית של חוות השרתים. קיימות מס' הגדרות לסיווגים אלו אך הדרך המקובלת ביותר היא זו של מכון ה- Uptime  שטבע את המונחים ואת הגדרותיהם.

בפוסט זה, נבהיר את משמעות ה- Tier System וננפץ מיתוסים שונים וטעויות נפוצות.

 

הגדרת רמות ה-Tier השונות ומשמעותן האופרטיבית

Tier 1 – חוות שרתים עם תשתית בסיסית

 מתקן ייעודי לחוות שרתים ללא יתירות.

דרישות בסיס:

  • אולם ייעודי למערכות IT
  • מערכת אל-פסק שמייצבת את המתח
  • מיזוג אוויר מקצועי (מסוג Precision Cooling) המיועד לעבודה רציפה 24x7x365 (כלומר לא מזגן משרדי) וייעודי רק לחוות השרתים
  • גנרטור – לגנרטור תהיה יכולת לעבוד 12 שעות ברציפות לפחות
  • מיכל דיזל ל 12 שעות

משמעות לרציפות העסקית:

  • בחדר Tier 1 צפויות השבתות כתוצאה מתחזוקה מונעת ומתקלות בלתי צפויות
  • טעויות אנוש ייגרמו להשבתת ציוד IT קריטי מידי פעם
  • כל תקלה בציוד התשתית ובתשתית ההולכה תשבית ציוד IT קריטי
  • המתקן כולו יושבת מידי שנה כדי לבצע תחזוקה מונעת באופן בטיחותי. תקלות ואירועים בלתי צפויים יחייבו השבתות נוספות מידי פעם. הימנעות מביצוע תחזוקה מונעת תגדיל משמעותית את ההסתברות ואת חומרתן ומשך הזמן של תקלות שבר.

 

Tier 2 – חוות שרתים עם יתירות ברכיבי הקיבולת

מתקן ייעודי ובו מתקיימות כל הדרישות של Tier 1  בתוספת יתירות ברכיבי הקיבולת (אל פסק, מיזוג אוויר וכו'). אין יתירות ברכיבי ההולכה (לוחות חשמל, צנרת, ברזים וכ').

יתירות נדרשת ברכיבים הבאים:

  • גנרטור
  • אל פסק (ברמה זו של Tier 2 ניתן להשתמש באל-פסק מודולרי אחד עם יתירות במודולים)
  • מצברים
  • צי'לרים ומערכות מיזוג אוויר פנימיות
  • משאבות
  • מכלי דיזל עם 12 שעות דיזל כ"א

המשמעות לרציפות העסקית:

  • במתקן מחשוב Tier 2 צפויות השבתות כתוצאה מתחזוקה מונעת ומתקלות שבר בלתי צפויות.
  • טעויות אנוש ייגרמו להשבתת ציוד IT קריטי מידי פעם
  • תקלה בציוד התשתית עלולה לגרום להשבתה של ציוד IT קריטי
  • תקלה בתשתית ההולכה תשבית ציוד IT קריטי
  • המתקן כולו יושבת מידי שנה כדי לבצע תחזוקה מונעת באופן בטיחותי. תקלות ואירועים בלתי צפויים יחייבו השבתות נוספות מידי פעם. הימנעות מביצוע תחזוקה מונעת תגדיל משמעותית את ההסתברות ואת חומרת ומשך הזמן של תקלות שבר.

 

Tier 3 – מתקן עם תחזוקה במקביל

במתקן העומד בדרישות Tier 3 קיימת יתירות גם ברכיבי הקיבולת וגם ברכיבי ההולכה של התשתית כך שניתן לקיים עבודת תחזוקה יזומה על כל רכיב במערכת (בין אם תחזוקה ברכיב קיבולת או ברכיב הולכה), ללא השבתה של הציוד הקריטי.

קיימת יתירות ברכיבי ההולכה אך רק נתיב הולכה אחד פעיל בכל נקודת זמן והוא מספיק כדי לקיים את העומס מהציוד הקריטי.

כל ציוד ה- IT חייב להיות עם יתירות בספקי הכוח שיוזנו כ"א מתשתית הולכה שונה. רכיבים שיש להם ספק כוח אחד יוזנו על ידי מתג מסוג STS.

לגנרטורים לא תהיה מגבלת זמן של עבודה רציפה. תהיה יתירות גם במכלי הדיזל וגם בנתיבי ההולכה. נדרש דיזל ל 12 שעות. 

המשמעות לרציפות העסקית:

  • בחוות שרתים מסוג Tier 3 צפויות השבתות כתוצאה מתקלות בלתי צפויות
  • טעויות אנוש ייגרמו להשבתת ציוד IT קריטי מידי פעם
  • תקלה בציוד התשתית ובתשתית ההולכה עלולה להשבית ציוד IT קריטי
  • פעולות לתחזוקה מונעת לא יגרמו להשבתה של ציוד IT קריטי ויבוצעו באמצעות שימוש בנתיב הולכה אחד בעוד נתיב ההולכה השני פעיל ותומך בציוד ה IT הקריטי
  • בעת עבודות התחזוקה המונעת, גדל הסיכון להשבתה של ציוד IT קריטי בשל תקלה בלתי צפויה

 

Tier 4 – מתקן אל-כשל (Fault Tolerant)

בנוסף לכל הדרישות של Tier 3 נוספות הדרישות הבאות:

  • חוות שרתים המסווגת כמתקן אל-כשל תהיה בעלת מערכות עצמאיות, מופרדות פיזית עם יתירות בכל מערכות הקיבולת ועם מערכות הולכה יתירות, אקטיביות, ופעילות בו זמנית.
  • התכנון והביצוע יבטיחו שהמתקן יוכל לתמוך בעומס ה- IT הקריטי לאחר כל תקלה בתשתית.
  • כל רכיבי התשתית (קיבולת והולכה) יהיו מופרדים פיזית זה מזה כך שלאחר כל תקלה המתקן יוכל לתמוך בעומס ה- IT הקריטי.
  • נדרש קירור רציף המבטיח אספקת מיזוג אוויר ללא הפרעה מרגע הפסקת החשמל ועד חזרת אספקת החשמל באמצעות גנרטורים או חח"י.
  • המערכות יגיבו לתקלה באופן אוטומטי ואוטונומי.

המשמעות לרציפות העסקית:

  • במתקן חוות שרתים המסווג Tier 4תקלת שבר אחת מכל סוג בתשתית לא תפגע ברציפות התפקודית.   
  • במתקן חוות שרתים המסווג Tier 4תקלת שבר אחת מכל סוג ברכיבי ההולכה לא תפגע ברציפות התפקודית.   
  • פעולות לתחזוקה מונעת ברכיבי קיבולת וברכיבי הולכה לא יגרמו להשבתה של ציוד IT קריטי.
  • בעת עבודות התחזוקה המונעת, כאשר העבודה מתבצעת על רכיב יתיר, גדל הסיכון להשבתה של ציוד IT קריטי בשל תקלה בלתי צפויה.

הבהרה: הפעלה של מערכת גילוי אש, כיבוי אש או כפתור חירום (EPO) עלול להביא להשבתה של המתקן בחלקו או כולו.

הבהרה לגבי גנרטורים: ברמות 3,4 לגנרטורים לא תהיה מגבלת יצרן להפעלה רציפה בעומס N ללא מגבלת שעות.

ברמות 1,2 אפשרי שתהיה מגבלת שעות להפעלה רציפה של הגנרטורים ובלבד שיכלו לפעול רצוף 12 שעות.

הבהרה לגבי טמפרטורה חיצונית: ברמה 4 המתקן חייב להוכיח יכולת לתמוך באופן מלא בעומס N בטמפרטורות הקיצוניות ביותר שנרשמו באזור המתקן ב 20 שנה האחרונות.

הבהרה לגבי תקשורת: תשתיות הולכת התקשורת באתרים ברמה 3 חייבים ליישם אפשרות לתחזוקה מונעת ללא השבתה בעוד שברמה 4 יש להוסיף גם הפרדה פיזית.

 

לסיכום:

מקור: Uptime Institute

 

ומה בישראל?

בישראל קיים מתקן אחד המוסמך ל- Tier 3 (תחזוקה במקביל) והוא מתקן של בנק הפועלים בעמק חפר. המתקן מוסמך גם ברמת התכנון וגם ברמת המתקן הבנוי. בימים אלו נבנה מתקן מחשוב חדש שיוסמך ל  Tier 4(אל-כשל).

לאלכסנדר שניידר שלושה מומחים מוסמכים כ Accredited Tier Designer של מכון UPTIME והם שלום אביטן, אלכס שינקמן ויגאל שניידר. מוזמנים לפנות אלינו בכל שאלה בנושא.