08/07/2025
لو متابع حريق سنترال رمسيس يبقي اكيد سمعت عن ال single point of failureا اقرا معايا القصه
في شركة كبيرة شغالة في اللوجستيات، عندها سيرفر رئيسي بيشيل كل حاجه:
الشحنات، المرتبات، المخازن، الفرع الرئيسي، والفروع البعيدة، وكله مربوط بالإنترنت والـ VPN، وكل الأجهزة بتسحب من نفس السيستم.
السيرفر محطوط في غرفة صغيرة اسمها Server Room، فيها:
• سيرفر مركزي عليه نظام ERP.
• راوتر كبير من نوع Cisco ISR.
• سويتش رئيسي Layer 3.
• كابل UTP واحد، واصل من الراوتر للسويتش.
• ومن السويتش ده، رايحين كابلات لكل أجهزة الشبكة.
المهندس المسؤول – اسمه كريم – كان مطمئن إن كل حاجه شغالة كويس… السيرفر سريع، الشبكة مستقرة، ومفيش Alarm.
لكن في يوم خميس العصر، قبل الإجازة… الدنيا وقفت.
📉 الـ ERP وقع.
📞 الـ VPN بين الفروع فصل.
💻 الأجهزة مش بتاخد IP.
📦 المخازن مش قادرة تدخل بيانات.
💳 والموظفين بيقولوا “السيستم مش شغال ومش قادرين نقبض!”
كريم جري على السيرفر، فتح الباب… كل حاجة باينة شغالة:
✅ السيرفر منوّر
✅ الراوتر سليم
✅ السويتش منوّر
❌ بس الترافيك = صفر
بدأ يفكر:
• هل DHCP فيه مشكلة؟
• هل DNS واقف؟
• هل فيه IP Conflict؟
• هل فيه Broadcast Storm؟
فتح الـ console… كله سليم، مفيش Errors ولا Logs غريبة.
بص على الكابلات… ولقاها.
الكارثة الحقيقية:
كابل RJ45 الوحيد اللي رابط الراوتر بالسويتش الرئيسي… اتسحب جامد من عامل النظافة وخرج من مكانه.
الكابل ده كان Single Point of Failure، يعني إيه؟
يعني لو حصل فيه أي حاجة – فصل، اتقطع، اتكسر، اتفك – كل الشبكة تقع، حتى لو كل الأجهزة نفسها شغالة.
❗ وده معناه: إنك بنيت شبكة ضخمة، على نقطة واحدة حساسة جدًا… كأنك بتبني عمارة على عمود واحد!
كريم حط الكابل تاني، الشبكة رجعت، والناس فرحت…
لكن ساب الكابل، وقعد على الأرض، وبدأ يكتب خطة Redundancy كاملة:
🔧 الخطة الجديدة علشان نمنع Single Point of Failure:
1. Redundant Links:
يبقى فيه كابلين من الراوتر للسويتش الرئيسي، عن طريق بروتوكول زي EtherChannel أو LACP.
2. Dual Routers:
يبقى فيه راوترين بدل واحد، واحد شغال، والتاني Standby بـ HSRP أو VRRP.
3. Dual Switches:
السويتش الرئيسي ليه نسخة احتياطية، وتكون الأجهزة متوصلة بالسويتشين معًا (Active/Active أو Active/Passive).
4. Monitoring System:
برنامج يراقب حالة الكابلات والـ interfaces ويرن Alarm قبل ما تقع الشبكة.
5. Labeling & Cable Management:
الكابلات متأمنة، مترقمة، ومتحوطة بكوفر، ممنوع حد يقرب منها بدون إذن.
6. Documentation:
رسم توضيحي كامل للشبكة، يوضح إيه اللي هيحصل لو أي مكوّن وقع، وإزاي نتصرف.
وفي الآخر، كريم كتب على السبورة الكبيرة في السيرفر روم:
“اللي يعتمد على نقطة واحدة… هيقع لو النقطة دي اختفت، حتى لو الدنيا كلها حواليه شغالة.”
ومن بعدها، أي شركة اشتغل فيها، أول حاجة بيبص عليها:
“فين الـ Single Point of Failure؟”
لأن الحتة اللي ماتحصلش فيها مصيبة… هي بالظبط المكان اللي جايلك منه أول كارثة.
:
#سنترال
#سيرفر
#تيكنيكال
#نتورك