في فبراير ، شهدنا حادثين أدى إلى تدهور الأداء عبر خدمات GitHub.

25 فبراير 14:25 بالتوقيت العالمي (يدوم ساعتين و 19 دقيقة)

في 25 فبراير ، 2025 ، بين 14:25 UTC و 16:44 UTC والبريد الإلكتروني وإخطارات الويب شهدت تأخير التسليم. في ذروة الحادث ، أدى التأخير إلى حوالي 10 ٪ من جميع الإخطارات التي تستغرق أكثر من 10 دقائق ليتم تسليمها ، مع تسليم 90 ٪ تقريبًا في غضون 5-10 دقائق. كان هذا الحادث ناتجًا عن تجمعات العمال التي تعمل بالقرب من السعة في أوقات الذروة ، مما أدى إلى تأخير في معالجة قائمة الانتظار.

قمنا بتخفيف الحادث من خلال توسيع نطاق الخدمة لتلبية الطلب. لقد أنشأنا منذ ذلك الحين قدرة أساسية أعلى لضمان عدم حدوث المزيد من التأخير ، ونحن نحسن تخطيط قدرتنا على إدارة تجمعنا بشكل استباقي.

3 فبراير 18:01 UTC (مدتها 30 دقيقة)

في 3 فبراير ، 2025 ، الساعة 18:01 بالتوقيت العالمي ، تم الإعلان عن حادث بسبب الإخفاقات في أدوات الترحيل لدينا. تم تتبع السبب الجذري لنشر مكون النظام ، مما أدى إلى فقدان صور Docker ، مما تسبب في انقطاع بنسبة 100 ٪ لجميع المستخدمين الذين يحاولون الترحيل في هذه النافذة. تم تخفيف المشكلة عن طريق التراجع إلى الإصدار المستقر السابق ، واستعادة الخدمة في غضون 30 دقيقة تقريبًا.

لقد قمنا بتحسين تغطية الاختبار وسير العمل لدينا لضمان التحقق من التبعيات الحرجة.


من فضلك اتبع صفحة الحالة للحصول على التحديثات في الوقت الفعلي حول تغييرات الحالة والتلقيمات بعد الحدود. لمعرفة المزيد حول ما نعمل عليه ، تحقق من Github الهندسة مدونة.

كتبه

جاكوب أوليكسي

Source link


اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *