في أبريل ، شهدنا ثلاثة حوادث أسفرت عن تدهور الأداء عبر خدمات GitHub.

11 أبريل 03:05 بالتوقيت العالمي (يدوم 39 دقيقة)

في 11 أبريل ، 2025 ، من الساعة 03:05 UTC إلى 03:44 UTC ، ما يقرب من 75 ٪ من مستخدمي CodeSpaces واجهوا إنشاء وبدء فشل. كانت هذه ناتجة عن تغييرات التكوين اليدوي إلى التبعية الداخلية التي نجت من تغطية الاختبار الخاصة بنا. أدت شاشاتنا وآلية الكشف عن ذلك ، مما ساعدنا على الفرز ، ورد التغييرات ، واستعادة صحة الخدمة.

نحن نعمل على بناء بوابات إضافية ، وآليات أكثر أمانًا للاختبار ، وطرح تغييرات التكوين هذه. لا نتوقع المزيد من الاضطرابات.

23 أبريل 07:00 بالتوقيت العالمي (يدوم 20 دقيقة)

في 23 أبريل ، 2025 ، بين الساعة 07:00 UTC و 07:20 UTC ، شهدت خدمات GitHub متعددة تدهور ناتجة عن خلاف الموارد على مضيفي قاعدة البيانات. أدت معدلات الخطأ الناتجة ، والتي تراوحت بين 2-5 ٪ من إجمالي الطلبات ، إلى تعطيل الخدمة المتقطعة للمستخدمين. تم تشغيل المشكلة من خلال التفاعل بين حمل الاستعلام وتغيير المخطط المستمر الذي أدى إلى تشبع الاتصال. تم استرداد الحادث بعد الانتهاء من هجرة المخطط.

ساعدتنا استثماراتنا السابقة في مراقبة وتحسين كتب اللعب على تنظيم فرق المستجيبين الأولى بشكل فعال ، مما أدى إلى ثورة أسرع للحادث. لقد حددنا أيضًا انحدارًا في أدوات تغيير المخطط التي أدت إلى زيادة استخدام الموارد أثناء المخطط وتعود إلى نسخة مستقرة سابقة.

لمنع مشكلات مماثلة في المستقبل ، نقوم بمراجعة قدرة قاعدة البيانات ، وتحسين أنظمة المراقبة وتنبيه ، وتنفيذ ضمانات لتقليل الوقت للكشف والتخفيف.

23 أبريل 19:13 بالتوقيت العالمي (يدوم 42 دقيقة)

في 23 أبريل 2025 ، بين الساعة 19:13:50 UTC و 22:11:00 UTC ، شهدت خدمة ترحيل Github فشلًا مرتفعًا بسبب تغيير التكوين الذي أدى إلى إزالة الوصول إلى عمال ترحيل المستودع. خلال هذا الوقت ، تأثرت 837 هجرة عبر 57 منظمة. تتطلب الترحيل المتأثر إعادة محاولة بعد رسالة السجل “فشل ترحيل مصدر GIT. رسالة الخطأ: حدث خطأ. يرجى الاتصال بالدعم للحصول على مزيد من المساعدة.” تم عرضه. بمجرد استعادة الوصول ، استأنفت العمليات العادية دون مزيد من الانقطاع.

نتيجة لهذا الحادث ، قمنا بتنفيذ تغطية اختبار محسّنة وعتبات مراقبة مكررة للمساعدة في منع اضطرابات مماثلة في المستقبل.


من فضلك اتبع صفحة الحالة للحصول على التحديثات في الوقت الفعلي حول تغييرات الحالة والتلقيمات بعد الحدود. لمعرفة المزيد حول ما نعمل عليه ، تحقق من Github الهندسة مدونة.

كتبه

جاكوب أوليكسي

Source link


اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *