Platform Desteği ve Bakımı

Giriş

Çevrimiçi casinoların güvenilir bir şekilde işletilmesi sürekli bakım süreçleri gerektirir: önleyici izleme, olaylara hızlı müdahale, düzenli güncellemeler ve testler. Bakım organizasyonu, maksimum çalışma süresi, güvenli büyüme ve hem oyuncuların hem de operatörlerin memnuniyetinin anahtarıdır.

1. İzleme ve uyarı

Altyapı izleme:
  • "Kaputun altından" CPU, bellek, disk, ana bilgisayarlarda ve konteynerlerde ağ (Prometheus - Grafana).
  • Hizmet ömrü sensörleri (HTTP sağlık kontrolleri, WebSocket hazırlığı, DB pingleri).
Uygulanan izleme:
  • API gecikme metrikleri p95/p99, hata oranı, etkin oturum sayısı.
Uyarı ve tırmandırma:
  • PagerDuty/Slack'te SLA yönelimli uyarıları (p99> 200 ms, 5xx hataları> %1) yapılandırma.
  • Otomatik yanıt için çağrı üzerine döndürme ve çalışma kitaplarıyla tümleştirme.

2. Olay yönetimi

Olay yönetimi:
  • Sınıflandırma (P1-P4), durum meta, komutlarla iletişim.
  • Ölüm sonrası prosedürler: kök neden analizi, RCA raporları, SLA raporları.
Runbook и oyun kitapları:
  • Tipik arızalar durumunda eylem kalıpları (bellek sızıntısı, küme çökmesi, entegrasyon hatası).
  • Otomatik kurtarma komut dosyaları (yeniden başlatma, kapların yeniden birleştirilmesi, DR ortamına geçiş).

3. Yamalar ve Güncellemeler

Sürüm oluşturma:
  • Monorepo + Git etiketleri, mikro hizmetler ve ön uç için Semantik Sürüm Oluşturma.
CI/CD-pipeline:
  • Autotesting (birim, entegrasyon, duman), kanarya bültenleri, mavi/yeşil dağıtım.
  • Regresyonlar sırasında otomatik geri alma (sağlık kontrolleri başarısız oldu).
Bağımlılıkları ve güvenliği güncelleyin:
  • CVE veritabanlarının düzenli taraması (Dependabot, Snyk), kritik güvenlik açıklarının öncelikli yamalanması.
  • Evreleme - performans testleri - prod

4. Yedekleme ve Kurtarma

Veritabanı yedeklemeleri:
  • İşlemsel veritabanları için zamanında kurtarma (PostgreSQL WAL, Oracle RMAN).
  • Saatlik fark yedekleri, günlük tam çekim, haftalık arşivler.
Depolama ve doğrulama:
  • Şifreli bulut kovalarında coğrafi olarak dağıtılmış depolama.
  • Yedekleri doğrulamak için ayda bir kez geri yükleme prosedürlerini test edin.
Felaket Kurtarma (DR):
  • Belgelenmiş DR planı, RTO/RPO hedefleri (RTO ≤ 1 h, RPO ≤ 15 m).
  • İkinci bölgeye/bölgeye çoğaltma, otomatik DNS anahtarlama.

5. Performans ve optimizasyon

Kapasite planlaması:
  • Yük metriklerindeki eğilimlerin analizi, pazarlama kampanyaları için kaynakların planlanması.
Yükleme testi:
  • Tepe komut dosyaları için JMeter/Gatling komut dosyaları (anlık flash spin).
  • Sürümlerden sonra ve büyük promosyonlardan önce düzenli testler.
Temel ve önbellek ayarı:
  • Dizinler, parçalanmalar, tabloların bölünmesi.
  • Redis (tahliye, kalıcılık) ve CDN önbelleğinin kurulması.

6. Güvenlik ve uyumluluk

Pentest ve denetimler:
  • Üç aylık dış penetrasyon testleri, iç kod incelemesi.
Güvenlik açığı yönetimi:
  • SLA odaklı yüksek riskli biletler (CVE ≤ 7).
Standartlara uygunluk:
  • PCI DSS (tarama doğrulaması, kart tokenizasyonu), GDPR hizmeti (PII veri silme).
Sırlar ve anahtarlar:
  • Vault/KMS depolama, her 90 günde bir otomatik anahtar döndürme.

7. Dokümantasyon ve bilgi tabanı

Bilgi tabanı:
  • Runbooks, mimari diyagramlar, DR talimatları ile izdiham/Nosyon.
Onboarding ve eğitim:
  • Düzenli "yangın" analizi, deneyim alışverişi ve yeni araçlarda eğitim.

8. SLA ve kullanıcı desteği

Destek seviyeleri:
  • 7/24 NOC ekibi, L1-L3 mühendisleri.
Destek Metrikleri:
  • MTTR (Ortalama Onarım Süresi) ≤ 30 м, MTTA (Ortalama Kabul Etme Süresi) ≤ 5 м.
İletişim kanalları:
  • Bilet sisteminin entegrasyonu (Jira Servis Yönetimi), Slack, e-posta, telefon.

Sonuç

Casino platformunun destek ve bakım organizasyonu entegre bir yaklaşım gerektirir: sürekli izleme, açık olay yönetimi süreçleri, güvenli güncellemeler için otomatik CI/CD, DR prosedürleri ile düzenli yedeklemeler, sürekli performans testi ve güvenlik standartlarına uygunluk. Bu, yüksek kullanılabilirlik, risklere karşı koruma ve operatörlerin ve oyuncuların platformun istikrarına olan güvenini garanti eder.

Caswino Promo