Պլատֆորմի աջակցություն և ծառայություններ

Ներդրումը

Առցանց կազինոյի հուսալի վիրահատությունը պահանջում է շարունակական ուղեկցման գործընթացներ 'ինդուկտիվ մոնիտորինգ, արագ ստուգում պատահականության, փորձարկման և փորձարկման վրա։ Տեխնիկայի կազմակերպումը առավելագույն ապթայմի, անվտանգ աճի և ինչպես խաղացողների, այնպես էլ օպերատորների բավարարվածության բանալին է։

1. Մոսկվան և Ալերտինգը

Ենթակառուցվածքային ֆորումը

CPU-ի գլխարկի տակ, հիշողությունը, սկավառակը, հանրակացարանների և բեռնարկղերի ցանցը (Prometheus no Grafana)։
Կյանքի ծառայության ցիկլի սենսորները (HTTP health-winks, DB pings)։
Կիրառական ֆորումը

P95/p99 metriks API, error-rate, ակտիվ նստաշրջանների քանակը։
Ալերտինգը և էսկալացիան

SLA կողմնորոշված ալերտների (p99> 200 ms, 5xx-սխալներ> 1%) PagerDuty/Slack-ում։
Ինտեգրումը on-call-ro-ro և runbook 'ami ավտոմատացված ինտեգրման համար։

2. Միջադեպերի կառավարում

Կառավարումը

Classifox (P1-P4), ստատիկ մետալացիա, հաղորդակցություն թիմերի հետ։
Post-mortem-ընթացակարգերը ՝ root-cause analysis, RCA զեկույցներ, SLA-զեկույցներ։
Runbook и playbooks:
  • Գործողությունների ձևանմուշները տիպիկ ձախողումների ժամանակ (հիշողության արտահոսք, շարժիչների նվազում, շարժիչների մերժում)։
  • Ավտոմատ recovery (reboot, բեռնարկղերի փոխանակում, DR-չորեքշաբթի անցում)։

3. Փամփուշտներ և նորարարություններ

Տարբերակների կառավարումը

Monorepo + Git tags, Semantic Versioning միկրովայրցիների և առաջնագծի համար։
CI/CD-expline։

Autotesting (unit, integration, smoke), canary-line, blue/green-depla։
Ավտոմատ rollback-ը վերագրանցման ժամանակ (health-winks չեն անցել)։
Կախվածության և անվտանգության նորարարությունը

Ստացիոնար CVE-2019 (Dependabot, Syk), կրիտիկական խոցելիության գերակայությունը։
Մրցույթի փորձարկումը (staging performent tes.ru)։

4. Պահեստավորում և վերականգնում

Bekaps-ի տվյալները

Point-in-time recovery գործարքային BD-ի համար (PostgreSQL WAL, Oracle RMAN)։
Egchas-bekaps, ամենօրյա fox նկարները, շաբաթական արխիվները։
Պահեստավորում և ստուգում

Գեո-բաշխված պահպանումը ամպային տանկերում կոդավորմամբ։
Թեստային restore ընթացակարգերը ամիսը մեկ անգամ Բեքապների վալիդացիայի համար։
Disaster Recovery (DR):
  • Փաստաթղթավորված DR պլանը, RTO/RPO նպատակները (RTO 351 ժամ, RPO 3515 մ)։
  • Երկրորդ գոտի/տարածք, RF ավտոմատ փոխակերպումը։

5. Արտադրողականություն և օպտիմիզացում

Capacity planning:
  • Բեռնման միտումների վերլուծությունը, ռեսուրսների պլանավորումը մարքեթինգային գործողությունների համար։
  • Load-testing:
    • Ջութակները JMeter/Gatling-ի համար (ակնթարթ spin)։
    • Հիբրիդային փորձարկումը ածխաջրածիններից և մեծ գործողություններից հետո։
    • Բազայի և քեշի թյունինգը

    Ինդեքսները, շարդինգը, աղյուսակների կուսակցությունը։
    Redis (eviction, persistence) և CDN-kesa։

    6. Անվտանգություն և ընկերակցություն

    Պենտեստները և աուդիտները

    Եժեքվարթալ արտաքին penetration tes.ru, ներքին կոդ-ռևիա։
    Խոցելիության կառավարումը

    SLA կողմնորոշված tickets բարձր ռիսկերի վրա (CVE 387)։
    Ստանդարտների համապատասխանությունը

    PCI DSS (սկանավորման ստուգում, քարտեզների խառնուրդ), GDPR ծառայություններ (PII տվյալների հեռացում)։
    Գաղտնիքները և բանալիները

    Vox/KFC պահեստավորումը, ավտոմատ լուծումը կատարվում է յուրաքանչյուր 90 օրվա ընթացքում։

    7. Մոսկվան և գիտելիքը-բազան

    Knowledge Base:
    • Notluence/Notion-ը runbook 'ami, ճարտարապետության սխեմաներ, DR հրահանգներ։
    • Onbording և դասընթացները

    Ռուսական «հրդեհները» վերլուծություններ, փորձի փոխանակում և նոր գործիքներ սովորելը։

    8. SLA և աջակցություն օգտագործողներին

    Աջակցության մակարդակները

    24/7 MSC թիմը, L1-L3 ինժեներները։
    Աջակցության մետրերը

    MTTR (Mean Time To Repair) ≤ 30 м, MTTA (Mean Time To Acknowledge) ≤ 5 м.
    Կապի ալիքները

    Թիկեթ համակարգի ինտեգրումը (Jira Direct Pro), Slack, e-mail, հեռախոսը։

    Եզրակացություն

    Կազինո պլատֆորմի աջակցության և սպասարկման կազմակերպությունը պահանջում է համընդհանուր մոտեցում 'մշտական կարգավորումը, կառավարման հստակ գործընթացները, ավտոմատացված CI/CD-ը անվտանգ ինտեգրման համար, DR-105 բեքապը, արտադրողականության շարունակական փորձարկումը և անվտանգության նորմերը պահպանելը։ Դա երաշխավորում է բարձր հասանելիությունը, պաշտպանությունը և օպերատորների և խաղացողների վստահությունը պլատֆորմի կայունության մեջ։