फास्ट डेटा माइग्रेशन वाले प्लेट

परिचय

प्लेटफॉर्म को बदलते या अपडेट करते समय जानकारी को स्थानांतरित करना एक महत्वपूर्ण कार्य है: शेष राशि, दांव का इतिहास, बोनस, केवाईसी डेटा और अभियान सेटिंग्स को खो या विकृत नहीं किया जा सकता है। आधुनिक समाधान स्वचालित ईटीएल पाइपलाइन और चेंज डेटा कैप्चर (सीडीसी) का उपयोग बिना व्यापार डाउनटाइम के घंटों या मिनटों में माइग्रेशन को पूरा करने के लिए करते हैं।

1. पलायन का वर्गीकरण

1. ठंडा प्रवास

पूर्ण निर्यात-आयात, प्लेटफ़ॉर्म बंद करने
  • कम गतिविधि या नियोजित रखरखाव विंडो के लिए उपयुक्त।
  • 2. गर्म प्रवास
समानांतर chạy ETL + CDC प्रतिकृति, सेकंड में कट-ओवर।
  • राउंड-द-क्लॉक ट्रैफिक वाले बड़े ऑपरेटरों के लिए उपयुक्त।

2. ईटीएल और सीडीसी वास्तुकला

मत्स्यांगना
फ्लोचार्ट एलआर
सबग्राफ स्रोत
DB1 [(पुराना DB)]
स्ट्रीम 1 [(पुराना डीबी सीडीसी)]
अंत
सबग्राफ कन्वेयर
ईटीएल [ईटीएल जॉब]
सीडीसी [सीडीसी उपभोक्ता]
वेलिडेटर [डाटा वैलिडेटर]
अंत
सबग्राफ उद्देश्य
DB2 [(नया DB)]
अंत
 -  ETL -> वेलिडेटर -> DB2
 - -टाइम  सीडीसी -> वैध -> डीबी 2

ईटीएल जॉब: एक बार रात में या एक शेड्यूल पर, टेबल का एक पूरा डंप पढ़ ता है, प्रारूप बदलता है और एक नई योजना में लोड करता है।

CDC उपभोक्ता: WAL लॉग (Debezium/MySQL Binlog), INSERT/UPDATE/DELETE को निकट-वास्तविक समय मोड में सुनता है।

Validator: बेस लोड के बाद और स्ट्रीमिंग प्रतिकृति के दौरान रिकॉर्ड के चेकसम और काउंटरों को सत्यापित करता है।

3. प्रवासन चरण

1. विश्लेषण और मानचित्रण (1-2 दिन)

पुराने और नए डेटाबेस की योजनाओं की तुलना, क्षेत्र पत्राचार का निर्धारण (उदाहरण के लिए, 'प्लेयर _ बैलेंस' → 'बटुआ। real_balance')।

प्रकार रूपांतरण की परिभाषा: पंक्तियाँ → JSON, टाइमस्टैम्प, ENUM → संदर्भ तालिकाएँ।

2. परीक्षण पर्यावरण की तैयारी (1-2 दिन)

उत्पादन डेटा के एक स्वैच्छिक स्नैपशॉट के साथ एक मंचन क्लस्टर की तैनाती।

परीक्षण डेटा पर ईटीएल और सीडीसी कनेक्टर कॉन्फ़िगर करें।

3. "कोल्ड लोड" (2-4 घंटे)

लक्ष्य DB के लिए स्रोत DB → समानांतर आयात से पूर्ण डंप निर्यात।

बूट समय पर गैर-डुप्लिकेटेड प्रक्रियाओं (उदाहरण के लिए, एक बोनस इंजन) को अक्षम करना।

4. सीडीसी प्रतिकृति प्रारंभ करें (सतत)

जब ईटीएल लोडिंग प्रारंभ हुआ तब से परिवर्तनों के लिए सुनना प्रारंभ करें।

कट-ओवर तैयार होने तक संचालन की "पूंछ" का संचय।

5. कट-ओवर और ट्रैफिक स्विचिंग (1-5 मिनट)

सीडीसी पूंछ के शेष को संरेखित करने के लिए अस्थायी रूप से अनुप्रयोगों को रोकना।

नए डाटाबेस में कनेक्शन स्ट्रिंग को फिर से कॉन्फ़िगर करना।
  • मूल लिपियों के धुएं के परीक्षण (लॉगिन, जमा, स्पिन, भीतर)।

6. सत्यापन और रोलबैक (1-2 घंटे)

मुख्य तालिकाओं - उपयोगकर्ताओं, शेष, लेनदेन इतिहास के लिए चेकसम जांच।

यदि महत्वपूर्ण बेमेल - स्नैपशॉट में स्वचालित रोलबैक।

4. परीक्षण और सत्यापन

पंक्ति गणना और चेकसम: तालिकाओं द्वारा रिकॉर्ड और हैश की संख्या की तुलना।

डोमेन परीक्षण: नमूना परिदृश्य - सट्टेबाजी, बोनस और वापसी संचालन।

एंड-टू-एंड परीक्षण: स्वचालित सरू/नाटककार स्क्रिप्ट प्रवास के बाद मंचन में कुंजी प्रवाह चलाते हैं।

5. डाउनटाइम को कम करना

ब्लू-ग्रीन डेटाबेस

समानांतर डाटाबेस उदाहरण...

प्रॉक्सी-लेवल कट-ओवर

आने वाली कनेक्शन कतार के साथ एक चिकनी स्विचओवर के लिए एक प्रॉक्सी (Pgbouncer) का उपयोग करना।

फ़ीचर फ्लैग्स

प्रवास के दौरान कार्यक्षमता का हिस्सा अक्षम करना, ताकि सभी सेवाओं को पूरी तरह से अवरुद्ध न किया जा सके।

6. उपकरण और प्लेटफार्म

Debezium + Kafka для CDC с MySQL/PostgreSQL।
  • ETL पाइपलाइनों के लिए Airbyte, Fivetran, Talend।
  • स्कीमा माइग्रेशन और डेटाबेस वर्शनिंग के लिए फ्लाईवे/लिक्विबेस।
  • सुरक्षित भंडारण साख और रोटेशन के लिए HashiCorp वॉल्ट।

निष्कर्ष

फास्ट डेटा माइग्रेशन के लिए समर्थन वाले प्लेटफॉर्म ईटीएल लोडिंग और सीडीसी प्रतिकृति, कठोर परीक्षण और सत्यापन जांच के संयोजन के आसपास एक प्रक्रिया का निर्माण करते हैं। एक सक्षम वास्तुकला और स्वचालन के साथ, डाउनटाइम कुछ मिनटों तक कम हो जाता है, और डेटा हानि या बेमेल होने का जोखिम शून्य होता है।

Caswino Promo