फास्ट डेटा माइग्रेशन वाले प्

परिचय

प्लेटफॉर्म को बदलते या अपडेट करते समय जानकारी को स्थानांतरित करना एक महत्वपूर्ण कार्य है: शेष राशि, दांव का इतिहास, बोनस, केवाईसी डेटा और अभियान सेटिंग्स को खो या विकृत नहीं किया जा सकता है। आधुनिक समाधान स्वचालित ईटीएल पाइपलाइन और चेंज डेटा कैप्चर (सीडीसी) का उपयोग बिना व्यापार डाउनटाइम के घंटों या मिनटों में माइग्रेशन को पूरा करने के लिए करते हैं।

1. पलायन का वर्गीकरण

1. ठंडा प्रवास

पूर्ण निर्यात-आयात, प्लेटफ़ॉर्म बंद करने की आवश
कम गतिविधि या नियोजित रखरखाव विंडो के लिए उपयुक्त।
2. गर्म प्रवास

समानांतर chạy ETL + CDC प्रतिकृति, सेकंड में कट-ओवर।
राउंड-द-क्लॉक ट्रैफिक के साथ बड़े ऑपरेटरों के लिए उपयुक्त

2. ईटीएल और सीडीसी वास्तुकला

"'मत्स्यांगना
फ्लोचार्ट एलआर
सबग्राफ स्रोत
DB1 [(पुराना DB)]
स्ट्रीम 1 [(पुराना डीबी सीडीसी)]
अंत
सबग्राफ कन्वेयर
ईटीएल [ईटीएल जॉब]
सीडीसी [सीडीसी उपभोक्ता]
वेलिडेटर [डाटा वैलिडेटर]
अंत
सबग्राफ उद्देश्य
DB2 [(नया DB)]
अंत
- ETL -> वेलिडेटर -> DB2
- -टाइम सीडीसी -> वैध -> डीबी 2
```

ईटीएल जॉब: एक बार रात में या एक शेड्यूल पर, टेबल का एक पूरा डंप पढ़ ता है, प्रारूप बदलता है और एक नई योजना में लोड करता है।
CDC उपभोक्ता: WAL लॉग (Debezium/MySQL Binlog), INSERT/UPDATE/DELETE को निकट-वास्तविक समय मोड में सुनता है।
Validator: बेस लोड के बाद और स्ट्रीमिंग प्रतिकृति के दौरान रिकॉर्ड के चेकसम और काउंटरों को सत्यापित करता है।

3. प्रवासन चरण

1. विश्लेषण और मानचित्रण (1-2 दिन)

पुराने और नए डेटाबेस की योजनाओं की तुलना, क्षेत्र पत्राचार का निर्धारण (उदाहरण के लिए, 'प्लेयर _ बैलेंस' → 'बटुआ। real_balance')।
प्रकार रूपांतरण की परिभाषा: पंक्तियाँ → JSON, टाइमस्टैम्प, ENUM → संदर्भ तालिकाएँ।

2. परीक्षण पर्यावरण की तैयारी (1-2 दिन)

उत्पादन डेटा के एक स्वैच्छिक स्नैपशॉट के साथ एक मंचन क्लस्टर की तैनाती।
परीक्षण डेटा पर ईटीएल और सीडीसी कनेक्टर कॉन्फ़िगर करें।

3. "कोल्ड लोड" (2-4 घंटे)

लक्ष्य DB के लिए स्रोत DB → समानांतर आयात से पूर्ण डंप निर्यात।
बूट समय पर गैर-डुप्लिकेटेड प्रक्रियाओं (उदाहरण के लिए, एक बोनस इंजन) को अक्षम करना।

4. सीडीसी प्रतिकृति प्रारंभ करें (सतत)

जब ईटीएल लोडिंग प्रारंभ हुआ तब से परिवर्तनों के लिए सुनना प्रारंभ क
कट-ओवर तैयार होने तक संचालन की "पूंछ" का संचय।

5. कट-ओवर और ट्रैफिक स्विचिंग (1-5 मिनट)

सीडीसी पूंछ के शेष को संरेखित करने के लिए अस्थायी रूप से अनुप्रयोगों को रोकना।
नए डाटाबेस में कनेक्शन स्ट्रिंग को फिर से कॉन्फ़िगर करना।
मूल लिपियों के धुएं के परीक्षण (लॉगिन, जमा, स्पिन, भीतर)।

6. सत्यापन और रोलबैक (1-2 घंटे)

मुख्य तालिकाओं - उपयोगकर्ताओं, शेष, लेनदेन इतिहास के लिए चेकसम जांच।
यदि महत्वपूर्ण बेमेल - स्नैपशॉट में स्वचालित रोलबैक।

4. परीक्षण और सत्यापन

पंक्ति गणना और चेकसम: तालिकाओं द्वारा रिकॉर्ड और हैश की संख्या की तुलना।
डोमेन परीक्षण: नमूना परिदृश्य - सट्टेबाजी, बोनस और वापसी संचालन।
एंड-टू-एंड परीक्षण: स्वचालित सरू/नाटककार स्क्रिप्ट प्रवास के बाद मंचन में कुंजी प्रवाह चलाते हैं।

5. डाउनटाइम को कम करना

ब्लू-ग्रीन डेटाबेस

समानांतर डाटाबेस उदाहरण...
प्रॉक्सी-लेवल कट-ओवर

आने वाली कनेक्शन कतार के साथ एक चिकनी स्विचओवर के लिए एक प्रॉक्सी (Pgbouncer) का उपयोग करना।
फ़ीचर फ्लैग्स

प्रवास के दौरान कार्यक्षमता का हिस्सा अक्षम करना, ताकि सभी सेवाओं को पूरी तरह से अवरुद्ध न किया जा सके।

6. उपकरण और प्लेटफार्म

Debezium + Kafka для CDC с MySQL/PostgreSQL।
ETL पाइपलाइनों के लिए Airbyte, Fivetran, Talend।
स्कीमा माइग्रेशन और डेटाबेस वर्शनिंग के लिए फ्लाईवे/लिक्विबेस।
सुरक्षित भंडारण साख और रोटेशन के लिए HashiCorp वॉल्ट।

निष्कर्ष

फास्ट डेटा माइग्रेशन के लिए समर्थन वाले प्लेटफॉर्म ईटीएल लोडिंग और सीडीसी प्रतिकृति, कठोर परीक्षण और सत्यापन जांच के संयोजन के आसपास एक प्रक्रिया का निर्माण करते हैं। एक सक्षम वास्तुकला और स्वचालन के साथ, डाउनटाइम कुछ मिनटों तक कम हो जाता है, और डेटा हानि या बेमेल होने का जोखिम शून्य होता है।