- திபாங்கர் சர்க்கார்/
- எனது எழுத்துக்கள்/
- மின்-வணிகத்திற்கான நிகழ்நேர தரவு உள்ளீடு மற்றும் பகுப்பாய்வு கட்டமைப்பை உருவாக்குதல்/
மின்-வணிகத்திற்கான நிகழ்நேர தரவு உள்ளீடு மற்றும் பகுப்பாய்வு கட்டமைப்பை உருவாக்குதல்
பொருளடக்கம்
இந்தியாவின் முன்னணி மின்-வணிக தளத்தின் முதன்மை பொறியியல் ஆலோசகராக, நான் அதிநவீன நிகழ்நேர தரவு உள்ளீடு மற்றும் பகுப்பாய்வு கட்டமைப்பின் உருவாக்கத்தை முன்னின்று வழிநடத்தினேன். இந்த திட்டம் பயனர் நடத்தை மற்றும் அமைப்பு செயல்திறன் குறித்த விரிவான, நிகழ்நேர நுண்ணறிவுகளை வழங்குவதை நோக்கமாகக் கொண்டிருந்தது, அடோப் அனலிட்டிக்ஸ் மற்றும் கூகுள் அனலிட்டிக்ஸ் போன்ற பாரம்பரிய பகுப்பாய்வு கருவிகளின் திறன்களை மிஞ்சியது.
திட்ட கண்ணோட்டம் #
எங்கள் நோக்கங்கள்:
- தினசரி பில்லியன் கணக்கான நிகழ்வுகளை கையாளும் திறன் கொண்ட அளவிடக்கூடிய, நிகழ்நேர தரவு உள்ளீடு அமைப்பை உருவாக்குதல்
- நிகழ்நேரத்தில் தரவுகளை செயலாக்கவும் பகுப்பாய்வு செய்யவும் ஒரு நெகிழ்வான பகுப்பாய்வு கட்டமைப்பை உருவாக்குதல்
- பல்வேறு வணிக பிரிவுகளுக்கு முன்பை விட வேகமாக செயல்படுத்தக்கூடிய நுண்ணறிவுகளை வழங்குதல்
- தரவு துல்லியம், பாதுகாப்பு மற்றும் தனியுரிமை விதிமுறைகளுக்கு இணங்குதலை உறுதி செய்தல்
தொழில்நுட்ப கட்டமைப்பு #
தரவு உள்ளீட்டு அடுக்கு #
- AWS லாம்டா: சர்வர்-இல்லா, நிகழ்வு-இயக்க தரவு உள்ளீட்டிற்காக பயன்படுத்தப்பட்டது
- அமேசான் கைனெசிஸ்: நிகழ்நேர தரவு ஸ்ட்ரீமிங்கிற்காக
- தனிப்பயன் SDK: வலை மற்றும் மொபைல் தளங்களில் கிளையன்ட்-சைட் தரவு சேகரிப்பிற்காக உருவாக்கப்பட்டது
தரவு செயலாக்கம் மற்றும் சேமிப்பு #
- அபாச்சி ஃப்ளிங்க்: சிக்கலான நிகழ்வு செயலாக்கம் மற்றும் ஸ்ட்ரீம் பகுப்பாய்விற்காக
- அமேசான் S3: மூல மற்றும் செயலாக்கப்பட்ட தரவுகளை சேமிப்பதற்கான தரவு ஏரியாக
- அமேசான் ரெட்ஷிஃப்ட்: தரவு கிடங்கு மற்றும் சிக்கலான பகுப்பாய்வு வினவல்களுக்காக
பகுப்பாய்வு மற்றும் காட்சிப்படுத்தல் #
- தனிப்பயன் பகுப்பாய்வு இயந்திரம்: பைதான் பயன்படுத்தி கட்டமைக்கப்பட்டது மற்றும் எங்கள் குறிப்பிட்ட தேவைகளுக்காக உகந்ததாக்கப்பட்டது
- டேப்லோ மற்றும் தனிப்பயன் டாஷ்போர்டுகள்: தரவு காட்சிப்படுத்தல் மற்றும் அறிக்கையிடலுக்காக
முக்கிய அம்சங்கள் #
நிகழ்நேர நிகழ்வு செயலாக்கம்: தினசரி பில்லியன் கணக்கான நிகழ்வுகளை வினாடிக்கும் குறைவான தாமதத்துடன் உள்ளீடு செய்து செயலாக்கும் திறன்
தனிப்பயனாக்கக்கூடிய நிகழ்வு கண்காணிப்பு: புதிய நிகழ்வு வகைகள் மற்றும் பண்புகளை எளிதாக சேர்க்க அனுமதிக்கும் நெகிழ்வான அமைப்பு
பயனர் பயண பகுப்பாய்வு: பல அமர்வுகள் மற்றும் சாதனங்களில் முழுமையான பயனர் பயணங்களை கண்காணிக்கவும் பகுப்பாய்வு செய்யவும் மேம்பட்ட கருவிகள்
முன்னறிவிப்பு பகுப்பாய்வு: பயனர் நடத்தை மற்றும் தயாரிப்பு போக்குகளை கணிப்பதற்கான இயந்திர கற்றல் மாதிரிகள்
A/B சோதனை கட்டமைப்பு: நிகழ்நேரத்தில் A/B சோதனைகளை இயக்கவும் பகுப்பாய்வு செய்யவும் ஒருங்கிணைந்த அமைப்பு
அசாதாரண கண்டறிதல்: பயனர் நடத்தை அல்லது அமைப்பு செயல்திறனில் அசாதாரண முறைகளைக் கண்டறிவதற்கான தானியங்கி அமைப்புகள்
செயல்படுத்தல் சவால்கள் மற்றும் தீர்வுகள் #
சவால்: பெரும் தரவு அளவு மற்றும் வேகத்தைக் கையாளுதல் தீர்வு: AWS சேவைகளைப் பயன்படுத்தி பரவலான, அளவிடக்கூடிய கட்டமைப்பை செயல்படுத்தி, தரவு பிரிப்பு உத்திகளை உகந்ததாக்கியது
சவால்: தரவு நிலைத்தன்மை மற்றும் துல்லியத்தை உறுதி செய்தல் தீர்வு: வலுவான தரவு சரிபார்ப்பு மற்றும் சமரசப் படுத்தல் செயல்முறைகளை உருவாக்கி, தரவு முரண்பாடுகளுக்கான தானியங்கி எச்சரிக்கைகளுடன்
சவால்: நிகழ்நேர செயலாக்கத்தை வரலாற்று பகுப்பாய்வுடன் சமநிலைப்படுத்துதல் தீர்வு: நிகழ்நேர நுண்ணறிவுகளுக்கான ஸ்ட்ரீம் செயலாக்கத்துடன் ஆழமான வரலாற்று பகுப்பாய்விற்கான தொகுதி செயலாக்கத்தை இணைக்கும் லாம்டா கட்டமைப்பை உருவாக்கியது
சவால்: தரவு தனியுரிமை விதிமுறைகளுக்கு இணங்குதல் தீர்வு: தரவு அநாமதேய தொழில்நுட்பங்கள் மற்றும் கடுமையான அணுகல் கட்டுப்பாடுகளை செயல்படுத்தி, GDPR மற்றும் உள்ளூர் தரவு பாதுகாப்பு சட்டங்களுக்கு இணங்குவதை உறுதி செய்தது
மேம்பாட்டு செயல்முறை #
தேவைகளை சேகரித்தல்: பல்வேறு வணிக பிரிவுகளின் பகுப்பாய்வு தேவைகளைப் புரிந்துகொள்ள விரிவான நேர்காணல்களை நடத்தியது
கருத்து நிரூபணம்: கட்டமைப்பு மற்றும் முக்கிய செயல்பாடுகளை சரிபார்க்க சிறிய அளவிலான முன்மாதிரியை உருவாக்கியது
படிப்படியான மேம்பாடு: அஜைல் அணுகுமுறையை ஏற்றுக்கொண்டு, அம்சங்களை படிப்படியாக வெளியிட்டு கருத்துக்களை சேகரித்தல்
செயல்திறன் மேம்பாடு: உச்ச போக்குவரத்து சூழ்நிலைகளை கையாள விரிவான சுமை சோதனை மற்றும் உகந்ததாக்கல் நடத்தப்பட்டது
பயிற்சி மற்றும் ஆவணப்படுத்தல்: விரிவான ஆவணங்களை உருவாக்கி, தரவு பகுப்பாய்வாளர்கள் மற்றும் வணிக பயனர்களுக்கு பயிற்சி அமர்வுகளை நடத்தியது
முடிவுகள் மற்றும் தாக்கம் #
தரவு செயலாக்க திறன்:
- தினசரி 5 பில்லியனுக்கும் அதிகமான நிகழ்வுகளை வெற்றிகரமாக உள்ளீடு செய்து செயலாக்கியது
- தரவு தாமதத்தை மணிக்கணக்கில் இருந்து வினாடிகளாக குறைத்தது
செலவு திறன்:
- முந்தைய மூன்றாம்