முக்கிய உள்ளடக்கத்திற்கு செல்க
  1. எனது எழுத்துக்கள்/

மின்-வணிகத்திற்கான நிகழ்நேர தரவு உள்ளீடு மற்றும் பகுப்பாய்வு கட்டமைப்பை உருவாக்குதல்

இந்தியாவின் முன்னணி மின்-வணிக தளத்தின் முதன்மை பொறியியல் ஆலோசகராக, நான் அதிநவீன நிகழ்நேர தரவு உள்ளீடு மற்றும் பகுப்பாய்வு கட்டமைப்பின் உருவாக்கத்தை முன்னின்று வழிநடத்தினேன். இந்த திட்டம் பயனர் நடத்தை மற்றும் அமைப்பு செயல்திறன் குறித்த விரிவான, நிகழ்நேர நுண்ணறிவுகளை வழங்குவதை நோக்கமாகக் கொண்டிருந்தது, அடோப் அனலிட்டிக்ஸ் மற்றும் கூகுள் அனலிட்டிக்ஸ் போன்ற பாரம்பரிய பகுப்பாய்வு கருவிகளின் திறன்களை மிஞ்சியது.

திட்ட கண்ணோட்டம் #

எங்கள் நோக்கங்கள்:

  1. தினசரி பில்லியன் கணக்கான நிகழ்வுகளை கையாளும் திறன் கொண்ட அளவிடக்கூடிய, நிகழ்நேர தரவு உள்ளீடு அமைப்பை உருவாக்குதல்
  2. நிகழ்நேரத்தில் தரவுகளை செயலாக்கவும் பகுப்பாய்வு செய்யவும் ஒரு நெகிழ்வான பகுப்பாய்வு கட்டமைப்பை உருவாக்குதல்
  3. பல்வேறு வணிக பிரிவுகளுக்கு முன்பை விட வேகமாக செயல்படுத்தக்கூடிய நுண்ணறிவுகளை வழங்குதல்
  4. தரவு துல்லியம், பாதுகாப்பு மற்றும் தனியுரிமை விதிமுறைகளுக்கு இணங்குதலை உறுதி செய்தல்

தொழில்நுட்ப கட்டமைப்பு #

தரவு உள்ளீட்டு அடுக்கு #

  • AWS லாம்டா: சர்வர்-இல்லா, நிகழ்வு-இயக்க தரவு உள்ளீட்டிற்காக பயன்படுத்தப்பட்டது
  • அமேசான் கைனெசிஸ்: நிகழ்நேர தரவு ஸ்ட்ரீமிங்கிற்காக
  • தனிப்பயன் SDK: வலை மற்றும் மொபைல் தளங்களில் கிளையன்ட்-சைட் தரவு சேகரிப்பிற்காக உருவாக்கப்பட்டது

தரவு செயலாக்கம் மற்றும் சேமிப்பு #

  • அபாச்சி ஃப்ளிங்க்: சிக்கலான நிகழ்வு செயலாக்கம் மற்றும் ஸ்ட்ரீம் பகுப்பாய்விற்காக
  • அமேசான் S3: மூல மற்றும் செயலாக்கப்பட்ட தரவுகளை சேமிப்பதற்கான தரவு ஏரியாக
  • அமேசான் ரெட்ஷிஃப்ட்: தரவு கிடங்கு மற்றும் சிக்கலான பகுப்பாய்வு வினவல்களுக்காக

பகுப்பாய்வு மற்றும் காட்சிப்படுத்தல் #

  • தனிப்பயன் பகுப்பாய்வு இயந்திரம்: பைதான் பயன்படுத்தி கட்டமைக்கப்பட்டது மற்றும் எங்கள் குறிப்பிட்ட தேவைகளுக்காக உகந்ததாக்கப்பட்டது
  • டேப்லோ மற்றும் தனிப்பயன் டாஷ்போர்டுகள்: தரவு காட்சிப்படுத்தல் மற்றும் அறிக்கையிடலுக்காக

முக்கிய அம்சங்கள் #

  1. நிகழ்நேர நிகழ்வு செயலாக்கம்: தினசரி பில்லியன் கணக்கான நிகழ்வுகளை வினாடிக்கும் குறைவான தாமதத்துடன் உள்ளீடு செய்து செயலாக்கும் திறன்

  2. தனிப்பயனாக்கக்கூடிய நிகழ்வு கண்காணிப்பு: புதிய நிகழ்வு வகைகள் மற்றும் பண்புகளை எளிதாக சேர்க்க அனுமதிக்கும் நெகிழ்வான அமைப்பு

  3. பயனர் பயண பகுப்பாய்வு: பல அமர்வுகள் மற்றும் சாதனங்களில் முழுமையான பயனர் பயணங்களை கண்காணிக்கவும் பகுப்பாய்வு செய்யவும் மேம்பட்ட கருவிகள்

  4. முன்னறிவிப்பு பகுப்பாய்வு: பயனர் நடத்தை மற்றும் தயாரிப்பு போக்குகளை கணிப்பதற்கான இயந்திர கற்றல் மாதிரிகள்

  5. A/B சோதனை கட்டமைப்பு: நிகழ்நேரத்தில் A/B சோதனைகளை இயக்கவும் பகுப்பாய்வு செய்யவும் ஒருங்கிணைந்த அமைப்பு

  6. அசாதாரண கண்டறிதல்: பயனர் நடத்தை அல்லது அமைப்பு செயல்திறனில் அசாதாரண முறைகளைக் கண்டறிவதற்கான தானியங்கி அமைப்புகள்

செயல்படுத்தல் சவால்கள் மற்றும் தீர்வுகள் #

  1. சவால்: பெரும் தரவு அளவு மற்றும் வேகத்தைக் கையாளுதல் தீர்வு: AWS சேவைகளைப் பயன்படுத்தி பரவலான, அளவிடக்கூடிய கட்டமைப்பை செயல்படுத்தி, தரவு பிரிப்பு உத்திகளை உகந்ததாக்கியது

  2. சவால்: தரவு நிலைத்தன்மை மற்றும் துல்லியத்தை உறுதி செய்தல் தீர்வு: வலுவான தரவு சரிபார்ப்பு மற்றும் சமரசப் படுத்தல் செயல்முறைகளை உருவாக்கி, தரவு முரண்பாடுகளுக்கான தானியங்கி எச்சரிக்கைகளுடன்

  3. சவால்: நிகழ்நேர செயலாக்கத்தை வரலாற்று பகுப்பாய்வுடன் சமநிலைப்படுத்துதல் தீர்வு: நிகழ்நேர நுண்ணறிவுகளுக்கான ஸ்ட்ரீம் செயலாக்கத்துடன் ஆழமான வரலாற்று பகுப்பாய்விற்கான தொகுதி செயலாக்கத்தை இணைக்கும் லாம்டா கட்டமைப்பை உருவாக்கியது

  4. சவால்: தரவு தனியுரிமை விதிமுறைகளுக்கு இணங்குதல் தீர்வு: தரவு அநாமதேய தொழில்நுட்பங்கள் மற்றும் கடுமையான அணுகல் கட்டுப்பாடுகளை செயல்படுத்தி, GDPR மற்றும் உள்ளூர் தரவு பாதுகாப்பு சட்டங்களுக்கு இணங்குவதை உறுதி செய்தது

மேம்பாட்டு செயல்முறை #

  1. தேவைகளை சேகரித்தல்: பல்வேறு வணிக பிரிவுகளின் பகுப்பாய்வு தேவைகளைப் புரிந்துகொள்ள விரிவான நேர்காணல்களை நடத்தியது

  2. கருத்து நிரூபணம்: கட்டமைப்பு மற்றும் முக்கிய செயல்பாடுகளை சரிபார்க்க சிறிய அளவிலான முன்மாதிரியை உருவாக்கியது

  3. படிப்படியான மேம்பாடு: அஜைல் அணுகுமுறையை ஏற்றுக்கொண்டு, அம்சங்களை படிப்படியாக வெளியிட்டு கருத்துக்களை சேகரித்தல்

  4. செயல்திறன் மேம்பாடு: உச்ச போக்குவரத்து சூழ்நிலைகளை கையாள விரிவான சுமை சோதனை மற்றும் உகந்ததாக்கல் நடத்தப்பட்டது

  5. பயிற்சி மற்றும் ஆவணப்படுத்தல்: விரிவான ஆவணங்களை உருவாக்கி, தரவு பகுப்பாய்வாளர்கள் மற்றும் வணிக பயனர்களுக்கு பயிற்சி அமர்வுகளை நடத்தியது

முடிவுகள் மற்றும் தாக்கம் #

  1. தரவு செயலாக்க திறன்:

    • தினசரி 5 பில்லியனுக்கும் அதிகமான நிகழ்வுகளை வெற்றிகரமாக உள்ளீடு செய்து செயலாக்கியது
    • தரவு தாமதத்தை மணிக்கணக்கில் இருந்து வினாடிகளாக குறைத்தது
  2. செலவு திறன்:

    • முந்தைய மூன்றாம்