పెద్ద డేటా విశ్లేషణలలో ETL (సారం, రూపాంతరం మరియు లోడ్) చాలా ముఖ్యమైన ప్రక్రియ - మరియు అదే సమయంలో, ఇది దాని అతిపెద్ద అడ్డంకిలలో ఒకటి కావచ్చు. (పెద్ద డేటా గురించి మరింత తెలుసుకోవడానికి, మీరు ఆన్లైన్లో తీసుకోగల 5 ఉపయోగకరమైన పెద్ద డేటా కోర్సులను చూడండి.)
ETL చాలా ముఖ్యమైన కారణం ఏమిటంటే, వ్యాపారం సేకరించే చాలా డేటా దాని ముడి రూపంలో, జీర్ణమయ్యే విశ్లేషణల పరిష్కారం కోసం సిద్ధంగా లేదు. అంతర్దృష్టులను సృష్టించడానికి విశ్లేషణల పరిష్కారం కోసం, ముడి డేటా ప్రస్తుతం ఉన్న అనువర్తనం నుండి సంగ్రహించాల్సిన అవసరం ఉంది, అనలిటిక్స్ ప్రోగ్రామ్ చదవగలిగే ఫార్మాట్లోకి మార్చబడుతుంది మరియు తరువాత విశ్లేషణ ప్రోగ్రామ్లోకి లోడ్ అవుతుంది.
ఈ ప్రక్రియ వంటకు సమానంగా ఉంటుంది. మీ ముడి పదార్థాలు మీ ముడి డేటా. వాటిని విశ్లేషించడానికి (రుచి చూడటానికి) ముందు వాటిని తీయడం (స్టోర్ నుండి కొనుగోలు చేయడం), రూపాంతరం చెందడం (ఉడికించడం), ఆపై లోడ్ చేయడం (పూత పూయడం) అవసరం. ఇబ్బంది మరియు వ్యయం అనూహ్యంగా కొలవగలవు - మీ కోసం మాక్ ఎన్ జున్ను తయారు చేయడం చాలా సులభం, కానీ విందులో 40 మందికి రుచినిచ్చే మెనుని సృష్టించడం చాలా కష్టం. ఏ సమయంలోనైనా పొరపాటు మీ భోజనాన్ని అజీర్ణం చేస్తుందని ప్రత్యేకంగా చెప్పనవసరం లేదు.
