విషయ సూచిక:
నిర్వచనం - డేటా ప్రిప్రాసెసింగ్ అంటే ఏమిటి?
డేటా ప్రిప్రాసెసింగ్ అనేది డేటా మైనింగ్ టెక్నిక్, ఇది ముడి డేటాను అర్థమయ్యే ఫార్మాట్గా మార్చడం. వాస్తవ-ప్రపంచ డేటా తరచుగా అసంపూర్తిగా, అస్థిరంగా, మరియు / లేదా కొన్ని ప్రవర్తనలు లేదా పోకడలలో లేకపోవడం మరియు చాలా లోపాలను కలిగి ఉంటుంది. డేటా ప్రిప్రాసెసింగ్ అటువంటి సమస్యలను పరిష్కరించడానికి నిరూపితమైన పద్ధతి. డేటా ప్రిప్రాసెసింగ్ తదుపరి ప్రాసెసింగ్ కోసం ముడి డేటాను సిద్ధం చేస్తుంది.
డేటా ప్రిప్రాసెసింగ్ అనేది కస్టమర్ రిలేషన్ మేనేజ్మెంట్ మరియు రూల్-బేస్డ్ అప్లికేషన్స్ (న్యూరల్ నెట్వర్క్లు వంటివి) వంటి డేటాబేస్ ఆధారిత అనువర్తనాలను ఉపయోగిస్తుంది.
టెకోపీడియా డేటా ప్రిప్రాసెసింగ్ గురించి వివరిస్తుంది
ప్రిప్రాసెసింగ్ సమయంలో డేటా వరుస దశల ద్వారా వెళుతుంది:
- డేటా క్లీనింగ్: తప్పిపోయిన విలువలను నింపడం, ధ్వనించే డేటాను సున్నితంగా మార్చడం లేదా డేటాలోని అసమానతలను పరిష్కరించడం వంటి ప్రక్రియల ద్వారా డేటా శుభ్రపరచబడుతుంది.
- డేటా ఇంటిగ్రేషన్: విభిన్న ప్రాతినిధ్యాలతో డేటా కలిసి ఉంచబడుతుంది మరియు డేటాలోని విభేదాలు పరిష్కరించబడతాయి.
- డేటా పరివర్తన: డేటా సాధారణీకరించబడింది, సమగ్రపరచబడింది మరియు సాధారణీకరించబడింది.
- డేటా తగ్గింపు: ఈ దశ డేటా గిడ్డంగిలో డేటా యొక్క తగ్గిన ప్రాతినిధ్యాన్ని ప్రదర్శించడం లక్ష్యంగా పెట్టుకుంది.
- డేటా వివేచన: లక్షణ విరామాల పరిధిని విభజించడం ద్వారా నిరంతర లక్షణం యొక్క అనేక విలువలను తగ్గించడం.
