విషయ సూచిక:
- నిర్వచనం - డేటాబేస్ (కెడిడి) లో నాలెడ్జ్ డిస్కవరీ అంటే ఏమిటి?
- టెకోపీడియా డేటాబేస్ (కెడిడి) లో నాలెడ్జ్ డిస్కవరీని వివరిస్తుంది
నిర్వచనం - డేటాబేస్ (కెడిడి) లో నాలెడ్జ్ డిస్కవరీ అంటే ఏమిటి?
డేటాబేస్లలో నాలెడ్జ్ డిస్కవరీ (KDD) అనేది డేటా సేకరణ నుండి ఉపయోగకరమైన జ్ఞానాన్ని కనుగొనే ప్రక్రియ. ఈ విస్తృతంగా ఉపయోగించే డేటా మైనింగ్ టెక్నిక్ అనేది డేటా తయారీ మరియు ఎంపిక, డేటా ప్రక్షాళన, డేటా సెట్స్పై ముందస్తు జ్ఞానాన్ని పొందుపరచడం మరియు గమనించిన ఫలితాల నుండి ఖచ్చితమైన పరిష్కారాలను వివరించే ప్రక్రియ.
ప్రధాన KDD అప్లికేషన్ రంగాలలో మార్కెటింగ్, మోసం గుర్తింపు, టెలికమ్యూనికేషన్ మరియు తయారీ ఉన్నాయి.
టెకోపీడియా డేటాబేస్ (కెడిడి) లో నాలెడ్జ్ డిస్కవరీని వివరిస్తుంది
సాంప్రదాయకంగా, డేటా మైనింగ్ మరియు నాలెడ్జ్ డిస్కవరీ మానవీయంగా జరిగాయి. సమయం గడిచేకొద్దీ, అనేక వ్యవస్థలలో డేటా మొత్తం టెరాబైట్ పరిమాణం కంటే పెద్దదిగా పెరిగింది మరియు ఇకపై మానవీయంగా నిర్వహించబడదు. అంతేకాకుండా, ఏదైనా వ్యాపారం విజయవంతంగా ఉనికిలో ఉండటానికి, డేటాలో అంతర్లీన నమూనాలను కనుగొనడం చాలా అవసరం. ఫలితంగా, దాచిన డేటాను కనుగొనటానికి మరియు make హలను చేయడానికి అనేక సాఫ్ట్వేర్ సాధనాలు అభివృద్ధి చేయబడ్డాయి, ఇది కృత్రిమ మేధస్సులో ఒక భాగంగా ఏర్పడింది.
కెడిడి ప్రక్రియ గత పదేళ్లలో గరిష్ట స్థాయికి చేరుకుంది. ఇది ఇప్పుడు ఆవిష్కరణకు అనేక విభిన్న విధానాలను కలిగి ఉంది, ఇందులో ప్రేరక అభ్యాసం, బయేసియన్ గణాంకాలు, సెమాంటిక్ క్వరీ ఆప్టిమైజేషన్, నిపుణుల వ్యవస్థలకు జ్ఞాన సముపార్జన మరియు సమాచార సిద్ధాంతం ఉన్నాయి. అంతిమ లక్ష్యం తక్కువ-స్థాయి డేటా నుండి ఉన్నత-స్థాయి జ్ఞానాన్ని సేకరించడం.
KDD లో మల్టీడిసిప్లినరీ కార్యకలాపాలు ఉన్నాయి. ఇది డేటా నిల్వ మరియు ప్రాప్యతను కలిగి ఉంటుంది, అల్గారిథమ్లను భారీ డేటా సెట్లకు స్కేలింగ్ చేస్తుంది మరియు ఫలితాలను వివరిస్తుంది. డేటా వేర్హౌసింగ్లో చేర్చబడిన డేటా ప్రక్షాళన మరియు డేటా యాక్సెస్ ప్రక్రియ KDD ప్రక్రియను సులభతరం చేస్తుంది. కృత్రిమ మేధస్సు ప్రయోగం మరియు పరిశీలనల నుండి అనుభావిక చట్టాలను కనుగొనడం ద్వారా KDD కి మద్దతు ఇస్తుంది. డేటాలో గుర్తించబడిన నమూనాలు క్రొత్త డేటాపై చెల్లుబాటు అయ్యేవి మరియు కొంతవరకు నిశ్చయత కలిగి ఉండాలి. ఈ నమూనాలను కొత్త జ్ఞానంగా భావిస్తారు. మొత్తం KDD ప్రక్రియలో పాల్గొన్న దశలు:
- కస్టమర్ యొక్క కోణం నుండి KDD ప్రక్రియ యొక్క లక్ష్యాన్ని గుర్తించండి.
- పాల్గొన్న అనువర్తన డొమైన్లను మరియు అవసరమైన జ్ఞానాన్ని అర్థం చేసుకోండి
- డిస్కవరీ చేయబడే లక్ష్య డేటా సెట్ లేదా డేటా నమూనాల ఉపసమితిని ఎంచుకోండి.
- తప్పిపోయిన క్షేత్రాలను నిర్వహించడానికి మరియు అవసరాలకు అనుగుణంగా డేటాను మార్చడానికి వ్యూహాలను నిర్ణయించడం ద్వారా డేటాను శుభ్రపరచండి మరియు ముందస్తు ప్రాసెస్ చేయండి.
- అవాంఛిత వేరియబుల్స్ తొలగించడం ద్వారా డేటా సెట్లను సరళీకృతం చేయండి. అప్పుడు, లక్ష్యం లేదా పనిని బట్టి డేటాను సూచించడానికి ఉపయోగపడే లక్షణాలను విశ్లేషించండి.
- దాచిన నమూనాలను సూచించడానికి డేటా మైనింగ్ పద్ధతులతో KDD లక్ష్యాలను సరిపోల్చండి.
- దాచిన నమూనాలను కనుగొనడానికి డేటా మైనింగ్ అల్గారిథమ్లను ఎంచుకోండి. ఈ ప్రక్రియ మొత్తం KDD ప్రక్రియకు ఏ నమూనాలు మరియు పారామితులు సముచితమో నిర్ణయించడం కలిగి ఉంటుంది.
- వర్గీకరణ నియమాలు లేదా చెట్లు, రిగ్రెషన్ మరియు క్లస్టరింగ్ వంటి నిర్దిష్ట ప్రాతినిధ్య రూపంలో ఆసక్తి నమూనాల కోసం శోధించండి.
- తవ్విన నమూనాల నుండి అవసరమైన జ్ఞానాన్ని అర్థం చేసుకోండి.
- తదుపరి చర్య కోసం జ్ఞానాన్ని ఉపయోగించుకోండి మరియు దానిని మరొక వ్యవస్థలో చేర్చండి.
- దీన్ని డాక్యుమెంట్ చేయండి మరియు ఆసక్తిగల పార్టీల కోసం నివేదికలు చేయండి.
