హోమ్ డేటాబేస్లు డేటాబేస్ (కెడిడి) లో జ్ఞాన ఆవిష్కరణ అంటే ఏమిటి? - టెకోపీడియా నుండి నిర్వచనం

డేటాబేస్ (కెడిడి) లో జ్ఞాన ఆవిష్కరణ అంటే ఏమిటి? - టెకోపీడియా నుండి నిర్వచనం

విషయ సూచిక:

Anonim

నిర్వచనం - డేటాబేస్ (కెడిడి) లో నాలెడ్జ్ డిస్కవరీ అంటే ఏమిటి?

డేటాబేస్లలో నాలెడ్జ్ డిస్కవరీ (KDD) అనేది డేటా సేకరణ నుండి ఉపయోగకరమైన జ్ఞానాన్ని కనుగొనే ప్రక్రియ. ఈ విస్తృతంగా ఉపయోగించే డేటా మైనింగ్ టెక్నిక్ అనేది డేటా తయారీ మరియు ఎంపిక, డేటా ప్రక్షాళన, డేటా సెట్స్‌పై ముందస్తు జ్ఞానాన్ని పొందుపరచడం మరియు గమనించిన ఫలితాల నుండి ఖచ్చితమైన పరిష్కారాలను వివరించే ప్రక్రియ.

ప్రధాన KDD అప్లికేషన్ రంగాలలో మార్కెటింగ్, మోసం గుర్తింపు, టెలికమ్యూనికేషన్ మరియు తయారీ ఉన్నాయి.

టెకోపీడియా డేటాబేస్ (కెడిడి) లో నాలెడ్జ్ డిస్కవరీని వివరిస్తుంది

సాంప్రదాయకంగా, డేటా మైనింగ్ మరియు నాలెడ్జ్ డిస్కవరీ మానవీయంగా జరిగాయి. సమయం గడిచేకొద్దీ, అనేక వ్యవస్థలలో డేటా మొత్తం టెరాబైట్ పరిమాణం కంటే పెద్దదిగా పెరిగింది మరియు ఇకపై మానవీయంగా నిర్వహించబడదు. అంతేకాకుండా, ఏదైనా వ్యాపారం విజయవంతంగా ఉనికిలో ఉండటానికి, డేటాలో అంతర్లీన నమూనాలను కనుగొనడం చాలా అవసరం. ఫలితంగా, దాచిన డేటాను కనుగొనటానికి మరియు make హలను చేయడానికి అనేక సాఫ్ట్‌వేర్ సాధనాలు అభివృద్ధి చేయబడ్డాయి, ఇది కృత్రిమ మేధస్సులో ఒక భాగంగా ఏర్పడింది.

కెడిడి ప్రక్రియ గత పదేళ్లలో గరిష్ట స్థాయికి చేరుకుంది. ఇది ఇప్పుడు ఆవిష్కరణకు అనేక విభిన్న విధానాలను కలిగి ఉంది, ఇందులో ప్రేరక అభ్యాసం, బయేసియన్ గణాంకాలు, సెమాంటిక్ క్వరీ ఆప్టిమైజేషన్, నిపుణుల వ్యవస్థలకు జ్ఞాన సముపార్జన మరియు సమాచార సిద్ధాంతం ఉన్నాయి. అంతిమ లక్ష్యం తక్కువ-స్థాయి డేటా నుండి ఉన్నత-స్థాయి జ్ఞానాన్ని సేకరించడం.

KDD లో మల్టీడిసిప్లినరీ కార్యకలాపాలు ఉన్నాయి. ఇది డేటా నిల్వ మరియు ప్రాప్యతను కలిగి ఉంటుంది, అల్గారిథమ్‌లను భారీ డేటా సెట్‌లకు స్కేలింగ్ చేస్తుంది మరియు ఫలితాలను వివరిస్తుంది. డేటా వేర్‌హౌసింగ్‌లో చేర్చబడిన డేటా ప్రక్షాళన మరియు డేటా యాక్సెస్ ప్రక్రియ KDD ప్రక్రియను సులభతరం చేస్తుంది. కృత్రిమ మేధస్సు ప్రయోగం మరియు పరిశీలనల నుండి అనుభావిక చట్టాలను కనుగొనడం ద్వారా KDD కి మద్దతు ఇస్తుంది. డేటాలో గుర్తించబడిన నమూనాలు క్రొత్త డేటాపై చెల్లుబాటు అయ్యేవి మరియు కొంతవరకు నిశ్చయత కలిగి ఉండాలి. ఈ నమూనాలను కొత్త జ్ఞానంగా భావిస్తారు. మొత్తం KDD ప్రక్రియలో పాల్గొన్న దశలు:

  1. కస్టమర్ యొక్క కోణం నుండి KDD ప్రక్రియ యొక్క లక్ష్యాన్ని గుర్తించండి.
  2. పాల్గొన్న అనువర్తన డొమైన్‌లను మరియు అవసరమైన జ్ఞానాన్ని అర్థం చేసుకోండి
  3. డిస్కవరీ చేయబడే లక్ష్య డేటా సెట్ లేదా డేటా నమూనాల ఉపసమితిని ఎంచుకోండి.
  4. తప్పిపోయిన క్షేత్రాలను నిర్వహించడానికి మరియు అవసరాలకు అనుగుణంగా డేటాను మార్చడానికి వ్యూహాలను నిర్ణయించడం ద్వారా డేటాను శుభ్రపరచండి మరియు ముందస్తు ప్రాసెస్ చేయండి.
  5. అవాంఛిత వేరియబుల్స్ తొలగించడం ద్వారా డేటా సెట్లను సరళీకృతం చేయండి. అప్పుడు, లక్ష్యం లేదా పనిని బట్టి డేటాను సూచించడానికి ఉపయోగపడే లక్షణాలను విశ్లేషించండి.
  6. దాచిన నమూనాలను సూచించడానికి డేటా మైనింగ్ పద్ధతులతో KDD లక్ష్యాలను సరిపోల్చండి.
  7. దాచిన నమూనాలను కనుగొనడానికి డేటా మైనింగ్ అల్గారిథమ్‌లను ఎంచుకోండి. ఈ ప్రక్రియ మొత్తం KDD ప్రక్రియకు ఏ నమూనాలు మరియు పారామితులు సముచితమో నిర్ణయించడం కలిగి ఉంటుంది.
  8. వర్గీకరణ నియమాలు లేదా చెట్లు, రిగ్రెషన్ మరియు క్లస్టరింగ్ వంటి నిర్దిష్ట ప్రాతినిధ్య రూపంలో ఆసక్తి నమూనాల కోసం శోధించండి.
  9. తవ్విన నమూనాల నుండి అవసరమైన జ్ఞానాన్ని అర్థం చేసుకోండి.
  10. తదుపరి చర్య కోసం జ్ఞానాన్ని ఉపయోగించుకోండి మరియు దానిని మరొక వ్యవస్థలో చేర్చండి.
  11. దీన్ని డాక్యుమెంట్ చేయండి మరియు ఆసక్తిగల పార్టీల కోసం నివేదికలు చేయండి.
డేటాబేస్ (కెడిడి) లో జ్ఞాన ఆవిష్కరణ అంటే ఏమిటి? - టెకోపీడియా నుండి నిర్వచనం