హోమ్ వార్తల్లో డేటా సరస్సు అంటే ఏమిటి? - టెకోపీడియా నుండి నిర్వచనం

డేటా సరస్సు అంటే ఏమిటి? - టెకోపీడియా నుండి నిర్వచనం

విషయ సూచిక:

Anonim

నిర్వచనం - డేటా లేక్ అంటే ఏమిటి?

డేటా సరస్సు అనేది నిర్మాణాత్మక మరియు నిర్మాణాత్మక డేటా యొక్క పెద్ద పరిమాణాల యొక్క భారీ, సులభంగా ప్రాప్తి చేయగల, కేంద్రీకృత రిపోజిటరీ.

టెకోపీడియా డేటా లేక్ గురించి వివరిస్తుంది

డేటా లేక్ ఆర్కిటెక్చర్ అనేది పెద్ద డేటాకు స్టోర్-ప్రతిదీ విధానం. డేటా రిపోజిటరీలో నిల్వ చేసినప్పుడు అవి వర్గీకరించబడవు, ఎందుకంటే డేటా విలువ ప్రారంభంలో స్పష్టంగా లేదు. ఫలితంగా, డేటా తయారీ తొలగించబడుతుంది. సాంప్రదాయిక డేటా గిడ్డంగితో పోలిస్తే డేటా సరస్సు తక్కువ నిర్మాణాత్మకంగా ఉంటుంది. డేటాను యాక్సెస్ చేసినప్పుడు, అప్పుడు మాత్రమే అవి వర్గీకరించబడతాయి, నిర్వహించబడతాయి లేదా విశ్లేషించబడతాయి.


పెద్ద డేటాను ప్రాసెస్ చేయడానికి మరియు విశ్లేషించడానికి ఓపెన్-సోర్స్ ఫ్రేమ్‌వర్క్ అయిన హడూప్, రిపోజిటరీలోని డేటా ద్వారా జల్లెడ పట్టుటకు ఉపయోగపడుతుంది.

డేటా సరస్సు అంటే ఏమిటి? - టెకోపీడియా నుండి నిర్వచనం