విషయ సూచిక:
నిర్వచనం - డేటా లేక్ అంటే ఏమిటి?
డేటా సరస్సు అనేది నిర్మాణాత్మక మరియు నిర్మాణాత్మక డేటా యొక్క పెద్ద పరిమాణాల యొక్క భారీ, సులభంగా ప్రాప్తి చేయగల, కేంద్రీకృత రిపోజిటరీ.టెకోపీడియా డేటా లేక్ గురించి వివరిస్తుంది
డేటా లేక్ ఆర్కిటెక్చర్ అనేది పెద్ద డేటాకు స్టోర్-ప్రతిదీ విధానం. డేటా రిపోజిటరీలో నిల్వ చేసినప్పుడు అవి వర్గీకరించబడవు, ఎందుకంటే డేటా విలువ ప్రారంభంలో స్పష్టంగా లేదు. ఫలితంగా, డేటా తయారీ తొలగించబడుతుంది. సాంప్రదాయిక డేటా గిడ్డంగితో పోలిస్తే డేటా సరస్సు తక్కువ నిర్మాణాత్మకంగా ఉంటుంది. డేటాను యాక్సెస్ చేసినప్పుడు, అప్పుడు మాత్రమే అవి వర్గీకరించబడతాయి, నిర్వహించబడతాయి లేదా విశ్లేషించబడతాయి.
పెద్ద డేటాను ప్రాసెస్ చేయడానికి మరియు విశ్లేషించడానికి ఓపెన్-సోర్స్ ఫ్రేమ్వర్క్ అయిన హడూప్, రిపోజిటరీలోని డేటా ద్వారా జల్లెడ పట్టుటకు ఉపయోగపడుతుంది.




