హోమ్ ట్రెండ్లులో ఏమి $ @! హడూప్?

ఏమి $ @! హడూప్?

విషయ సూచిక:

Anonim

ప్రతి ఒక్కరూ హడూప్ గురించి మాట్లాడుతున్నారు, ఇది డెవలపర్‌లలో ఎంతో విలువైనది మరియు ప్రపంచాన్ని మార్చగలదు (మళ్ళీ). ఏమైనప్పటికీ, అది ఏమిటి? ఇది ప్రోగ్రామింగ్ భాషనా? డేటాబేస్? ప్రాసెసింగ్ సిస్టమ్? భారతీయ టీ హాయిగా ఉందా?


విస్తృత సమాధానం: హడూప్ ఈ విషయాలన్నీ (టీ హాయిగా తప్ప) మరియు మరిన్ని. ఇది సాఫ్ట్‌వేర్ లైబ్రరీ, ఇది మరొక ఆధునిక బజ్‌వర్డ్ యొక్క చౌకైన, ఉపయోగకరమైన ప్రాసెసింగ్ కోసం ప్రోగ్రామింగ్ ఫ్రేమ్‌వర్క్‌ను అందిస్తుంది: పెద్ద డేటా.

హడూప్ ఎక్కడ నుండి వచ్చారు?

అపాచీ హడూప్ అపాచీ సాఫ్ట్‌వేర్ ఫౌండేషన్ నుండి వచ్చిన ఫౌండేషన్ ప్రాజెక్ట్‌లో భాగం, ఇది లాభాపేక్షలేని సంస్థ, దీని లక్ష్యం "ప్రజల మంచి కోసం సాఫ్ట్‌వేర్‌ను అందించడం". అందుకని, హడూప్ లైబ్రరీ ఉచిత, ఓపెన్ సోర్స్ సాఫ్ట్‌వేర్ అన్ని డెవలపర్‌లకు అందుబాటులో ఉంది.


హడూప్‌కు శక్తినిచ్చే అంతర్లీన సాంకేతిక పరిజ్ఞానం వాస్తవానికి గూగుల్ కనుగొంది. ప్రారంభ రోజుల్లో, అంత పెద్దది కాని సెర్చ్ ఇంజిన్‌కు వారు ఇంటర్నెట్ నుండి సేకరిస్తున్న భారీ మొత్తంలో డేటాను సూచిక చేయడానికి మరియు దాని వినియోగదారులకు అర్ధవంతమైన, సంబంధిత ఫలితాలకు మార్చడానికి ఒక మార్గం అవసరం. వారి అవసరాలను తీర్చగల మార్కెట్లో ఏమీ అందుబాటులో లేకపోవడంతో, గూగుల్ వారి స్వంత ప్లాట్‌ఫామ్‌ను నిర్మించింది.


ఆ ఆవిష్కరణలు నచ్ అనే ఓపెన్ సోర్స్ ప్రాజెక్టులో విడుదలయ్యాయి, తరువాత హడూప్ ఒక పునాదిగా ఉపయోగించారు. ముఖ్యంగా, హడూప్ అన్ని రకాల కంపెనీలకు సరసమైన విధంగా పెద్ద డేటాను గూగుల్ యొక్క శక్తిని వర్తిస్తుంది.

హడూప్ ఎలా పని చేస్తుంది?

ఇంతకు ముందు చెప్పినట్లుగా, హడూప్ ఒక విషయం కాదు - ఇది చాలా విషయాలు. హడూప్ అయిన సాఫ్ట్‌వేర్ లైబ్రరీలో నాలుగు ప్రాధమిక భాగాలు (మాడ్యూల్స్) ఉన్నాయి మరియు దాని వాస్తవ-ప్రపంచ వినియోగాన్ని మెరుగుపరిచే అనేక యాడ్-ఆన్ పరిష్కారాలు (డేటాబేస్ మరియు ప్రోగ్రామింగ్ భాషలు వంటివి) ఉన్నాయి. నాలుగు గుణకాలు:

  • హడూప్ కామన్: ఇది హడూప్ మాడ్యూళ్ళకు మద్దతిచ్చే సాధారణ వినియోగాల (సాధారణ లైబ్రరీ) సేకరణ.
  • హడూప్ డిస్ట్రిబ్యూటెడ్ ఫైల్ సిస్టమ్ (హెచ్‌డిఎఫ్‌ఎస్): నిల్వ చేసిన డేటాపై ఎటువంటి పరిమితులు లేని బలమైన పంపిణీ చేయబడిన ఫైల్ సిస్టమ్ (అనగా డేటా నిర్మాణాత్మకంగా లేదా నిర్మాణాత్మకంగా మరియు స్కీమలెస్‌గా ఉంటుంది, ఇక్కడ చాలా డిఎఫ్‌ఎస్‌లు నిర్మాణాత్మక డేటాను మాత్రమే నిల్వ చేస్తాయి) ఇది రిడెండెన్సీతో అధిక-నిర్గమాంశ ప్రాప్యతను అందిస్తుంది ( బహుళ యంత్రాలలో డేటాను నిల్వ చేయడానికి HDFS అనుమతిస్తుంది - కాబట్టి ఒక యంత్రం విఫలమైతే, లభ్యత ఇతర యంత్రాల ద్వారా నిర్వహించబడుతుంది).
  • హడూప్ యార్న్: ఈ ఫ్రేమ్‌వర్క్ ఉద్యోగ షెడ్యూలింగ్ మరియు క్లస్టర్ రిసోర్స్ మేనేజ్‌మెంట్‌కు బాధ్యత వహిస్తుంది; పునరావృతతను నిర్వహించడానికి డేటా బహుళ యంత్రాలపై తగినంతగా విస్తరించిందని ఇది నిర్ధారిస్తుంది. పెద్ద డేటాను ప్రాసెస్ చేయడానికి హడూప్ సరసమైన మరియు ఖర్చుతో కూడుకున్న మార్గంగా మార్చుకునే మాడ్యూల్ YARN.
  • హడూప్ మ్యాప్‌రెడ్యూస్: గూగుల్ టెక్నాలజీపై నిర్మించిన ఈ YARN- ఆధారిత వ్యవస్థ, పెద్ద డేటా సెట్‌ల (నిర్మాణాత్మక మరియు నిర్మాణాత్మక) సమాంతర ప్రాసెసింగ్‌ను నిర్వహిస్తుంది. MPP మరియు NoSQL డేటాబేస్‌లతో సహా నేటి పెద్ద డేటా ప్రాసెసింగ్ ఫ్రేమ్‌వర్క్‌లలో కూడా మ్యాప్‌రెడ్యూస్ చూడవచ్చు.
ఈ మాడ్యూళ్లన్నీ కలిసి పనిచేసేటప్పుడు పెద్ద డేటా సెట్‌ల కోసం పంపిణీ చేయబడిన ప్రాసెసింగ్‌ను ఉత్పత్తి చేస్తుంది. హడూప్ ఫ్రేమ్‌వర్క్ కంప్యూటర్ల సమూహాలలో ప్రతిబింబించే సరళమైన ప్రోగ్రామింగ్ మోడళ్లను ఉపయోగిస్తుంది, అనగా సిస్టమ్ హార్డ్‌వేర్‌పై మాత్రమే ఆధారపడకుండా, పెరిగిన ప్రాసెసింగ్ శక్తి కోసం సింగిల్ సర్వర్‌ల నుండి వేలాది యంత్రాలకు స్కేల్ చేయగలదు.


పెద్ద డేటాతో పనిచేయడానికి అవసరమైన ప్రాసెసింగ్ శక్తిని నిర్వహించగల హార్డ్‌వేర్ ఖరీదైనది, తేలికగా చెప్పాలంటే. ఇది హడూప్ యొక్క నిజమైన ఆవిష్కరణ: బహుళ, చిన్న యంత్రాలలో భారీ మొత్తంలో ప్రాసెసింగ్ శక్తిని విచ్ఛిన్నం చేసే సామర్థ్యం, ​​ప్రతి దాని స్వంత స్థానికీకరించిన గణన మరియు నిల్వతో పాటు, వైఫల్యాలను నివారించడానికి అప్లికేషన్ స్థాయిలో అంతర్నిర్మిత పునరావృతంతో పాటు.

హడూప్ ఏమి చేస్తుంది?

సరళంగా చెప్పాలంటే, హడూప్ పెద్ద డేటాను ప్రాప్యత చేస్తుంది మరియు అందరికీ ఉపయోగపడేలా చేస్తుంది.


హడూప్‌కు ముందు, పెద్ద డేటాను ఉపయోగిస్తున్న కంపెనీలు ఎక్కువగా రిలేషనల్ డేటాబేస్‌లు మరియు ఎంటర్‌ప్రైజ్ డేటా గిడ్డంగులతో (ఇవి భారీ మొత్తంలో ఖరీదైన హార్డ్‌వేర్‌ను ఉపయోగిస్తాయి) చేశాయి. నిర్మాణాత్మక డేటాను ప్రాసెస్ చేయడానికి ఈ సాధనాలు గొప్పవి అయినప్పటికీ - ఇది ఇప్పటికే క్రమబద్ధీకరించబడిన మరియు నిర్వహించదగిన విధంగా నిర్వహించబడిన డేటా - నిర్మాణాత్మక డేటాను ప్రాసెస్ చేసే సామర్థ్యం చాలా పరిమితం, ఇది ఆచరణాత్మకంగా ఉనికిలో లేదు. ఉపయోగపడేలా ఉండటానికి, డేటా మొదట నిర్మాణాత్మకంగా ఉండాలి కాబట్టి ఇది పట్టికలలో చక్కగా సరిపోతుంది.


హడూప్ ఫ్రేమ్‌వర్క్ ఆ అవసరాన్ని మారుస్తుంది మరియు చౌకగా చేస్తుంది. హడూప్‌తో, నిర్మాణాత్మక మరియు నిర్మాణాత్మకమైన 10 నుండి 100 గిగాబైట్ల మరియు అంతకంటే ఎక్కువ డేటాను సాధారణ (కమోడిటీ) సర్వర్‌లను ఉపయోగించి ప్రాసెస్ చేయవచ్చు.


హడూప్ ప్రతి పరిశ్రమలో, అన్ని పరిమాణాల వ్యాపారాల కోసం పెద్ద డేటా అనువర్తనాలను తెస్తుంది. పోర్ట్‌ఫోలియో మూల్యాంకనం మరియు రిస్క్ విశ్లేషణ కోసం అధునాతన నమూనాలను రూపొందించడానికి ఓపెన్-సోర్స్ ఫ్రేమ్‌వర్క్ లేదా ఆన్‌లైన్ రిటైలర్లు వారి శోధన సమాధానాలను చక్కగా తీర్చిదిద్దడానికి మరియు వినియోగదారులను వారు కొనుగోలు చేసే ఉత్పత్తుల వైపు చూపించడానికి అనుమతిస్తుంది.


హడూప్‌తో, అవకాశాలు నిజంగా అపరిమితమైనవి.

ఏమి $ @! హడూప్?