హోమ్ ఆడియో కొన్ని యంత్ర అభ్యాస ప్రాజెక్టులకు అపారమైన నటులు ఎందుకు అవసరం?

కొన్ని యంత్ర అభ్యాస ప్రాజెక్టులకు అపారమైన నటులు ఎందుకు అవసరం?

Anonim

Q:

కొన్ని యంత్ర అభ్యాస ప్రాజెక్టులకు అపారమైన నటులు ఎందుకు అవసరం?

A:

మీరు యంత్ర అభ్యాసం గురించి ఆలోచించినప్పుడు, కంప్యూటర్ గదులలో కీబోర్డులపై పనిచేసే నైపుణ్యం కలిగిన డేటా శాస్త్రవేత్తల గురించి మీరు ఆలోచిస్తారు. పరిమాణాత్మక విశ్లేషణ మరియు అల్గోరిథంలకు తీవ్ర ప్రాధాన్యత ఉంది. ఈ కార్యక్రమాలలో చాలా వరకు వాస్తవ-ప్రపంచ సందర్భం చాలా లేదు - కనీసం, చాలామంది అనుకుంటారు.

ఏదేమైనా, నేటి కొన్ని అద్భుతమైన యంత్ర అభ్యాస కార్యక్రమాలు వీధిలో, దుకాణాలలో మరియు ఎక్కడైనా మానవ నటుల యొక్క నిజమైన సైన్యాలను వాకింగ్, పని లేదా షాపింగ్ వంటి ప్రాథమిక మానవ కార్యకలాపాలను మోడల్ చేయగలవు.

ఉచిత డౌన్‌లోడ్: మెషిన్ లెర్నింగ్ మరియు ఎందుకు ఇది ముఖ్యమైనది

టామ్ సిమోనైట్ రాసిన వైర్డు కథనం "AI ను తెలివిగా చేయడానికి, మానవులు ఆడ్బాల్ తక్కువ-చెల్లింపు పనులను చేస్తారు" అనే సముచితమైన శీర్షికతో దీన్ని బాగా వివరిస్తుంది.

హోల్ ఫుడ్స్ కిరాణా దుకాణంలో తీసిన చిన్న వీడియోల ఉదాహరణను ఉపయోగించి, సిమోనైట్ యంత్ర అభ్యాసం యొక్క తరువాతి దశలో కొన్నింటిని రూపొందించడానికి సహాయపడే పని రకాలను హైలైట్ చేస్తుంది.

ఈ వ్యక్తులందరూ స్వల్ప మరియు సరళమైన వీడియోలలో తమను తాము చిత్రీకరించడంలో ఎందుకు నిమగ్నమై ఉన్నారు అనే ప్రశ్నకు ఇది దారితీస్తుంది.

యంత్ర అభ్యాసం ఎక్కడ ఉంది మరియు ఎక్కడికి వెళుతోంది అనే దానిపై సమాధానం కొంత వెలుగునిస్తుంది.

"పరిశోధకులు మరియు పారిశ్రామికవేత్తలు AI భౌతిక ప్రపంచంలో అర్థం చేసుకుని పనిచేయాలని చూడాలనుకుంటున్నారు" అని సిమోనైట్ వ్రాస్తూ, అతను మరియు ఇతరులు కెమెరాలతో ఎందుకు తిరుగుతున్నారో వివరిస్తున్నారు. "అందువల్ల కార్మికులు సూపర్ మార్కెట్లు మరియు గృహాలలో దృశ్యాలను ప్రదర్శించాల్సిన అవసరం ఉంది. ప్రపంచం మరియు దానిలోని వ్యక్తుల గురించి అల్గోరిథంలను బోధించడానికి వారు బోధనా సామగ్రిని రూపొందిస్తున్నారు. ”

చాలా మంది నిపుణులు ఎత్తి చూపినట్లుగా, యంత్ర అభ్యాసం యొక్క అతిపెద్ద సరిహద్దులలో ఇమేజ్ ప్రాసెసింగ్ మరియు సహజ భాషా ప్రాసెసింగ్ ఉంటాయి. ఇవి చాలా పరిమాణాత్మక విధానాలు - మరో మాటలో చెప్పాలంటే, "ప్రదర్శన" వాస్తవ-ప్రపంచ పరిసరాలలో ఉన్నట్లుగా విస్తృత స్పెక్ట్రం ఇన్‌పుట్‌లు లేవు. బదులుగా, యంత్ర అభ్యాస కార్యక్రమాలు దృశ్యాలను మరియు ఆడియో డేటాను నమూనాలను రూపొందించడానికి చాలా నిర్దిష్ట మార్గాల్లో ఉపయోగిస్తున్నాయి. ఇమేజ్ ప్రాసెసింగ్‌తో, ఇది (పరిమిత) దృష్టి క్షేత్రం నుండి లక్షణాలను ఎంచుకుంటుంది. NLP కోసం, ఇది ఫోన్‌మేస్‌లను సమీకరిస్తోంది.

ఈ నిర్దిష్ట ఇన్పుట్ వర్గాలకు మించి మీరు "ఇమేజ్ మరియు స్పీచ్ గ్యాప్" అని పిలుస్తారు - ఇమేజ్ ప్రాసెసింగ్ మరియు స్పీచ్ రికగ్నిషన్ వంటి వాటికి మించి, మీరు కంప్యూటర్లు వివిధ మార్గాల్లో విశ్లేషణాత్మకంగా ఉండవలసిన ప్రాంతాలకు వెళుతున్నారు. శిక్షణా సెట్లు ప్రాథమికంగా భిన్నంగా ఉంటాయి.

వీడియోగ్రాఫర్‌ల సైన్యాన్ని నమోదు చేయండి. ఈ కొత్త యంత్ర అభ్యాస ప్రాజెక్టులలో, మానవ కార్యకలాపాల యొక్క చిన్న ఆలోచనలు శిక్షణా సమితులు. వర్గీకరణ పనుల్లో కంపోజ్ చేసే ఫీచర్లు మరియు అంచులు మరియు పిక్సెల్‌ల కోసం శిక్షణ పొందటానికి బదులుగా, కంప్యూటర్లు వివిధ రకాలైన చర్య ఎలా ఉంటుందో అంచనా వేయడానికి శిక్షణ వీడియోలను ఉపయోగిస్తున్నాయి.

ముఖ్య విషయం ఏమిటంటే, ఈ డేటాను సమగ్రపరచినప్పుడు మరియు లోడ్ చేసినప్పుడు మరియు కంప్యూటర్ దానిపై శిక్షణ పొందినప్పుడు ఇంజనీర్లు ఏమి చేయగలరు. మీరు త్వరలో వివిధ రంగాలలో ఫలితాలను చూస్తారు - ఉదాహరణకు, ఇది నిఘా చాలా ప్రభావవంతంగా ఉంటుంది. కంప్యూటర్లు ప్రజలు ఏమి చేస్తున్నారో దృశ్య రంగంలో "చూడగలుగుతారు" మరియు మార్కెటింగ్ మరియు అమ్మకాలు వంటి రంగాలకు వర్తింపజేయవచ్చు లేదా కొన్ని సందర్భాల్లో ప్రభుత్వ సంస్థ పని లేదా నేర న్యాయం.

గరిష్ట ప్రయోజనం మరియు గోప్యతా ప్రశ్నల మధ్య చర్చకు కూడా కొంత వెలుగునిస్తుంది. ఈ వీడియోల యొక్క ఎక్కువ భాగం నిఘా కోసం పనిచేసే యంత్ర అభ్యాస నమూనాలను నిర్మిస్తుంది - కాని పర్యవేక్షించటానికి ఇష్టపడని వ్యక్తుల గురించి ఏమిటి? ఈ కొత్త యంత్ర అభ్యాస కార్యక్రమాలు బహిరంగ ప్రదేశంలో అమర్చబడినప్పుడు, వ్యక్తి యొక్క హక్కులు ఏమిటి మరియు ఆ రేఖ ఎక్కడ గీస్తారు?

ఏదేమైనా, కంపెనీలు ఈ రకమైన మానవ మరియు వీడియో వనరులను యంత్ర అభ్యాస పురోగతి యొక్క కొన్ని తదుపరి స్థాయి రౌండ్లలోకి నిజంగా తీయడానికి ఉపయోగిస్తున్నాయి, ఇవి కంప్యూటర్లను చిత్రాలను వర్గీకరించడం లేదా ఫోన్‌మేస్‌తో పనిచేయడం కంటే వాటి చుట్టూ ఏమి జరుగుతుందో గుర్తించడానికి వీలు కల్పిస్తాయి. ప్రసంగం. ఇది కృత్రిమ మేధస్సులో చాలా ఆసక్తికరమైన మరియు వివాదాస్పదమైన అభివృద్ధి, మరియు టెక్ మీడియాలో మరియు అంతకు మించి దాని దృష్టిని పంచుకోవడానికి అర్హమైనది.

కొన్ని యంత్ర అభ్యాస ప్రాజెక్టులకు అపారమైన నటులు ఎందుకు అవసరం?