హోమ్ సాఫ్ట్వేర్ వాయిస్ గుర్తింపు సాంకేతికత: సహాయకారిగా లేదా బాధాకరంగా ఉందా?

వాయిస్ గుర్తింపు సాంకేతికత: సహాయకారిగా లేదా బాధాకరంగా ఉందా?

విషయ సూచిక:

Anonim

మీరు ఎప్పుడైనా కొంత సహాయం పొందడానికి లేదా మీ బిల్లు చెల్లించడానికి ఒక సంస్థను పిలిచారా, మీతో సంభాషించాలనుకునే ఆహ్లాదకరమైన రికార్డ్ చేసిన స్వరంతో మాత్రమే పలకరించబడతారు - కాని మీరు చెబుతున్న దానిలో సగం అర్థం కాలేదు? లేదా మీరు ఐఫోన్ కలిగి ఉండవచ్చు, మరియు సిరి మొదట మంచి మిత్రుడిలా కనిపించినప్పటికీ, కొన్నిసార్లు (సరే, నిజాయితీగా ఉండండి, తరచుగా) ఆమెకు అది లభించదని మీరు గ్రహించారా? స్పీచ్-టు-టెక్స్ట్ అని కూడా పిలువబడే వాయిస్ రికగ్నిషన్ టెక్నాలజీ (VRT) ఒక సాధారణ ఉచ్చులో పడిపోతుంది: ఇది చాలా చల్లగా ఉండే అవకాశం ఉంది (మరియు అబ్బాయి, మేము దాని కోసం పాతుకుపోతున్నాము), కానీ చాలా తరచుగా, ఇది దంతాలు రుబ్బుట నిరాశతో వ్యాయామం చేయండి.


సైన్స్ ఫిక్షన్ రంగానికి చెందిన ఒక ఆలోచన, 1950 వ దశకంలో, వాయిస్ గుర్తింపు దాని శైశవదశలోనే పెరిగింది, బెల్ లాబొరేటరీస్ ఆడ్రీ వ్యవస్థ ఒకే స్వరంలో మాట్లాడే అంకెలను గుర్తించడానికి రూపొందించబడినప్పుడు, మేము ఇప్పుడు సంభాషించే ఆధునిక ఎలక్ట్రానిక్స్ నెట్‌వర్క్‌కు. రోజువారీగా - మిశ్రమ ఫలితాలతో.

మానవుడితో మాట్లాడటానికి, దయచేసి 0 నొక్కండి

నేటి వ్యాపారాలు చాలా ఇప్పుడు కస్టమర్ సేవా కాల్‌లను నిర్వహించడానికి ఇంటరాక్టివ్ వాయిస్ రెస్పాన్స్ (ఐవిఆర్) అనే వ్యవస్థలను ఉపయోగిస్తున్నాయి. వాయిస్-నావిగేటెడ్ మెనుల కోసం చాలా సాధారణ ఉపయోగం, కానీ కొన్ని కంపెనీలు కస్టమర్ ఖాతా సమాచారాన్ని యాక్సెస్ చేయగల మరియు చిన్న ప్రశ్నలకు సమాధానం ఇవ్వగల IVR వ్యవస్థలను ఉపయోగిస్తాయి. మెనూ IVR సాఫ్ట్‌వేర్ సాధారణంగా పరిమిత పదజాలం కలిగి ఉంటుంది, ఇది "అవును, " "లేదు" మరియు సంఖ్యలకు పరిమితం కావచ్చు. మరింత సంక్లిష్టమైన వ్యవస్థలు సంస్థ-నిర్దిష్ట పదాలు మరియు పదబంధాలను గుర్తించగలవు.


ఈ వ్యవస్థలు మరింత ప్రాచుర్యం పొందుతున్నాయి - కనీసం వ్యాపారాల కోసం - ఒక సాధారణ కారణం కోసం: అవి ఖర్చుతో కూడుకున్నవి. వాల్ స్ట్రీట్ జర్నల్ యొక్క 2010 నివేదిక ప్రకారం, ఒక ఏజెంట్‌ను చేరే సాధారణ కస్టమర్ కాల్ $ 3 మరియు $ 9 మధ్య ఖర్చవుతుంది, అయితే ఆటోమేటెడ్ సిస్టమ్ ద్వారా నిర్వహించబడే కాల్‌కు ఐదు నుండి ఏడు సెంట్లు మాత్రమే ఖర్చవుతుంది. మరియు, వాస్తవానికి, కంప్యూటర్ ప్రోగ్రామ్‌లు అలసిపోవు, అనారోగ్యంతో పిలవవు, లేదా కస్టమర్‌లతో విసుగు చెందవు (కస్టమర్లు ఖచ్చితంగా వారితో విసుగు చెందినా!).


అదృష్టవశాత్తూ, ఇది ఎల్లప్పుడూ IVR ప్రజల నుండి ఉద్యోగాలను తీసుకుంటుందని కాదు - లేదా కనీసం ప్రజలందరూ కాల్ సెంటర్ల నుండి కనుమరుగవుతున్నారని కాదు. ఈ వాయిస్-యాక్టివేటెడ్ హెల్పర్స్ కాల్స్ దర్శకత్వం మరియు సాధారణ ప్రశ్నలకు సమాధానం ఇవ్వడం ద్వారా మానవ కస్టమర్ సేవా ప్రతినిధులను మరింత ఉత్పాదకంగా ఉండటానికి అనుమతిస్తాయి.


ఈ సాంకేతిక పరిజ్ఞానాలతో సంభాషించే మానవ వినియోగదారులకు, ఇది ఎల్లప్పుడూ సున్నితమైన నౌకాయానం కాదు. ఐవిఆర్ టెక్నాలజీలో ఉచ్ఛారణలతో ఇబ్బంది వంటి సాధారణ సమస్యలను మెరుగుపరచడానికి టెక్నాలజీ సహాయపడుతుంది, అయితే ఆటోమేటెడ్ సిస్టమ్స్‌ను తొలగించడం ఇప్పటికీ ఆన్‌లైన్‌లో సాధారణ ఇతివృత్తం. వాయిస్ గుర్తింపుతో కూడిన ఎలివేటర్ గురించి ఈ కామెడీ స్కిట్‌ను చూడండి, ఇది IVR వ్యవస్థల్లోని లోపాలు ఉత్పత్తి చేయగల నిరాశను హైలైట్ చేస్తుంది.

వ్యక్తిగత ఫోన్ అనువర్తనాలు: సిరి, గూగుల్ నౌ

స్మార్ట్‌ఫోన్‌ల కోసం వాయిస్ రికగ్నిషన్ గురించి చాలా మందికి తెలుసు. 2011 లో ఐఫోన్ 4 ఎస్ కోసం స్వల్పంగా వ్యంగ్యంగా, వాయిస్-యాక్టివేట్ చేసిన "పర్సనల్ అసిస్టెంట్" అయిన సిరిని ఆపిల్ పరిచయం చేసినప్పుడు తాజా ఫోన్ మోడళ్లలో ఎక్కువ భాగం విఆర్ తో వచ్చినప్పటికీ, వారి ప్రజాదరణ మరియు అపఖ్యాతి పెరిగింది. గూగుల్ త్వరలో ప్రత్యక్ష పోటీదారుని సృష్టించింది: గూగుల్ ఇప్పుడు Android Jelly Bean OS కోసం. రెండు వ్యవస్థలు స్త్రీ స్వరాలు మరియు అధునాతన గుర్తింపు లక్షణాలను కలిగి ఉంటాయి, ఇవి వినియోగదారులను సాధారణ భాషని ఉపయోగించి వారి ఫోన్‌లతో "మాట్లాడటానికి" అనుమతిస్తాయి.


ఈ వ్యవస్థలు వారి పూర్వీకుల కంటే చాలా అధునాతనమైనవి మరియు క్రియాత్మకమైనవి అయినప్పటికీ, సాంకేతిక పరిజ్ఞానం ఇంకా చాలా దూరం వెళ్ళవలసి ఉందని వారు చూపిస్తున్నారు. సిరి వైఫల్యం గురించి జోకులు ఒక ప్రముఖ ఇంటర్నెట్ పోటిగా మారాయి. సిరి సామర్థ్యాలకు సంబంధించి తప్పుడు ప్రకటనల కోసం ఒక వ్యక్తి ఆపిల్‌పై కేసు పెట్టాడు.


ఆపిల్ సిరిని అధునాతనంగా మరియు సమాచారంగా సృష్టించేటప్పుడు, VR సాఫ్ట్‌వేర్ కూడా సాసీ వైపు కొద్దిగా ఉంటుంది. ఉదాహరణకు, మీరు 1968 చలన చిత్రం "2001: ఎ స్పేస్ ఒడిస్సీ" - "పాడ్ బే తలుపులు తెరవండి" నుండి సినిమా చరిత్రలో అత్యంత అపఖ్యాతి పాలైన ఇంటెలిజెన్స్ టెక్నాలజీ లైన్లలో ఒకటి మాట్లాడితే - సిరి సినిమా నుండి సమాధానమిచ్చే పంక్తితో ప్రతిస్పందిస్తారు, " నన్ను క్షమించండి (మీ పేరు), నేను అలా చేయలేనని భయపడుతున్నాను "లేదా మరింత వ్యంగ్యంగా, " మేం ఇంటెలిజెన్స్ ఏజెంట్లు ఎప్పటికీ జీవించరు, స్పష్టంగా. "


సిరిని ప్రేమించడం సులభతరం చేయడానికి ప్రయత్నించే ఫంక్షన్లలో ఒకటి, మరియు కొంచెం ఎక్కువ మానవుడు. VR అసిస్టెంట్ కాల్స్ చేయడానికి, డిక్టేషన్ తీసుకోవటానికి మరియు పాఠాలను పంపడానికి, సమాచారం కోసం ఇంటర్నెట్ శోధనలు చేయటానికి, సమీపంలోని దుకాణాలను కనుగొనటానికి, డ్రైవింగ్ దిశలను ఇవ్వడానికి మరియు మరెన్నో వాయిస్ ఆదేశాలను అనుసరించవచ్చు. సమాధానాలు ఒకేసారి ఫోన్ ద్వారా మాట్లాడబడతాయి మరియు తెరపై ప్రదర్శించబడతాయి.


గూగుల్ నౌ, ఆండ్రాయిడ్ జెల్లీబీన్ ప్లాట్‌ఫాం యొక్క వీఆర్ భాగం సిరికి చాలా పోలి ఉంటుంది. సాధారణ ప్రసంగాన్ని ఆదేశాలకు అనువదించడం ద్వారా సిస్టమ్ అదే విస్తృతమైన గుర్తింపు సామర్థ్యాలను అందిస్తుంది, ఇది వినియోగదారులను కాల్ చేయడానికి, పాఠాలను పంపడానికి, శోధనలను అమలు చేయడానికి, గణనలను మరియు మార్పిడులను నిర్వహించడానికి, పద నిర్వచనాలను పట్టుకోవటానికి, అలారాలను సెట్ చేయడానికి, పాటలను ప్లే చేయడానికి మరియు పటాలు మరియు దిశలను పొందడానికి వినియోగదారులను అనుమతిస్తుంది.


సిరి మరియు గూగుల్ నౌ వంటి వ్యక్తిగత వాయిస్ అసిస్టెంట్లతో, ప్రయోజనాలు స్పష్టంగా ఉన్నాయి. కాల్ మరియు టెక్స్టింగ్ నుండి శోధన మరియు వినోదం వరకు ప్రతిదీ వేగంగా మరియు సులభంగా ఉంటుంది. మీకు కావలసినది చెప్పండి మరియు (ఎక్కువ సమయం) VR అనువర్తనం మీ కోసం దాన్ని పట్టుకుంటుంది. డ్రైవింగ్ చేసేటప్పుడు వీఆర్ యొక్క హ్యాండ్-ఆఫ్ టెక్నాలజీ ముఖ్యంగా సహాయపడుతుంది. చాలా మంది ప్రజలు సిరి యొక్క లోపాలను ఖండించారు, మరియు వినియోగదారుల జీవితాలను తప్పనిసరిగా నడిపించే గూగుల్ నౌ యొక్క సామర్థ్యం రెండూ కొంచెం అవమానకరమైనవి అని రచయితలు వాదించారు, చాలా మంది ఇప్పటికీ ఈ భవిష్యత్ సాంకేతికతలు చాలా బాగున్నాయని భావిస్తున్నారు.


వాస్తవానికి, సిరి మరియు గూగుల్ నౌ వంటి వ్యక్తిగత ఫోన్ అనువర్తనాలు సంపూర్ణంగా లేవు - అయినప్పటికీ భవిష్యత్తులో ఈ సాంకేతిక పరిజ్ఞానం ఎక్కడికి వెళ్ళవచ్చో అవి చూపిస్తాయి. అంటే సిరి తప్పు సమాధానం చెప్పినప్పుడు కూడా, మేము ఆమెను నవ్వి క్షమించే అవకాశం ఉంది, తరువాతి సంస్కరణ చాలా బాగుంటుందని తెలుసుకోవడం.

ఎక్కడ విఆర్ ఫాల్స్ ఫ్లాట్

మీరు వ్యాపారాన్ని పిలిచినప్పుడు మీరు ఎప్పుడైనా IVR ను ఎదుర్కొన్నట్లయితే, మీరు కమ్యూనికేషన్‌కు కొన్ని అడ్డంకులను గమనించవచ్చు. కొన్ని ప్రోగ్రామ్‌లు రోబోటిక్ టెక్స్ట్-టు-స్పీచ్ వాయిస్‌ని ఉపయోగిస్తాయి, ఇది పదాలను తప్పుగా ఉచ్చరిస్తుంది మరియు విషయాలు అర్థం చేసుకోవడం కష్టతరం చేస్తుంది. ఇతరులకు సున్నితత్వ సమస్యలు ఉన్నాయి, ఫలితంగా మీరు చాలా బిగ్గరగా, చాలా మృదువుగా లేదా జాగ్రత్తగా ప్రోత్సహించకపోతే సాఫ్ట్‌వేర్ మీరు చెప్పేదాన్ని ప్రాసెస్ చేయలేకపోతుంది.


అదనంగా, చాలా మంది ఇప్పటికీ యంత్రంతో మాట్లాడటం సుఖంగా లేదు. మీరు IVR లో కొన్ని శోధనలను నడుపుతుంటే, IVR వ్యవస్థలను దాటవేయడానికి మరియు "నిజమైన వ్యక్తి" ను పొందడానికి ప్రజలు కలిసి ఉంచిన జాబితాలను మీరు ఎదుర్కొంటారు. ఈ పరిష్కారాలు "ఆపరేటర్ కోసం 0 నొక్కడం కొనసాగించండి" నుండి "యంత్రాన్ని మనిషిని పొందే వరకు ప్రమాణం చేయటం" వరకు ఉంటాయి. తత్ఫలితంగా, ఐవిఆర్ వ్యవస్థలలో ఇటీవలి అభివృద్ధిలో ఎక్కువ భాగం మానవులకు మరింత రుచికరమైనదిగా మారాయి; స్వరాలను మరింత సానుభూతితో మరియు తక్కువ రోబోటిక్గా మార్చడం, సిస్టమ్‌ను నావిగేట్ చేయడం సులభం చేస్తుంది మరియు మొత్తం విషయం ప్రారంభం నుండి చివరి వరకు ఎంత సమయం పడుతుందో కాలర్లకు తెలియజేయండి. మెరుగైన సాంకేతిక పరిజ్ఞానం ఇక్కడ సగం యుద్ధం మాత్రమే అని సూచిస్తుంది; మిగతా సగం యంత్రంతో మాట్లాడటం ద్వారా వినియోగదారులను బోర్డులోకి తీసుకువస్తోంది.

వాట్ ది ఫ్యూచర్

ఈ సవాళ్లు ఉన్నప్పటికీ, వాయిస్ రికగ్నిషన్ టెక్నాలజీ అన్ని సమయాలలో మెరుగుపడుతోంది. సిరి మరియు గూగుల్ నౌ వంటి అనువర్తనాలు - లోపాలు మరియు అన్నీ ఇప్పటికీ వాటి పనితీరులో అసాధారణంగా ఆకట్టుకుంటాయి మరియు అనేక కంపెనీలు VR సామర్థ్యాలను ఇతర అనువర్తనాలకు విస్తరిస్తున్నాయి.


ఉదాహరణకు, డ్రాగన్ నేచురల్లీ స్పీకింగ్ స్పీచ్-టు-టెక్స్ట్ సాఫ్ట్‌వేర్ సృష్టికర్తలు అయిన న్యూయాన్స్ ఇప్పటికే టెలివిజన్లు మరియు ఆటోమొబైల్స్ కోసం వాయిస్ నియంత్రణలను అభివృద్ధి చేశారు మరియు ఈ సాంకేతిక పరిజ్ఞానం యొక్క సంస్కరణలు కొన్ని శామ్‌సంగ్ టీవీలు మరియు కొన్ని ఫోర్డ్ వాహనాల్లో ఉపయోగించే SYNC వినోద వ్యవస్థల్లో పొందుపరచబడ్డాయి.


గూగుల్ మరియు ఆపిల్ వారి వాయిస్ రికగ్నిషన్ టెక్నాలజీల కోసం కొత్త ఉపయోగాలను కనుగొనడం కొనసాగిస్తున్నప్పుడు, మా టెలివిజన్ల నుండి మా టోస్టర్ల వరకు అన్ని రకాల రోజువారీ యంత్రాలతో మనం ఎక్కువగా మాట్లాడుకునే అవకాశం ఉంది. మరియు, మరోసారి, సైన్స్ ఫిక్షన్ సరైనదనిపిస్తోంది. ఆ తెలివైన రచయితలు ఒక విషయం గురించి తప్పుగా ఉన్నారని మేము ఆశించాల్సి ఉంటుంది. ఈ యంత్రాలు స్వాధీనం చేసుకుంటే, మీరు సిరిని "పాడ్ బే తలుపులు తెరవమని" అడిగినప్పుడు మీరు చాలా ఇబ్బందుల్లో పడవచ్చు.

వాయిస్ గుర్తింపు సాంకేతికత: సహాయకారిగా లేదా బాధాకరంగా ఉందా?