హోమ్ ఆడియో ప్రసంగం నుండి వచనం మరియు చాట్‌బాట్‌ల మధ్య తేడా ఏమిటి?

ప్రసంగం నుండి వచనం మరియు చాట్‌బాట్‌ల మధ్య తేడా ఏమిటి?

Anonim

Q:

ప్రసంగం నుండి వచనం మరియు చాట్‌బాట్‌ల మధ్య తేడా ఏమిటి?

A:

స్పీచ్-టు-టెక్స్ట్ టెక్నాలజీస్ మరియు చాట్‌బాట్‌ల మధ్య అనేక ముఖ్యమైన తేడాలు చాట్‌బాట్ మరియు వాయిస్‌బాట్ ప్రాజెక్టుల యొక్క వేగవంతమైన పరిణామంలో పరిశీలించబడుతున్న వాటిలో భాగం.

స్పీచ్-టు-టెక్స్ట్ టెక్నాలజీ అనేది శబ్ద ప్రసంగాన్ని డిజిటల్ పేజీలోని వచనంగా మారుస్తుంది. ఇది దాని పూర్తి ఫంక్షన్, కానీ ఇది డిజైన్ చేయడం సులభం కాదు. శబ్ద ప్రసంగాన్ని వచనంగా మార్చడానికి, సాంకేతికత పదాలు మరియు వాక్యాలను వ్యక్తిగత ఫోన్‌మేస్‌లుగా విడగొట్టాలి మరియు సంక్లిష్టమైన అల్గోరిథంల ప్రకారం వాటితో కలిసి పనిచేయాలి, ఇది ఖచ్చితమైన మరియు వక్త చెప్పినదానికి ప్రాతినిధ్యం వహిస్తుంది.

మరోవైపు, చాట్‌బాట్‌లు మానవుడితో కమ్యూనికేట్ చేసే లక్ష్యాన్ని సాధించే సాంకేతికతలు. చాట్‌బాట్‌లలో రెండు రకాలు ఉన్నాయి: టెక్స్ట్ చాట్‌బాట్‌లు మరియు వాయిస్‌బాట్‌లు. వచన చాట్‌బాట్‌లు చాలా ఎక్కువ కాలం ఉన్నాయి, ఎందుకంటే వాటికి వాయిస్‌బాట్‌లు ఉపయోగించుకునే స్పీచ్-టు-టెక్స్ట్ ఎలిమెంట్ అవసరం లేదు.

స్పీచ్-టు-టెక్స్ట్ టెక్నాలజీస్ మరియు చాట్‌బాట్‌ల మధ్య ప్రధాన వ్యత్యాసం స్కోప్. చెప్పినట్లుగా, ప్రసంగం నుండి వచన సాంకేతిక పరిజ్ఞానం చేయవలసిందల్లా శబ్ద ప్రసంగాన్ని లిప్యంతరీకరించడం. మరోవైపు, చాట్‌బాట్ ఏ రూపంలోనైనా ప్రసంగాన్ని తీసుకోవాలి, అర్థం చేసుకోవాలి మరియు ట్యూరింగ్ పరీక్షలో ఉత్తీర్ణత సాధించే ప్రతిస్పందనలను అందించాలి - ఒక సాంకేతిక పరిజ్ఞానం మనిషిని అతడు లేదా ఆమె అని ఆలోచిస్తూ మోసం చేయగలదా అనే పరీక్ష మరొక వ్యక్తితో మాట్లాడటం.

దీన్ని దృష్టిలో ఉంచుకుని, వాయిస్‌బాట్‌ల కంటే చాట్‌బాట్‌లను సృష్టించడం చాలా సులభం. చాట్‌బాట్ మానవుడి వచనంలో పడుతుంది మరియు వచన ప్రతిస్పందనను అందిస్తుంది. సాపేక్షంగా సరళమైన చాట్‌బాట్‌లు కూడా 1980 ల చివరి నుండి 1990 ల ప్రారంభం నుండి మానవులకు ఆసక్తికరమైన మరియు ఆనందించే ఫలితాలను అందించగలిగాయి.

మరోవైపు, వాయిస్‌బాట్ శబ్ద ప్రసంగాన్ని తీసుకోవాలి, దానిని టెక్స్ట్‌గా మార్చాలి, ఖచ్చితత్వం కోసం దాన్ని తనిఖీ చేయాలి, ప్రతిస్పందనను ఉత్పత్తి చేయాలి మరియు యంత్ర భాష నుండి ఆ ప్రతిస్పందనను వినగల ప్రసంగంగా రూపొందించాలి. ఈ పెద్ద సంఖ్యలో చాలా ముఖ్యమైన పనులు అంటే, వాయిస్‌బాట్ చాలా కంప్యూటింగ్ శక్తిని మరియు నిర్మించడానికి చాలా డిజైన్‌ను తీసుకుంటుంది.

సిరి, కోర్టానా మరియు అలెక్సా వంటి ప్రాజెక్టులు వాయిస్‌బాట్ టెక్నాలజీల వాన్గార్డ్‌లో కొంత భాగాన్ని ప్రదర్శిస్తాయి. ఈ సాంకేతికత ఇంకా ప్రారంభ దశలోనే ఉందని వారు వివరిస్తున్నారు. అలెక్సా మరియు ఇతర సాంకేతిక పరిజ్ఞానాలు మానవ ప్రసంగానికి మాటలతో స్పందించగలిగినప్పటికీ, అవి సాధారణంగా మనం శబ్ద మానవ ప్రసంగానికి అనుబంధం కలిగివుంటాయి. మరో మాటలో చెప్పాలంటే, ఈ సాంకేతికతలు అందించగల ప్రతిస్పందనలకు కొంత పరిమితి ఉంది. నేటి తరం వ్యక్తిగత సహాయకుల యొక్క పరిమిత సామర్థ్యం కూడా ఉంది, ఉదాహరణకు, ఒక ఇమెయిల్‌ను లిప్యంతరీకరించడం లేదా ఎవరైనా తమ చేతులను ఉపయోగించకుండా ఒక వ్యాసం రాయడానికి సహాయపడటం. మార్కెట్లో కొన్ని నిర్దిష్ట స్పీచ్-టు-టెక్స్ట్ ప్రోగ్రామ్‌లు సిరి లేదా కోర్టానా కంటే మెరుగ్గా చేస్తాయి, బహుశా వనరుల కేటాయింపు వల్ల. ఏదేమైనా, వాయిస్ బాట్ పురోగతి త్వరలో బయలుదేరబోతున్నట్లు సంకేతాలు ఉన్నాయి - అమెజాన్ యొక్క లెక్స్ ప్లాట్ఫాం వంటివి ఈ రకమైన సాంకేతిక పరిజ్ఞానాలను నిర్మించడానికి స్టూడియో వాతావరణాన్ని అనుమతిస్తుంది.

ఈ విషయంపై తెలివైన మరియు బోధనాత్మక వ్యాసంలో, టోబియాస్ గోబెల్ ఈ సాంకేతిక పరిజ్ఞానాల మధ్య వ్యత్యాసం గురించి మాట్లాడుతుంటాడు, “లిప్యంతరీకరణ” ప్రక్రియకు భిన్నంగా, ఏ ప్రసంగం వచనానికి, అర్థం చేసుకునే పనికి, ఏ చాట్‌బాట్‌లు చేయాల్సి ఉంటుంది.

"ప్రసంగ గుర్తింపు యొక్క అవసరాన్ని తొలగించడం చాట్‌బాట్ కోసం విషయాలను సులభతరం చేస్తుంది, పనితీరు బాట్లను నిర్మించటానికి ప్రధాన సవాలు సహజ భాషా అవగాహనలో ఉంది" అని గోబెల్ వ్రాశారు.

పరిశ్రమలో ప్రస్తుత ఆటగాళ్లను గోబెల్ కూడా గుర్తిస్తాడు:

ప్రసంగ గుర్తింపు కోసం మార్కెట్ నాయకుడు నుయాన్స్, అతను పిసిలో డిక్టేషన్ కోసం డ్రాగన్ నేచురల్లీ స్పీకింగ్ వంటి ప్రసిద్ధ వ్యవస్థల వెనుక ఉన్నాడు, ఇది తొంభైల నుండి ఉంది, కానీ సిరి: ఆపిల్ క్లౌడ్‌లో నిర్వహించిన ప్రసంగ గుర్తింపు / ట్రాన్స్క్రిప్షన్ పని తెర వెనుక స్వల్ప సాంకేతికత. ఇతరులు లుమెన్‌వాక్స్, వెర్బియో, లేదా ఇంటరాక్షన్స్, అయితే ఇప్పుడు అమెజాన్, గూగుల్, మైక్రోసాఫ్ట్ మరియు ఐబిఎమ్ వంటివారు API ల ద్వారా ప్రసంగ గుర్తింపును క్లౌడ్ సేవగా అందిస్తున్నారు.

చాట్‌బాట్‌లు అభివృద్ధి చెందుతున్నప్పుడు, వారి అవగాహన కొన్ని పథాలపై పెరుగుతూనే ఉంటుందని is హించబడింది - మరియు ఎక్కువ బోట్ టెక్నాలజీ టెక్స్ట్ ఇంటర్‌ఫేస్‌ల నుండి శబ్ద ఇంటర్‌ఫేస్‌లకు వెళుతుందని, దీనికి అదనపు మొత్తంలో కంప్యూటింగ్ శక్తి అవసరమని కూడా is హించబడింది.

ప్రసంగం నుండి వచనం మరియు చాట్‌బాట్‌ల మధ్య తేడా ఏమిటి?