मेन्यू मेन्यू

नई एआई ब्रेनवेव्स को जटिल भाषण में बदल देती है

दिन की डरावनी/शांत विज्ञान समाचारों में, अमेरिकी वैज्ञानिकों ने कंप्यूटर बनाने में एक महत्वपूर्ण कदम उठाया है जो सीधे हमारे दिमाग से संवाद करते हैं।

कैलिफोर्निया विश्वविद्यालय सैन फ्रांसिस्को (यूसीएसएफ) के न्यूरोसाइंटिस्ट और भाषण विशेषज्ञों ने एक कृत्रिम बुद्धिमत्ता विकसित की है जो मानव मस्तिष्क की तरंगों को पढ़ने और उन्हें भाषण में बदलने में सक्षम है।

सफलता, सबसे पहले रिपोर्ट की गई प्रकृति पत्रिका, उन दोनों के लिए निहितार्थ है जिनके पास ऐसी स्थितियां हैं जिनके कारण उन्हें भाषण की शक्ति (एमएस या स्ट्रोक पीड़ित, उदाहरण के लिए), और भविष्य के रोबोट सर्वनाश के लिए खर्च किया गया है। वे सचमुच हमारे विचारों को पढ़ सकते हैं अब दोस्तों क्या यह चिंतित होने का समय है?

सभी चुटकुले एक तरफ, यह तकनीक मानव तंत्र में मशीनों के निर्बाध एकीकरण के लिए पूरी तरह से ग्राउंड ब्रेकिंग है, संभावित रूप से प्रोग्रामिंग में उपयोगकर्ता इनपुट की आवश्यकता को कम करती है। अंत में, MS पेंट समझ जाएगा कि आप IRL बनाने में जो कामयाब रहे, वह नहीं था वास्तव में आपके सिर में क्या था।

ब्रेनवेव टू स्पीच इंटेलिजेंस ने पिछले दस वर्षों में तेजी से प्रगति की है, जो अतीत में कच्चे मस्तिष्क डेटा को शब्दों में अनुवाद करने में रुका हुआ है। स्नायविक पथों की जटिलता और प्रत्येक व्यक्ति के मस्तिष्क पैटर्न की वैयक्तिकता का अर्थ था कि आम तौर पर एक समय में केवल एक शब्द उत्पन्न करना संभव था।

हालाँकि, जबकि लोगों के विचार पैटर्न अद्वितीय और असीम रूप से जटिल होते हैं, मस्तिष्क से मुंह, जबड़े और जीभ तक भाषण देने वाले संकेत काफी सार्वभौमिक होते हैं। इसलिए, केवल मस्तिष्क का अध्ययन करने के बजाय, यूसीएसएफ के वैज्ञानिकों ने संवाद के दौरान तंत्रिका संबंधी संकेतों और मुंह की गति दोनों का विश्लेषण करने के लिए दो एआई का उपयोग किया।

नीचे दिया गया वीडियो आपको एक्स-रे दिखाता है कि जब हम बात करते हैं तो हमारा मुंह और गला वास्तव में कैसा दिखता है।

जब इन एआई द्वारा एकत्र की गई जानकारी को एक सिंथेसाइज़र में फीड किया गया, तो कुछ ऐसा जो कमोबेश जटिल वाक्यों से मिलता जुलता था।

परिणाम सही नहीं था। जबकि कृत्रिम तंत्रिका नेटवर्क ने फ्रिकेटिव्स को डिकोड करने में अच्छा प्रदर्शन किया - 'जहाज' में 'श' की तरह लगता है - यह अक्सर 'बॉब' में 'बी' जैसे प्लोसिव्स पर ठोकर खाता है। परिणामी ध्वनियाँ स्पष्ट रूप से मानवीय हैं, लेकिन शायद एक ऐसा मानव जिसके पास बहुत अधिक G&T हैं।

एनाटोमिकल एआई के लिए डेटा प्राप्त करने के लिए, वैज्ञानिकों ने मूल अंग्रेजी बोलने वाले स्वयंसेवकों को एक सौ शब्दों की सूचियां पढ़ीं, फिर उन्हें एल्गोरिदम से वापस खिलाए गए वाक्यों की व्याख्या की।

न्यूरोलॉजिकल एआई प्रबंधन के लिए थोड़ा अधिक जटिल था। टीम ने पांच लोगों के साथ काम किया, जिनकी खोपड़ी में मिर्गी के इलाज के लिए पहले से ही उच्च घनत्व वाले इलेक्ट्रोड एरे लगाए गए थे। इन उपकरणों को खोपड़ी के नीचे शल्य चिकित्सा द्वारा स्थापित करने की आवश्यकता है - एक आक्रामक, खतरनाक सर्जरी जो इस तकनीक की बाजार में जल्द ही हिट करने की क्षमता को सीमित करती है।

लेकिन प्रोफेसर ग्रेडन और ऑक्सले, और एलोन मस्क के स्टार्ट-अप न्यूरालिंक सहित दुनिया भर की अन्य टीमें कम-आक्रामक तरीकों पर काम कर रही हैं।

उनका समाधान इलेक्ट्रोड को छोटे, खोखले, ट्यूब जैसे मचानों से जोड़ना और फिर उन मचानों को मस्तिष्क में रक्त वाहिकाओं में प्रवाहित करना है। वे वहां बैठ सकते थे, मस्तिष्क के संकेतों को पढ़ सकते थे, बिना रक्त प्रवाह या मस्तिष्क में हस्तक्षेप किए। एक छोटे से दिमाग के पालतू जानवर की तरह।

इस वर्ष के अंत में एक मानव परीक्षण की योजना बनाई गई है। कोई स्वयमसेवक?

अभिगम्यता