菜单 菜单

新人工智能将脑电波转化为复杂的语音

在当天的可怕/酷炫科学新闻中,美国科学家在创造与我们的大脑直接通信的计算机方面向前迈出了重要的一步。

加州大学旧金山分校 (UCSF) 的神经科学家和语音专家开发了一种人工智能,能够读取人类脑电波并将其转换为语音。

突破,首次报道在 自然 杂志,对那些因疾病而丧失语言能力的人(例如 MS 或中风患者)以及未来的机器人启示录都有影响。 他们现在可以从字面上读出我们的想法,现在是时候担心了吗?

撇开所有笑话不谈,这项技术对于将机器无缝集成到人类机制中是完全开创性的,有可能减少用户在编程中的输入需求。 最后,MS Paint 会明白您设法创建的 IRL 并不是 通 你脑子里想的是什么。

脑电波到语音智能在过去十年中取得了快速进展,过去在将原始大脑数据翻译成文字方面停滞不前。 神经通路的复杂性,以及每个人大脑模式的个性,意味着通常一次只能生成一个单词。

然而,尽管人们的思维模式是独特且无限复杂的,但从大脑到嘴巴、下巴和舌头发出的信号却是相当普遍的。 因此,加州大学旧金山分校的科学家们不是只研究大脑,而是使用两个 AI 来分析神经信号和对话期间嘴巴的运动。

下面的视频向您展示了我们谈话时我们的嘴和喉咙实际上是什么样子的 X 射线视图。

当这些人工智能收集的信息被输入合成器时,就会产生或多或少类似于复杂句子的东西。

结果并不完美。 虽然人工神经网络在解码擦音方面做得很好——听起来像“ship”中的“sh”——但它经常在爆破音上绊倒,比如“bob”中的“b”。 由此产生的声音显然是人类的,但也许是一个拥有过多 G&T 的人类。

为了获得解剖 AI 的数据,科学家们让母语为英语的志愿者读出 XNUMX 个单词的列表,然后解释从算法反馈给他们的句子。

神经 AI 的管理要复杂一些。 该团队与五名已经在他们的头骨中安装了高密度电极阵列以治疗癫痫症的人合作。 这些设备需要通过外科手术安装在双桨下——这是一种侵入性、危险的手术,限制了这项技术很快进入市场的潜力。

但格雷登教授和奥克斯利教授以及世界各地的其他团队,包括埃隆马斯克的初创公司 Neuralink,正在研究侵入性较小的方法。

他们的解决方案是将电极连接到微小的、中空的、管状的支架上,然后将这些支架漂浮到大脑的血管中。 他们可以坐在那里,读取大脑信号,而不会干扰血流或大脑。 就像一个小小的大脑宠物。

计划在今年晚些时候进行人体试验。 有志愿者吗?

无障碍