“他们在不动嘴唇的情况下再次交谈”:由于神经界面 - Techguru

简而言之
  • 🧠大脑解码:使用神经假体来翻译声音语音皮质的信号。
  • ⏱️减少时间:这种新方法消除了传统的8秒钟,几乎实时提供通信。
  • 🔊AI训练:训练得益于沉默的大脑活动和人声合成以产生自然语音。
  • 💡潜在影响:由于这种创新的技术,严重麻痹的人的生活质量有了显着改善。

言语神经假设领域的最新技术进步有望改变严重瘫痪的人的生活。得益于人工智能推动的连续传播方法,研究人员迈出了重要的一步。通过大大减少思想和言语之间的时间,这项技术提供了一线希望,以改善许多患者的生活质量。让我们探讨这一引人入胜的创新及其革命潜力的细节。

先进的技术来解码思想

加利福尼亚大学伯克利分校和旧金山的研究人员开发了一种神经假体,利用AI将大脑活动转化为语音。通过靶向大脑中的语音控制中心发动机皮层,该技术几乎可以立即解码神经信号以产生一个可听见的单词。这种革命性的方法使迅速的解码能力更接近Neuroprothèses的Alexa和Siri等设备。研究人员使用类似的算法来解码神经数据,并首次允许几乎同步的声音扩散。这一发展为瘫痪的人开辟了更自然和流畅的人声合成的道路。

该过程意味着拦截了思想转化为发音的信号,从而拦截了电动机命令。这项创新使得从神经活动中产生流体语音成为可能,从而改善了患者的用户体验。

IA培训和学习

为了训练他们的AI,研究人员要求参与者试图默默地发音显示句子,从而记录相应的大脑活动。例如,参与者的安(Ann)尝试了句子:“嗨,你好吗?” »。这种方法使得在生成的神经元活动窗口和她试图说的而不发声的目标句子之间创建制图。

然后,AI使用该大脑活动根据计划的语音生成模拟音频,从而使训练系统成为可能。此外,研究人员使用了现有的语音合成技术和参与者的过去声音记录来创建现实的音频输出。这种技术的组合提高了综合语音的准确性和流动性,从而使体验更加自然和令人信服。

将延迟减少到仅一秒钟

先前关于脑部计算机界面的研究遭受了8秒的影响,将大脑活动转化为语音。新的连续扩散方法消除了这种差异,几乎实现了实时输出。这种进步使您可以通过大脑信号实时产生清晰可理解的语音。

为了确保AI真正学到并且不仅重复了记忆模式,研究人员还测试了其使用北约语音字母生成新单词的能力。该模型已经成功,证明它实际上了解了声音或声音的基本要素。这一进步使BCI技术更接近自然语音的生产,现在研究人员正在专注于通过合成未来改进的声音来增加情感表达力。

瘫痪者的前途未来

这项技术为改善严重麻痹的个体的生活提供了巨大的潜力。他们将能够思考一句话,并在一秒钟内大声宣布它。结果在《自然神经科学》杂志上报道,强调了这一进步的重要性。情感表现力的增加以及真实时间交流的可能性标志着语音神经前锋领域的转折点。

尽管研究继续发展,但我们可以期望其他改进,这将使用户体验更加丰富。这项创新使我们思考:这项技术在我们的日常生活中还能拥有哪些其他应用,以及它如何改变我们对人类交流的理解?

你喜欢它吗?4.5/5(24)