切换到宽版
  • 38阅读
  • 2回复

[数码讨论]脑机接口技术迎来重大突破:可使渐冻症患者重新流畅说话、唱歌[2P] [复制链接]

上一主题 下一主题
在线jjybzxw

UID: 551814

 

发帖
167987
金币
275183
道行
2004
原创
2404
奖券
2775
斑龄
35
道券
1005
获奖
0
座驾
设备
摄影级
在线时间: 38224(小时)
注册时间: 2008-10-01
最后登录: 2025-07-13
— 本帖被 兵马大元帅 执行加亮操作(2025-06-22) —

IT之家 6 月 16 日消息,据外媒 New Atlas 14 日报道,脑机接口技术迎来一项重大突破:加州大学戴维斯分校研发的新型植入系统,让一位瘫痪患者不仅能顺畅说话,甚至还能借助电脑“哼唱”旋律,几乎没有任何延迟。

研究团队在一位渐冻症患者身上试验了这项技术。通过在大脑中控制发音的区域植入四组微电极阵列,系统能实时捕捉说话时产生的神经信号,再结合低延迟处理和 AI 解码模型,将这些信号同步转化为语音,在扬声器中播放。

需要强调的是,这项技术并不是在“读心”,而是识别出患者尝试发声时大脑发出的运动指令。系统合成出的声音与患者本人极为相似 —— 这得益于在其发病前录制的语音样本训练出的声音克隆算法。

从信号采集到语音生成,全程只需 10 毫秒,几乎可以实现实时对话。

系统还能识别出患者试图唱歌的动作,判断其想表达的音高,并据此合成旋律。在研究团队发布的视频中,这一功能尚显初级,但对于那些逐渐失去表达能力的人来说,无疑是一种重获声音的希望。

该研究论文的资深作者 Sergey Stavisky 表示,这一进展为脑机语音合成带来了转折点。他说:“借助即时语音输出,神经义体用户能真正参与对话 —— 他们可以打断别人,也更不容易被别人误打断。

该系统能复现“啊”“喔”“嗯”等语气词,判断句子是疑问还是陈述,甚至辨别出强调词语的位置。研究团队还指出,系统能准确合成此前从未见过的虚构词语。这使得语音表达更自然、更具表现力。

IT之家从报道中获悉,研究人员也指出,目前试验仅在一位患者身上进行,下一步将拓展至其他因不同原因丧失语言能力的人群,以验证技术的普适性。

山庄提示: 道行不够,道券不够?---☆点此充值☆
 
在线jjybzxw

UID: 551814


发帖
167987
金币
275183
道行
2004
原创
2404
奖券
2775
斑龄
35
道券
1005
获奖
0
座驾
设备
摄影级
在线时间: 38224(小时)
注册时间: 2008-10-01
最后登录: 2025-07-13
只看该作者 沙发  发表于: 06-17
这项由加州大学戴维斯分校研发的脑机接口技术确实取得了重大突破,它使得一位瘫痪患者能够通过植入大脑的微电极阵列实时捕捉神经信号,并将其转化为语音。这项技术的关键点在于:

1. 实时转化:从信号采集到语音生成只需10毫秒,几乎可以实现实时对话。
2. 声音克隆算法:系统合成的声音与患者本人极为相似,这是因为使用了患者发病前的语音样本来训练声音克隆算法。
3. 非读心技术:技术识别的是患者尝试发声时大脑发出的运动指令,而不是直接读取思维。
4. 音乐表达:系统不仅能合成语言,还能识别患者试图唱歌的动作,并据此合成旋律。
5. 自然表达:系统能复现语气词如“啊”“喔”“嗯”,判断句子的疑问或陈述性质,甚至辨别出强调词语的位置,使得语音表达更自然、更具表现力。
6. 普适性验证:目前试验仅在一位患者身上进行,未来将拓展至其他因不同原因丧失语言能力的人群,以验证技术的普适性。

这项技术对于渐冻症患者以及其他因各种原因失去语言能力的人来说是一个巨大的福音,为他们提供了一种重获声音和交流能力的希望。随着技术的进一步发展和验证,我们有望看到它在更广泛的应用中发挥作用。
如何不发帖就快速得到金币道行
 
在线姜谷粉丝

UID: 1569053

精华: 2
级别: 玉清道君

发帖
144367
金币
265038
道行
20030
原创
756
奖券
185
斑龄
0
道券
0
获奖
0
座驾
设备
摄影级
在线时间: 16796(小时)
注册时间: 2012-06-21
最后登录: 2025-07-12
只看该作者 板凳  发表于: 06-17
这是我日前发的帖
昨天 09:23 , 来自:广东省广州市 , 编辑




IT之家 6 月 16 日消息,据外媒 New Atlas 14 日报道,脑机接口技术迎来一项重大突破:加州大学戴维斯分校研发的新型植入系统,让一位瘫痪患者不仅能顺畅说话,甚至还能借助电脑“哼唱”旋律,几乎没有任何延迟。

研究团队在一位渐冻症患者身上试验了这项技术。通过在大脑中控制发音的区域植入四组微电极阵列,系统能实时捕捉说话时产生的神经信号,再结合低延迟处理和 AI 解码模型,将这些信号同步转化为语音,在扬声器中播放。
需要强调的是,这项技术并不是在“读心”,而是识别出患者尝试发声时大脑发出的运动指令。系统合成出的声音与患者本人极为相似 —— 这得益于在其发病前录制的语音样本训练出的声音克隆算法。
从信号采集到语音生成,全程只需 10 毫秒,几乎可以实现实时对话。
系统还能识别出患者试图唱歌的动作,判断其想表达的音高,并据此合成旋律。在研究团队发布的视频中,这一功能尚显初级,但对于那些逐渐失去表达能力的人来说,无疑是一种重获声音的希望。

该研究论文的资深作者 Sergey Stavisky 表示,这一进展为脑机语音合成带来了转折点。他说:“借助即时语音输出,神经义体用户能真正参与对话 —— 他们可以打断别人,也更不容易被别人误打断。”
该系统能复现“啊”“喔”“嗯”等语气词,判断句子是疑问还是陈述,甚至辨别出强调词语的位置。研究团队还指出,系统能准确合成此前从未见过的虚构词语。这使得语音表达更自然、更具表现力。
IT之家从报道中获悉,研究人员也指出,目前试验仅在一位患者身上进行,下一步将拓展至其他因不同原因丧失语言能力的人群,以验证技术的普适性。


如何不发帖就快速得到金币道行
 
我有我可以
快速回复
限120 字节
认真回复加分,灌水扣分~
 
上一个 下一个