Menu Menu

AI mới biến sóng não thành giọng nói phức tạp

Trong tin tức khoa học đáng sợ / thú vị trong ngày, các nhà khoa học Hoa Kỳ đã đạt được một bước tiến đáng kể trong việc tạo ra máy tính giao tiếp trực tiếp với bộ não của chúng ta.

Các nhà khoa học thần kinh và chuyên gia về lời nói tại Đại học California San Francisco (UCSF) đã phát triển một trí tuệ nhân tạo có thể đọc các sóng não của con người và chuyển đổi chúng thành giọng nói.

Bước đột phá, lần đầu tiên được báo cáo trong Thiên nhiên tạp chí, có ý nghĩa đối với cả những người có tình trạng khiến họ phải trả giá bằng khả năng nói (ví dụ như người bị MS hoặc đột quỵ), và đối với ngày tận thế của robot trong tương lai. Họ có thể đọc được suy nghĩ của chúng ta theo đúng nghĩa đen.

Bỏ tất cả những trò đùa sang một bên, công nghệ này hoàn toàn mang tính đột phá cho việc tích hợp liền mạch máy móc vào cơ chế của con người, có khả năng giảm nhu cầu nhập liệu của người dùng trong lập trình. Cuối cùng, MS Paint sẽ hiểu rằng những gì bạn quản lý để tạo IRL không phải là thực sự những gì trong đầu bạn.

Trí thông minh từ sóng não đến giọng nói đã đạt được tiến bộ nhanh chóng trong mười năm qua, trước đây đã từng bị đình trệ trong việc dịch dữ liệu não thô thành lời nói. Sự phức tạp của các con đường thần kinh và tính cá nhân của mô hình não của mỗi người, có nghĩa là thường chỉ có thể tạo ra một từ tại một thời điểm.

Tuy nhiên, trong khi mô hình suy nghĩ của con người là duy nhất và vô cùng phức tạp, các tín hiệu từ não đến miệng, hàm và lưỡi tạo ra lời nói lại khá phổ biến. Do đó, thay vì chỉ nghiên cứu não, các nhà khoa học của UCSF đã sử dụng hai AI để phân tích cả tín hiệu thần kinh và chuyển động của miệng trong khi đối thoại.

Video dưới đây cho bạn thấy hình ảnh chụp X-quang về miệng và cổ họng của chúng ta thực sự trông như thế nào khi chúng ta nói chuyện.

Khi thông tin được thu thập bởi những AI này được đưa vào một bộ tổng hợp, một cái gì đó ít nhiều giống với các câu phức tạp sẽ xuất hiện.

Kết quả không hoàn hảo. Trong khi mạng nơ-ron nhân tạo đã làm tốt việc giải mã các ma sát - nghe giống như 'sh' trong 'ship' - nó thường vấp phải các thùng loa, chẳng hạn như 'b' trong 'bob'. Các âm thanh kết quả là rõ ràng của con người, nhưng có lẽ một con người có quá nhiều G & Ts.

Để có được dữ liệu cho AI giải phẫu, các nhà khoa học đã yêu cầu các tình nguyện viên bản ngữ nói tiếng Anh đọc ra danh sách một trăm từ, sau đó giải thích các câu được trả lại cho họ từ thuật toán.

AI thần kinh phức tạp hơn một chút để quản lý. Nhóm nghiên cứu đã làm việc với XNUMX người đã được lắp đặt các dãy điện cực mật độ cao trong hộp sọ của họ để điều trị chứng động kinh. Những thiết bị này cần phải được lắp đặt bằng phẫu thuật dưới thân tàu - một cuộc phẫu thuật nguy hiểm, xâm lấn hạn chế tiềm năng sớm tung ra thị trường của công nghệ này.

Nhưng các giáo sư Grayden và Oxley, và các nhóm khác trên khắp thế giới bao gồm Neuralink khởi nghiệp của Elon Musk, đang nghiên cứu các phương pháp ít xâm lấn hơn.

Giải pháp của họ là gắn các điện cực vào các giàn giáo nhỏ, rỗng, giống như ống và sau đó thả các giàn giáo đó vào các mạch máu trong não. Họ có thể ngồi đó, đọc các tín hiệu não mà không can thiệp vào lưu lượng máu hoặc não. Giống như một con vật cưng não nhỏ.

Một cuộc thử nghiệm trên người được lên kế hoạch vào cuối năm nay. Một số tình nguyện viên?

Khả Năng Tiếp Cận