Một trong những mục tiêu thú vị nhất của thần kinh học là tái hiện lại các hình ảnh mà con người nhận thức được thông qua phân tích các bản chụp cắt lớp não. Theo đó, các nhà khoa học cần tìm ra được những gì mà mọi người đang thấy bằng cách theo dõi hoạt động trong vùng vỏ não thị giác của họ.

Tất nhiên, việc tìm được những cách để xử lý một cách hiệu quả dữ liệu thu được từ các bản chụp cộng hưởng từ chức năng (fMRI) là rất khó, đòi hỏi phải ánh xạ hoạt động trong không gian ba chiều bên trong não ra các điểm ảnh hai chiều trong một hình ảnh.

Tại sao lại khó? Bởi các bản quét fMRI thường rất nhiễu hạt, và hoạt động trong một điểm ảnh ba chiều lại dễ bị ảnh hưởng bởi hoạt động trong các điểm ảnh ba chiều khác. Để có thể xử lý được mối tương quan này đòi hỏi những loại hình tính toán đắt đỏ, do đó hầu hết các hướng nghiên cứu đều né tránh nó, dẫn đến kết quả là chất lượng của việc tái hiện hình ảnh bị giảm đi đáng kể.

Do đó, một mục tiêu quan trọng cần giải quyết là tìm những phương pháp tốt hơn để thu thập dữ liệu từ các bản quét fMRI và tái hiện là những hình ảnh não chính xác hơn.

Hôm nay, nhà nghiên cứu Changde Du tại Trung tâm Nghiên cứu Trí thông minh Não bộ tại Bắc Kinh, Trung Quốc, cùng một số cộng sự cho biết họ đã phát triển được một kỹ thuật như vậy. Cách làm của họ là xử lý dữ liệu bằng các kỹ thuật học sâu (deep-learning) có khả năng làm việc một cách khéo léo hơn với mối tương quan phi tuyến tính giữa các điểm ảnh ba chiều. Kết quả, chúng ta có một phương thức tốt hơn nhiều so với các phương thức trước đây, nhằm tái hiện lại cách mà một bộ não tiếp nhận các hình ảnh.

Changde và cộng sự bắt đầu với nhiều bộ dữ liệu hình ảnh fMRI của vỏ não thị giác của một chủ thể con người khi người này nhìn vào một hình ảnh đơn giác - chẳng hạn như một con số đơn lẻ hay một ký tự đơn lẻ. Mỗi bộ dữ liệu có chứa các bản quét và hình ảnh gốc mà con người nhìn được.

Mục đích của họ là tìm một cách nào đó để sử dụng các bản quét fMRI nhằm tái hiện lại hình ảnh nhận thức được. Nhóm nghiên cứu đã truy cập hơn 1.800 bản quét fMRI cùng hình ảnh gốc của chúng.

Họ xem đây như là một tác vụ học sâu đơn thuần, sử dụng 90% số dữ liệu này để huấn luyện mạng thần kinh hiểu được mối tương quan giữa các bản quét não và hình ảnh gốc.

Sau đó, họ sử dụng 10% số dữ liệu còn lại để kiểm tra mạng thần kinh bằng cách cung cấp cho nó các bản quét và yêu cầu nó tái hiện lại hình ảnh gốc ban đầu.

Thuật toán đọc trí não này có thể tái hiện lại những thứ bạn đang thấy bằng dữ liệu quét não - Ảnh 1.

Kết quả so sánh các kỹ thuật tái hiện hình ảnh não. Hình ảnh gốc ở trên cùng, còn kết quả của phương thức mà bài viết đề cập ở dưới cùng

Lợi thế lớn của hướng tiếp cận này là mạng thần kinh sẽ học được cần dùng các điểm ảnh ba chiều nào để tái hiện lại hình ảnh, tránh việc phải xử lý dữ liệu từ tất cả các điểm ảnh ba chiều một lúc.

Nó còn học được dữ liệu từ các điểm ảnh ba chiều này tương quan như thế nào. Đây là điều vô cùng quan trọng bởi nếu sự tương quan bị bỏ qua, chúng sẽ bị xem là các điểm nhiễu và bị xóa bỏ. Do đó hướng tiếp cận mới này - được gọi là "mô hình đa thị giác sinh trưởng sâu" - khai thác những mối tương quan đó và phân biệt chúng với nhiễu hạt thực sự.

Để đánh giá mô hình này, Changde và cộng sự so sánh các kết quả của nó với một số các kỹ thuật tái hiện hình ảnh não khác. Họ thực hiện điều này bằng cách sử dụng các phương pháp so sánh hình ảnh chuẩn để xem các hình ảnh được tái hiện gần với hình ảnh thực như thế nào.

Các kết quả thu được vô cùng thú vị. Nhìn chung, các hình ảnh được tái hiện lại khá giống với các hình ảnh gốc (hình ảnh trên). Trong nhiều trường hợp, chúng chính xác hơn đáng kể so với các kỹ thuật khác.

Các số liệu so sánh hình ảnh đã xác nhận điều này. "Các so sánh thực nghiệm bao quát cho thấy hướng tiếp tận của chúng tôi có thể tái hiện các hình ảnh thị giác từ các bản chụp fMRI chính xác hơn hẳn" - Changde và các cộng sự cho biết.

Kết quả nghiên cứu thực sự có ý nghĩa rất lớn. Khả năng tái hiện các hình ảnh não là một cột mốc quan trọng nhằm tạo nên các giao diện não - máy móc tốt hơn. Tiếp theo, các nhà khoa học sẽ nghiên cứu các phương thức để phân tích các khung cảnh phức tạp hơn và các hình ảnh đang chuyển động. Changde và các cộng sự cho biết hướng tiếp cận của họ còn có thể được ứng dụng vào các vấn đề giải mã não bộ khác như các tác vụ âm thanh và thể chất.

Ai mà biết được, sẽ có ngày chúng ta tìm ra những kỹ thuật quét não để biết được người ta đang nghĩ gì, hay đang mơ gì!

Tham khảo: MIT TechnologyReview