Ngôn ngữ là một trong những câu đố tiến hóa bí ẩn nhất. Các nhà khoa học vẫn chưa chắc chắn tại sao con người và các loài linh trưởng khác lại có nhiều điểm chung đến vậy nhưng chúng lại không có chung khả năng nói chuyện. Cho đến gần đây, một nghiên cứu được thực hiện bởi các nhà nghiên cứu đến từ Đại học Cornell, các nhà nghiên cứu đã phát hiện ra ngôn ngữ phức tạp của loài đười ươi. Đười ươi, loài vượn lớn ở Đông Nam Á, được biết đến với khả năng giao tiếp bằng giọng nói tinh vi. Tuy nhiên, các nhà nghiên cứu cảm thấy khó hiểu được sự tinh tế trong tiết mục của họ.

Sau một nghiên cứu cẩn thận kéo dài ba năm, các nhà nghiên cứu đã giải mã được các kiểu mẫu phức tạp ẩn giấu trong tiếng gầm, tiếng thở dài và các cách phát âm khác của đười ươi Bornean, và do đó, họ có thể có được thông tin độc đáo về kỹ năng giao tiếp của chúng.

Phân tích được hỗ trợ bởi AI

Nghiên cứu được công bố trên tạp chí PeerJ Life & Environment, là một bước đột phá lớn trong kiến ​​thức về cách giao tiếp của đười ươi. Nhóm nghiên cứu đã củng cố nghiên cứu của mình bằng cách so sánh các phương pháp phát hiện AI với công việc của các nhà sinh vật học và nhà khoa học âm sinh học, những người chỉ sử dụng đôi tai, trí tuệ và công cụ đo lường đã được huấn luyện của họ.

Nhóm nghiên cứu đã tập hợp một bộ dữ liệu gồm 117 cuộc gọi dài được ghi lại bởi 13 con đực của một loài cụ thể, đười ươi Bornean, sử dụng 46 phép đo âm thanh trên 1.033 xung khác nhau được phát hiện trong các cuộc gọi đó. Họ tuyên bố, “'Những đặc điểm này dường như sẽ làm tăng đáng kể độ phức tạp tiềm ẩn của tín hiệu này”, ngụ ý rằng nhân loại sẽ sớm biết loài vượn lớn đang nói gì.

Theo tác giả chính của nghiên cứu, Tiến sĩ Wendy Erb, “Nghiên cứu của chúng tôi nhằm mục đích làm sáng tỏ sự phức tạp của các cuộc gọi dài của đười ươi, vốn đóng một vai trò quan trọng trong việc giao tiếp của chúng qua khoảng cách rộng lớn trong các khu rừng nhiệt đới rậm rạp ở Indonesia”.

Một cách tiếp cận đa diện

Nhóm đã sử dụng thuật toán học máy không giám sát tiên tiến, Phép chiếu và Xấp xỉ Đa dạng Đồng nhất (UMAP), đã được sử dụng thành công để giải mã ‘các tiết mục giọng hát của động vật’ cho Đại học California, San Diego, vào năm 2020.

Thuật toán UMAP được cải tiến nhờ nhiều thuật toán thống kê hơn được viết bằng ngôn ngữ lập trình R. Ngoài các loại máy học có giám sát khác, R đã được sử dụng trong quy trình, nhưng trong mọi trường hợp, 1.033 pha và nhịp phát âm độc đáo của loài khỉ được chia thành ngẫu nhiên thành tỷ lệ chia 60/40, trong đó 60% được sử dụng để huấn luyện AI và 40% còn lại được sử dụng để kiểm tra độ chính xác của khả năng phân loại mới được huấn luyện của nó.

Bằng cách sử dụng kết hợp các kỹ thuật học máy có giám sát và không giám sát, nhóm nghiên cứu đã phân loại ba loại xung chính: 'Gầm' cho các xung tần số cao, 'Thở dài' cho các xung tần số thấp và 'Trung bình' cho những loại nằm giữa hai loại.

Nghiên cứu của họ không tập trung vào những gì loài linh trưởng đang nói. Tuy nhiên, nó giúp phát hiện cách họ nói điều đó. Các nhà nghiên cứu cuối cùng đã nhận ra rằng đười ươi sử dụng phạm vi âm thanh rộng hơn nhiều so với trước đây.

Ý nghĩa đối với sự tiến hóa của loài người

Con người là loài linh trưởng duy nhất có thể tạo ra những âm thanh phức tạp nhất, tuy nhiên, vẫn có mối quan hệ trực tiếp giữa cách các loài linh trưởng nguyên thủy hơn có được những kỹ năng này và cách chúng ta đã làm. Để biến điều đó thành hiện thực, trước tiên các nhà khoa học cần hiểu cách phát âm được “phân loại” nhiều hơn và được sử dụng bởi các loài động vật như đười ươi lại truyền tải ý nghĩa rất tốt.

Thông qua nghiên cứu cách phát âm của đười ươi, các nhà khoa học cuối cùng có thể tìm ra cách con người học nói. Mỗi loài tạo ra sự phức tạp về giọng nói do các yếu tố tiến hóa như chọn lọc giới tính, chi tiết về môi trường sống, cấu trúc xã hội cụ thể của chúng và áp lực từ những kẻ săn mồi.