Язык — одна из самых загадочных эволюционных загадок. Ученые до сих пор не уверены, почему у людей и других приматов так много общего, но у них нет общей способности говорить. До недавнего времени в ходе исследования, проведенного исследователями из Корнелльского университета, ученые обнаружили сложный язык орангутанов. Орангутаны, высшие обезьяны Юго-Восточной Азии, известны своим сложным голосовым общением. Однако исследователям оказалось сложно разобраться в тонкостях их репертуара.

После тщательного исследования, продолжавшегося три года, исследователям удалось расшифровать сложные закономерности, скрывавшиеся в ревах, вздохах и других вокализациях борнейских орангутанов, и, следовательно, они смогли получить уникальную информацию об их коммуникативных способностях.

Анализ с помощью искусственного интеллекта

Исследование, опубликованное в журнале PeerJ Life & Environment, является крупным прорывом в знаниях об общении орангутанов. Исследовательская группа усилила свое исследование, сравнив методы обнаружения ИИ с работой биологов и ученых-биоакустиков, которые использовали только свои тренированные уши, интеллект и измерительные инструменты.

Исследовательская группа собрала набор данных из 117 длинных звуков, записанных 13 самцами одного конкретного вида, борнейского орангутанга, используя 46 акустических измерений 1033 различных импульсов, обнаруженных в этих криках. Они заявили: «Похоже, что эти особенности значительно повышают потенциальную сложность этого сигнала», подразумевая, что человечество скоро узнает, что говорят человекообразные обезьяны.

По словам ведущего автора исследования, доктора Венди Эрб, «наше исследование было направлено на то, чтобы разгадать сложности длинных криков орангутанов, которые играют решающую роль в их общении на огромных расстояниях в густых тропических лесах Индонезии».

Многогранный подход

Команда использовала современный алгоритм машинного обучения без присмотра — Uniform Manifold Approximation and Projection (UMAP), который успешно использовался для декодирования «голосового репертуара животных» в Калифорнийском университете в Сан-Диего еще в 2020 году.

Алгоритм UMAP был усовершенствован за счет дополнительных статистических алгоритмов, написанных на языке программирования R. Помимо других типов контролируемого машинного обучения, в этом процессе использовался R, но во всех случаях 1033 уникальных голосовых фазы и импульсов обезьян были разделены на несколько частей. случайным образом на разделение 60/40, где 60 процентов использовались для обучения ИИ, а оставшиеся 40 процентов использовались для проверки точности его только что обученных способностей сортировки.

Используя комбинацию контролируемых и неконтролируемых методов машинного обучения, исследовательская группа классифицировала три основных типа импульсов: «Рев» для высокочастотных импульсов, «Вздох» для низкочастотных импульсов и «Промежуточный» для тех, которые попадают между этими двумя категориями.

Их исследование не было сосредоточено на том, что говорили приматы. Тем не менее, это помогло понять, как они это говорили. Исследователи наконец поняли, что орангутанги используют гораздо более широкий диапазон звуков, чем предполагалось ранее.

Последствия для эволюции человека

Люди — единственные приматы, способные издавать самые сложные звуки, но тем не менее существует прямая связь между тем, как более примитивные приматы приобрели эти навыки, и тем, как это сделали мы. Чтобы это произошло, ученым сначала необходимо понять, как более «градуированные» вокализации, используемые такими животными, как орангутанги, так хорошо передают смысл.

Изучая вокализацию орангутанов, ученые могут в конечном итоге выяснить, как люди научились говорить. Каждый вид создает свою вокальную сложность в результате таких эволюционных факторов, как половой отбор, особенности среды обитания, специфическая социальная структура и давление со стороны хищников.