Статья «Поддерживают ли на самом деле языковые деревья с предками на выборке гибридную модель происхождения индоевропейских языков?» посвящена критическому анализу наиболее авторитетной сегодня теории эволюционной истории индоевропейской языковой семьи, которая включает в том числе и русский язык. Авторы обращаются к знаковому исследованию группы учёных под руководством Пола Хеггарти, результаты которого были опубликованы в 2023 году в журнале Science и содержали прорывные на тот момент представления о времени начала распада и дальнейшей эволюции праиндоевропейского языка. Статья вышла в одном из ведущих научных журналов мира – Nature, авторы – ведущий научный сотрудник Школы актуальных гуманитарных исследований Президентской академии, д.филол.н. Алексей Касьян и лингвистом, к.филол.н. Георгий Старостин.
Современные лингвисты сходятся в представлении о том, что много тысячелетий назад существовала некая общность людей, живших в некоторой ограниченной локации и говоривших на общем языке (который принято называть праиндоевропейским). Впоследствии в ходе миграций они расселились на огромной территории от севера Индии до Ирландии. В результате этих процессов возникла крупнейшая семья родственных языков, на которых сейчас говорят более 3 миллиардов человек на всех континентах – в их число входят все славянские и балтские языки, а также языки германской и романской групп, хинди, персидский и целый ряд других.
Главной научной проблемой является установление конкретных путей данных миграций на территорию Европы и времени их осуществления, а соответственно, и связей между разными языками одной огромной семьи.
Одна из нескольких ведущих гипотез – «анатолийская» – предполагает, что эти процессы происходили в раннем неолите, и локализует индоевропейскую прародину в Малой Азии – Анатолии (территория современной Турции). Согласно конкурирующей гипотезе, так называемой «степной», праиндоевропейцы изначально жили в Причерноморско-Каспийской степи, и уже оттуда перебрались на запад в позднем неолите или раннем бронзовом веке.
Работа группы Хеггарти объединяет эти две гипотезы, относя время существования единого праиндоевропейского языка к эпохе ранее 8120 лет назад и локализуя прародину индоевропейцев в двух ключевых географических центрах.
«Языковые деревья с предками на выборке»
Исследование Хеггарти основано на построении «языковых деревьев с предками на выборке». Под этим термином понимается специализированная статистическая методика создания филогенетических деревьев, которая применяется в компьютерной лингвистике для моделирования происхождения языков. Она отличается от классических моделей тем, что позволяет непосредственно включать в само дерево известные древние языки в качестве возможных прямых предков современных.
Так, в стандартном филогенетическом дереве все известные языки отображаются как «кончики ветвей», а узлами, в которых ветви раздваиваются, являются гипотетические предковые языки, которые нам непосредственно не известны (одним из них является и праиндоевропейский).
Метод «с предками на выборке» работает в другой логике. В ней древний язык, например, классическая латынь или готский, может быть представлен не «кончиком ветви», а реальным узлом на пути к одному из современных языков. Очевидно, что всё дерево, содержащее в качестве узлов предков, которые фактически взяты из корпуса данных (и значит, точно привязаны к датам), а не только реконструированы, должно давать более реалистичные и исторически обоснованные датировки. Для индоевропейской проблемы это важно, потому что в споре о прародине индоевропейцев критически важно правильное расположение древних языков на дереве для точной датировки расколов.
Впрочем, при таком подходе возможны и проблемы: например, модель вполне может показать, что современный итальянский является прямым, непосредственным потомком латыни. Хотя классическая латынь (уже мёртвый в Средние века язык, который, тем не менее, широко использовался в письме) – это не непосредственный предок, а лишь близкий родственник, «сестра» народной, или «вульгарной», латыни как средневекового прароманского, устного языка, не имевшего зафиксированной письменной формы.
Работа Касьяна и Старостина
Именно этот метод – а скорее, даже данные, на которых были проведены оценки – стали основной мишенью для критики в статье Касьяна и Старостина. Авторы признают значительный прогресс в работе команды Хеггарти по сравнению с предыдущими попытками примерно того же научного коллектива экспертов-лингвистов в составлении обширной базы лексических данных IE-CoR .
Однако при этом российские лингвисты отмечают значимые проблемы в анализе. Главные из них – это использование устаревшего «корневого» подхода к установлению родства слов, включённых в базу IE-CoR, который не учитывает явление «деривационного дрейфа» (независимых морфологических образований от одного и того же корня в языках разных ветвей), и не даёт во многих случаях возможности различать истинное родство и ареальную диффузию, возникающую при языковых контактах между разными группами.
«В целом авторы не предлагают ничего нового по сравнению с предыдущими экспериментами команды (2003, 2012)... Как и в более ранних публикациях, дата распада индоевропейского (4740–7610 гг. до н.э.) сообщества действительно примерно совпадает с миграцией ранних земледельцев из Анатолии в Европу около 7000 г. до н.э. (в этом смысле полученные результаты по‑прежнему поддерживают «аграрную» гипотезу, связывающую этих земледельцев с индоевропейцами)… Что касается промежуточной степной прародины, то действительно вероятно, что по меньшей мере некоторые индоевропейские языки мигрировали из Евразийских степей в Центральную и Северную Европу в начале III тысячелетия до н. э. Нерешённым остаётся вопрос о конкретной лингвистической конфигурации и последовательности этих "выходов из степи"», – заключают российские исследователи.
Соотношение между количеством включённых в IE-CoR языков и размером списка может быть недостаточным для создания гарантированно надёжной топологии, резюмируют Касьян и Старостин. Для этого следует либо резко расширить список (что нереалистично по ряду практических причин), либо сократить число сравниваемых таксонов – возможно, с помощью использования промежуточных реконструкций для предковых стадий вместо множества отдельных языков. Таким образом, Касьян и Старостин обозначают новые горизонты для исследования далекого прошлого человеческой цивилизации, указывая на возможные инструменты для проведения более точного и надёжного анализа.