Американские ученые создали алгоритм машинной дешифровки забытых языков

21.10.2020

О разработке исследователей Массачусетского технологического института пишет MIT News.

Эксперты Лаборатории искусственного интеллекта (CSAIL) MIT разработали систему автоматической дешифровки мертвых языков. Система при этом может определять связи между языками самостоятельно, говорится в сообщении.

Алгоритм основан на нескольких принципах исторического языкознания. Известно, что у языка есть определенное количество предсказуемых путей развития. В частности, язык редко приобретает или теряет целый звук, но способен заменять одни звуки на другие.

В частности, звук [п] может измениться на [б], но не на [к], так как этому препятствует значительная разница в произношении.

С помощью алгоритма ученые смогли анализировать большие объемы возможных трансформаций языка и преобразовывать язык в многомерное пространство, разница в произношении в котором отражалась в виде дистанции между векторами. С помощью такой модели эксперты смогли сегментировать слова из древних языков, сопоставив их с родственными языками.

Исследователи выяснили, что алгоритм точно идентифицирует языковые семьи, и надеются расшифровать мертвые языки, над которыми лингвисты ломают головы десятки лет, на основе всего нескольких тысяч слов.