Транскрибация – или, проще говоря, перевод речи из аудио или видео в текст. В нашем современном мире это уже стало неотъемлемой частью работы в любой отрасли. Нередко приходится печатать длинные тексты по аудио или видео материалам или в объемных источниках искать необходимую информацию. Все это отнимает много времени… Нo ученные нашли этому решение и обучили транскрибации компьютер. Теперь техника набирает тексты и из различных источников находит нужное человеку. А, благодаря нашим умам из Латвийского университета, искусственный интеллект научился печатать и читать и на латышском языке.

Grammatical Framework (GF) включает в себя порядка 30 языков, теперь в это число входит и государственный язык нашей страны. Исследователи искусственного интеллекта Латвийского университета уверены, что в будущем это программное обеспечение станет неотъемлемой частью нашей с вами жизни. На данном этапе программа умеет генерировать тексты из таблицы Excel или любой другой базы данных, диаграмм, понимать заданную ей тему или из аудио-видео материалов набирать текст. В жизни это выглядит следующим образом:

Например, у вас есть аудио или видео материал какой-нибудь лекции, и вы хотите транскрибировать ее в текст. Вы задаете эту задачу установленной на вашем компьютере специальной программе - и она самостоятельно начинает набирать ваш текст. Или же наоборот, вы, например, составляете какую-то лекцию, выступление перед аудиторией и вам необходимо промониторить все ваши предыдущие записи, какую-то вашу базу данных, которая может состоять как из напечатанных текстов, так из аудио-видео материалов. Вы вводите запрос по конкретной теме и программа самостоятельно находит всевозможные источники, где упоминалось заданное вами слово, словосочетание или тема.

Искусственный интеллект даже способен определить по впереди стоящему слову лексическое значение искомого слова.

Что касается набора латышских  текстов, где имеются макроны или, проще говоря, удлинения гласных, а также палатализации, обозначающие смягчение согласных – наши ученные обучили компьютер и этому.

Сейчас происходит практическая часть тестирования программы и ЛУ сотрудничает с информационным агентством ЛЕТА, которое обладает глобальной для нашей страны базой данной на латышском языке, включающей в себя различные тексты, фото, аудио и видео материалы. Сотрудники агентства теперь используют в своей ежедневной работе программу и сообщают разработчикам о плюсах и минусах системы.

Пока что тексты не всегда стилистически корректны и в них достаточно часто не согласованы окончания слов. Но как заверяют исследователи, компьютер, как и человек, учится и все еще впереди.

В дальнейшей перспективе исследователи видят применение своей программы, например, в справочном центре 1188. По мнению Грузитиса, на определенную часть вопросов мог бы отвечать и компьютер. 

Программу, траскрибирующую тексты, создали еще несколько десятков лет назад. А на разработку речевого корпуса для латышского языка у наших разработчиков ушло около года. Однако, по словам Грузитиса, этот год показался ему длинною в несколько лет.

В ЛУ уверены – это только начало и скоро искусственный интеллект научится еще большему.