Сотрудникилаборатории лингвистической антропологии филологического факультетаТомского госуниверситета разработали онлайн-сервис по автоматическому анализу исозданию новостных текстов «WORLD2NEWS». Программа позволяет писатьновости быстрее и качественнее, чем это делают люди.
Работа над приложением начиналась как обычныйстуденческий проект, но в процессе был создан действующий сервис с наборомфункций для автоматической обработки текстов. Программа извлекает изнеструктурированных текстов факты (кто, что, где, когда) и синтезируетзаголовок новости. Если у человека на это уходит минимум пять минут, то унейросети — несколько секунд. Также нейросеть гораздо быстрее человека способнапроверять факты.
Функционал нейросети шире, чем у ее аналогов. Вчастности, пользователь может выбрать вариант заголовка как полностьюсгенерированный нейросетью, так и созданный при помощи формальных грамматик.Последние позволяют не забывать о новостном стиле текста. Преимуществом«WORLD2NEWS» является высокая формальная точность по показателям BLEU-score, следовательно, сгенерированные тексты максимально схожи сжурналистскими.
«Пока «WORLD2NEWS» — действующий прототип сминимальным набором функций. Предстоит еще немало работы по оптимизацииформальных грамматик и разработке новых решений, основанных на нейронных сетях,— отметил сотрудник лаборатории лингвистическойантропологии ФилФ ТГУ АндрейСтепаненко.
BLEU-score – это алгоритм оценки качества текста,который был автоматически переведен с одного естественного языка на другой.Качество перевода определяется соответствием между производительностью машины ичеловека: чем ближе машинный перевод к профессиональному человеческомупереводу, тем лучше.
Ранее мырассказывали,что томский студент стал лучшим веб-разработчиком в России.