Институт искусственного интеллекта Аллена в Сиэтле представил систему, которая предлагает экстремальное сжатие длинных работ, благодаря новой функции реферирования. Он сокращает эти работы до одного предложения.
Сейчас в базе данных Semantic Scholar более 10 млн статей по информатике. По словам Дэна Велда, специалиста по информации из Вашингтонского университета в Сиэтле, который курирует базу данных, постепенно туда будут добавляться статьи из других дисциплин.
Semantic Scholar отличается самой высокой степенью сжатия среди всех инструментов. В научных статьях в среднем 5 000 слов, но инструмент на основе ИИ сокращает их до 21 слова. Ближайший конкурент Semantic Scholar сжимает документы в 36 раз, а новая система — в 238.
Команда Института Аллена делает свой код доступным бесплатно. Они также создали демонстрационный сайт, доступный для всех.
Пока принимаются только работы, написанные на английском языке. Но авторы программы надеются в конечном итоге включить документы и на других языках.