В основе технологии интеллектуального анализа текстов PROMT лежат
Словарная база включает информацию о сотнях семантических классов , тысячах морфологических характеристик, сотнях тысяч основ его слов и оборотов, а также их возможных синтаксических ролях в предложении. База не является статичной и может быть расширена пользовательскими данными (онтологиями, списками синонимов, имен, топонимов и т.п.) для повышения качества разбора текстов, интересующих пользователя.
Нейронная сеть перед тем как начать эффективно работать должна быть обучена на очень большом объеме данных, которые предварительно должны быть классифицированы и размечены человеком, что не требуется для семантико-синтаксической модели.
Нейронная сеть может вести себя непредсказуемо, особенно при работе с материалом, который не попал в обучающую выборку. Семантико-синтаксический подход, ориентируясь на синтаксическую структуру текста на естественном языки и семантические связи между его элементами, успешно справляется с обработки сущностей, даже в том случае, если они не были ранее известны и не попали в лингвистическую базу данных системы.
Использование нейронной сети требует наличия специального дорогостоящего оборудования, обеспечивающего большой объем параллельных вычислений. Для работы семантико-синтаксической модели можно использовать стандартное оборудование.
Семантико-синтаксический подход, благодаря использованию алгоритмов и сложно-структурированных словарных баз данных позволяет учитывать нюансы употребления тех или иных языковых единиц в текстах разной тематики.
Подписаться на новости
Веб-форма не найдена.