Complexity metrics of Russian legal texts: selection, use, initial efficiency evaluation
The result's identifiers
Result code in IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F00216208%3A11320%2F22%3AZCS5KH2W" target="_blank" >RIV/00216208:11320/22:ZCS5KH2W - isvavai.cz</a>
Result on the web
<a href="https://www.dialog-21.ru/media/5729/blinovaoplustarasovn051.pdf" target="_blank" >https://www.dialog-21.ru/media/5729/blinovaoplustarasovn051.pdf</a>
DOI - Digital Object Identifier
<a href="http://dx.doi.org/10.28995/2075-7182-2022-21-1017-1028" target="_blank" >10.28995/2075-7182-2022-21-1017-1028</a>
Alternative languages
Result language
ruština
Original language name
Метрики сложности русских правовых текстов: отбор, использование, первичная оценка эффективности
Original language description
В статье описана основанная на метриках модель оценки сложности русских правовых текстов, подразу-мевающая использование 130 метрик следующих категорий: “базовые метрики”, “формулы читабельности”, “учёт слов разных частеречных классов”, “n-граммы частеречных тегов”, “частотность лемм”, “словообра-зовательные паттерны”, “отдельные граммемы”, “лексические и семантические признаки, неоднословные выражения, гипертекстовые связи”, “синтаксические признаки”, “оценки связности”. Иллюстрируются ос-нования выбора метрик с учётом опыта исследований языковой сложности, стилеметрических исследова-ний, а также экспериментальных работ в области восприятия правовых текстов. Приводятся результаты тестирования модели в эксперименте на классификацию текстов по уровню сложности с использованием полученных метрик в качестве параметров. Эти результаты сравниваются с результатами классификации с использованием в качестве параметров векторов языковой модели USE (Universal Sentence Encoder). Дела-ется вывод, согласно которому использование метрик позволяет оценивать сложность текстов более точно, чем в эксперименте с использованием языковой модели.
Czech name
—
Czech description
—
Classification
Type
D - Article in proceedings
CEP classification
—
OECD FORD branch
10201 - Computer sciences, information science, bioinformathics (hardware development to be 2.2, social aspect to be 5.8)
Result continuities
Project
—
Continuities
—
Others
Publication year
2022
Confidentiality
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Data specific for result type
Article name in the collection
Компьютерная лингвистика и интеллектуальные технологии
ISBN
—
ISSN
2221-7932
e-ISSN
—
Number of pages
12
Pages from-to
1-12
Publisher name
Российский государственный гуманитарный университет
Place of publication
—
Event location
Москва
Event date
Jan 1, 2022
Type of event by nationality
WRD - Celosvětová akce
UT code for WoS article
—