Complexity metrics of Russian legal texts: selection, use, initial efficiency evaluation

The result's identifiers

Result code in IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F00216208%3A11320%2F22%3AZCS5KH2W" target="_blank" >RIV/00216208:11320/22:ZCS5KH2W - isvavai.cz</a>
Result on the web
<a href="https://www.dialog-21.ru/media/5729/blinovaoplustarasovn051.pdf" target="_blank" >https://www.dialog-21.ru/media/5729/blinovaoplustarasovn051.pdf</a>
DOI - Digital Object Identifier
<a href="http://dx.doi.org/10.28995/2075-7182-2022-21-1017-1028" target="_blank" >10.28995/2075-7182-2022-21-1017-1028</a>

Alternative languages

Result language
ruština
Original language name
Метрики сложности русских правовых текстов: отбор, использование, первичная оценка эффективности
Original language description
В статье описана основанная на метриках модель оценки сложности русских правовых текстов, подразу-мевающая использование 130 метрик следующих категорий: “базовые метрики”, “формулы читабельности”, “учёт слов разных частеречных классов”, “n-граммы частеречных тегов”, “частотность лемм”, “словообра-зовательные паттерны”, “отдельные граммемы”, “лексические и семантические признаки, неоднословные выражения, гипертекстовые связи”, “синтаксические признаки”, “оценки связности”. Иллюстрируются ос-нования выбора метрик с учётом опыта исследований языковой сложности, стилеметрических исследова-ний, а также экспериментальных работ в области восприятия правовых текстов. Приводятся результаты тестирования модели в эксперименте на классификацию текстов по уровню сложности с использованием полученных метрик в качестве параметров. Эти результаты сравниваются с результатами классификации с использованием в качестве параметров векторов языковой модели USE (Universal Sentence Encoder). Дела-ется вывод, согласно которому использование метрик позволяет оценивать сложность текстов более точно, чем в эксперименте с использованием языковой модели.
Czech name
—
Czech description
—

Classification

Type
D - Article in proceedings
CEP classification
—
OECD FORD branch
10201 - Computer sciences, information science, bioinformathics (hardware development to be 2.2, social aspect to be 5.8)

Result continuities

Project
—
Continuities
—

Others

Publication year
2022
Confidentiality
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů

Data specific for result type

Article name in the collection
Компьютерная лингвистика и интеллектуальные технологии
ISBN
—
ISSN
2221-7932
e-ISSN
—
Number of pages
12
Pages from-to
1-12
Publisher name
Российский государственный гуманитарный университет
Place of publication
—
Event location
Москва
Event date
Jan 1, 2022
Type of event by nationality
WRD - Celosvětová akce
UT code for WoS article
—

Similar results(10)

A hybrid model of complexity estimation: Evidence from Russian legal texts Malicious URL Detection with Distributed Representation and Deep Learning Classification of Text Writing Proficiency of L2 Learners

What are you looking for?

Quick search

Smart search

Complexity metrics of Russian legal texts: selection, use, initial efficiency evaluation

The result's identifiers

Alternative languages

Classification

Result continuities

Others

Data specific for result type

Similar results(10)

What are you looking for?

Quick search

Smart search

Result description

The result's identifiers

The result's identifiers

Alternative languages

Alternative languages

Classification

Classification

Result continuities

Result continuities

Others

Others

Data specific for result type

Data specific for result type

Similar results(10)