Андрей Химчук старший юрист, менеджер по цифровой трансформации Фундации DEJURE

Как Государственная судебная администрация тормозит развитие legal tech в Украине

Мы можем научить нейронные сети понимать юридический текст на базовом уровне. В будущем это позволит создавать прогностические и рекомендательные системы. (укр.)

Держава збирає усі судові рішення, починаючи з кінця 2006 року. Усі вони – а їх нині понад 97 мільйонів – містяться у Єдиному державному реєстрі судових рішень. 

Увесь цей масив цікавий для аналітиків даних, які проводять контент-аналіз рішень, та розробників, які створюють продукти на основі відкритих даних. 

Наприклад, "Суд на долоні" є корисним "правникам", які прагнуть користуватися більшою кількістю фільтрів при пошуці, аніж є в державній версії Реєстру, чи тим, хто хоче віднайти рішення, якомога подібніші до текстів їхніх документів.Публікація також уможливлює створення алгоритмів природної мови, орієнтованих на юридичні документи. 

Реклама:

Це означає, що ми можемо навчити нейронні мережі розуміти юридичний текст на базовому рівні. У майбутньому це дозволить створювати прогностичні та рекомендаційні системи.

Для того, щоби такі сервіси, як "Суд на долоні", швидко створювалися, розвивалися і допомагали юристам, розробникам необхідно мати якомога більше (а краще усі) текстів рішень. Однак, наразі із цим є певні проблеми. 

Хоча розпорядники цих даних – Державна судова адміністрація та підконтрольні їй держпідприємства й публікують дані з Реєстру як набір відкритих даних, в складі цього набору є лише таблиці з метаданими рішень (в форматі CSV) та посиланнями на їх тексти (як файли) у форматі RTF чи HTML. 

Самі ж тексти рішень потрібно завантажувати з серверів, на яких вони знаходяться, кожен окремо. Здавалося б, усе оприлюднюється і проблем не мало б виникнути. Але проблеми є.

Річ у тому, що тексти усіх рішень "важать" близько двох терабайтів, і необхідно витратити близько 9 місяців, аби завантажити їх усі. 

Читайте також: Відкриті дані у держорганах: хто лідирує

У цієї проблеми є два не взаємовиключні розв'язання. 

Перше – розпорядники могли б оприлюднювати заархівовані тексти рішень за певні місяці чи роки, завдяки чому зекономили б час для користувача та в рази зменшили навантаження на власні сервери. 

Друге – запитувачі можуть відвідати розпорядників даних (Державної судової адміністрації чи її держпідприємство) і записати тексти судових рішень хоча б за 2006-2020 роки на носій інформації (наприклад, портативний жорсткий диск). Саме це і намагались зробити юристи Фундації DEJURE. 

Однак Державна судова адміністрація пересилає такі запити на державне підприємство "Інформаційні судові системи", а останнє – відповідає, що запис даних на носій не передбачений законодавством.

Разом з тим, закон прямо дозволяє громадянам отримувати публічну інформацію в форматі відкритих даних за запит, в тому числі шляхом запису її на носій. 

Щобільше, Постанова № 835 про відкриті дані говорить про те, що вивантаження інформації з баз даних (саме цього ми хочемо добитися від Державної судової адміністрації) не є створенням нової інформації, а лише перетворенням існуючої, що розпорядники зобов’язані робити на запит. 

Читайте також: Відкриті дані в Україні: або ти їх, або вони тебе

В Україні вже існує такий прецедент – спільнота фахівців з відкритих даних Open Up виграла суд проти Мін’юсту щодо доступу до інформації Єдиного державного реєстру юридичних осіб та фізичних осіб-підприємців у форматі відкритих даних. 

Суд визнав, що Мін’юст незаконно приховав значну частину інформації з ЄДР і зобов’язав надати повну у відповідь на запит. 

Однак, Державна судова адміністрація та її підприємство проігнорувала законодавство, чим змусила юристів DEJURE звертатись до судів.

[BANNER1]Наостанок звернемо увагу, що інформація з Реєстру судових рішень – один із найпопулярніших наборів на порталі відкритих даних, який постійно тримається в топ-10 за кількістю завантажень. 

Саме тому надання доступу до інформації з нього слід вважати одним із пріоритетів, обмежуючи який означає обмежувати розвиток аналітики та legal-tech стартапів. 

Сподіваємось, суд невдовзі стане на сторону громадян та захистить наше право на інформацію, що належить платникам податків. 

Андрій Химчук

Колонка – матеріал, який відображає винятково точку зору автора. Текст колонки не претендує на об'єктивність та всебічність висвітлення теми, яка у ній піднімається. Редакція "Української правди" не відповідає за достовірність та тлумачення наведеної інформації і виконує винятково роль носія. Точка зору редакції УП може не збігатися з точкою зору автора колонки.  
Колонка представляет собой вид материала, отражающего исключительно точку зрения автора. Она не претендует на объективность и всесторонность освещения темы, о которой идет речь. Мнение редакции "Экономической правды" и "Украинской правды" может не совпадать с точкой зрения автора. Редакция не несет ответственности за достоверность и толкование приведенной информации и выполняет исключительно роль носителя.
диджитализация законодательство суд
Реклама:
Уважаемые читатели, просим соблюдать Правила комментирования