Застосування принципів FAIR для дослідницької інформації у відкритих інфраструктурах

У Journal of Library Metadata з'явилася дорожня карта щодо застосування принципів FAIR для дослідницької інформації у відкритих інфраструктурах, яку розроблено авторами з двох країн – Німеччини та України. FAIR (Findable, Accessible, Interoperable, and Reusable) – це набір керівних принципів, які забезпечують відшукуваність, доступність, сумісність і багаторазовість використання дослідницьких даних. Відповідно до мети цього проєкту, під час серії онлайн воркшопів, принципи FAIR були повторені, переосмислені та інтерпретовані для застосування в дослідницьких інфраструктурах. Не буду переповідати увесь зміст цієї роботи, проте хочу зробити акцент на деяких практичних вітчизняних аспектах цих принципів. 

Відшукуваність 

Принцип згідно з яким даним та метаданим присвоюється постійний ідентифікатор є надзвичайно важливим, адже без коректного використання постійних ідентифікаторів практично неможливо дотримуватись усіх інших принципів FAIR. Ніхто не може використати повторно той самий ідентифікатор для посилання на різні об'єкти, однак той самий об'єкт може помилково отримати різні ідентифікатори, наприклад, одній публікації можуть бути присвоєно кілька DOI. Таке часто трапляється коли автор самоархівує документ у різних сервісах. 

Багато репозитаріїв (Figshare, Zenodo) та академічних соцмереж (ResearchGate) автоматично генерують DOI для депонованих документів. Так, наприклад, автор може представити роботу в інституційному репозитарії (особливо якщо в установі прийнято політику обов'язкового самоархівування), а також одночасно депонувати її на якомусь популярному комерційному сервісі. Таким чином, один об'єкт може отримати відразу кілька ідентифікаторів, що створює проблеми для наукової комунікації. 

Доступність 

В рамках відповідного воркшопу FAIRIO експерти зійшлися на думці, що дослідницька інформація відповідатиме принципу щодо доступності, якщо всі елементи метаданих будуть поширюватися за замовчування під відкритою ліцензією, що дозволить усім зацікавленим сторонам вільно вдосконалювати, інтегрувати та повторно використовувати ці метадані. Так, наприклад, сьогодні анотації наукових робіт – це, переважно, закриті елементи метаданих. Авторське право поширюється на анотації, так само як і на повний текст статті, тому вони не є відкритими для сторонніх алгоритмів інтелектуального аналізу тексту. 

У вересні 2020 року створено Initiative of Open Abstracts, що закликає усіх наукових видавців відкрити анотації публікацій та зробити їх вільно доступними. Відкритий доступ до анотацій допоможе науковим видавцям розширити читацьку аудиторію своїх видань, а вчені зможуть швидше знаходити важливі публікації за допомогою технологій інтелектуального аналізу тексту, обробки природної мови та штучного інтелекту. 


Сумісність 

Попри те, що українська мережа бібліотек одна з найбільших у світі та більшість наших наукових бібліотек використовують автоматизовані бібліотечні інформаційні системи, питання створення єдиних пошукових бібліотечних сервісів та покращення інтероперабельності бібліотечних систем залишаються цілковито невирішеними. В Україні переважно використовуються два формати зберігання бібліографічних описів – MARC21 і UNIMARC. Слід інтегрувати метадані з різних АБІС, конвертувати їх в узгоджений з предметною онтологією формат Resource Description Framework (RDF), а також провести аналіз наявних механізмів публікації даних в Linked Open Data (LOD). 

Подібна неоднозначна ситуація пов'язана й з державним плануванням розвитку національних академічних ресурсів відкритого доступу. Згідно з даними OpenDOAR в Україні створено 105 відкритих репозитаріїв, 388 українських журналів представлено в DOAJ. Попри такі кількісні здобутки відкритості, сьогодні вітчизняні наукові публікації офіційно агрегуються на порталі Наукова періодика України, що не пропонує для машин відкритих інтерфейсів взаємодії. 

Замість покращення політики функціонування вже наявного порталу з 2016 року в Україні ініційовано створення Національного репозитарію відкритих текстів. Відомо, що новий сервіс повинен використовувати можливості Open Archives Initiative Protocol for Metadata Harvesting (OAI-PMH) та SWORD (Simple Web-service Offering Repository Deposit), але цим, схоже, й обмежуються всі вимоги щодо інтероперабельності майбутнього сервісу, який досі перебуває в процесі обробки. 

Багаторазовість 

Українські чиновники, що відповідають за розвиток освіти та науки, доволі часто переконані, що саме активна міжнародна наукова співпраця є надзвичайно важливою для розвитку науки в Україні. Однак, при цьому в Україні досі не створено національний реєстр наукових інфраструктур, нерозроблені рекомендації та вимоги до оформлення метаданих, а при виконанні спільних наукових проєктів застосовуються типові форми договорів, що не враховують усіх питань юридичної сумісності. А як можна ефективно співпрацювати, якщо не вирішено навіть питання щодо власника майбутнього спільного наукового продукту? 

Переконаний, що використання принципів FAIR у вітчизняній державній науковій політиці сприяло б створенню кращих можливостей для розвитку міжнародної співпраці, проте завжди є ризик, що все це залишиться тільки на папері.

Немає коментарів:

Дописати коментар