Вследствие на интегрирането на автоматизираните работни процеси, както и на бързото развитие на изкуствения интелект в научните изследвания, развитието на науката е силно зависимо от отворения и рационализиран/улеснен достъп до изследователски данни. По този начин, доброто и последователно управление на данните, се превръща в задължително условие. Тъй като целта е данните да бъдат не само отворени, но и FAIR (т.е., да бъдат откриваеми, да са достъпни, да са оперативно съвместими, както и да могат да бъдат използвани многократно), създаването на План за управление на данните, се счита за задължение. Всъщност, добре изготвеният План се е превърнал в една от основните предпоставки за повишаване на осведомеността за изследователските данни, като значението му се подсилва от задължителното му представяне, изискуемо от Европейската комисия, в рамките на първите шест месеца, по отношение на проектите на Европейския съвет за научни изследвания и „Хоризонт Европа“.
В стремежа си да направи изследователските данни откриваеми, достъпни, оперативно съвместими и многократно използваеми, един добре поддържан План за управление на данните включва, наред с други елементи, следната информация:
- боравенето с изследователски данни по време на проекта и след приключването му; какви данни трябва да се събират, обработват и/или генерират;
- методологията и стандартите, които ще се прилагат;
- дали данните ще се споделят/ще се осигури свободен достъп до тях; начина на куриране и съхранение на данните, включително след края на проекта.
Конкретните насоки, произтичащи от Принципитеза FAIR(справедливи) данни, са описани по-долу.
„Да бъдат откриваеми:
- (мета)данните получават глобално уникален и постоянен идентификатор;
- данните се описват с богати метаданни (съгласно раздела за многократна използваемост, по-долу);
- метаданните ясно и изрично включват идентификатора на данните, които описват;
- (мета)данните са регистрирани или индексирани в ресурс за търсене.
Да бъдат достъпни:
- (мета)данните могат да бъдат извличани по техния идентификатор чрез стандартизиран комуникационен протокол;
- протоколът е отворен, безплатен и универсално приложим;
- протоколът позволява процедура за удостоверяване и оторизация, когато е необходимо;
- метаданните са достъпни, дори, когато същите вече не са налични.
Да бъдат оперативно съвместими:
- (мета)данните използват формален, достъпен, споделен и широко приложим език за представяне на знания;
- (мета)данните използват речници, които следват принципите Принципите за FAIR (справедливи) данни;
- (мета)данните включват квалифицирани препратки към други (мета)данни.
Да бъдат повторно използваеми:
- мета(данните) са детайлно описани, с множество точни и релевантни атрибути;
- (мета)данните се публикуват с ясен и достъпен лиценз за използване на данни;
- (мета)данните са свързани с подробно описание за произхода;
- (мета)данните отговарят на стандартите на общността, свързани с домейна.“
Основната логика на принципите е да се предоставят рамковите характеристики, които трябва да бъдат демонстрирани от ресурсите на данни, инструментите, речниците и инфраструктурите, за да се даде възможност за откриване и повторно използване от трети страни, т.е. да се направи така, че данните да могат да се използват повторно от тези, които не са участвали в първоначалното генериране на данните. Значението на поддържането на добро управление на данните се подсилва допълнително от факта, че то позволява не само правилното съхранение на данни, свързани с публикувани открития, но също така и разработването на по-нататъшни изследователски знания върху предварително генерирани изследователски данни.
Трябва да се отбележи, че макар Принципите за FAIR (справедливи) данни да са на преден план в един добър План за управление на данните, това не е единственият аспект, който трябва да се вземе предвид при осигуряване на добро управление. Документът трябва да бъде конкретен и по отношение на предоставянето на добро обобщение на данните, и да отговаря на изискванията по отношение на сигурността, както и на правните/етичните аспекти, а именно:
- посочване на целта на събирането/генерирането на данни;
- обяснение на връзката с целите на проекта;
- посочване на видовете и форматите на генерираните/събраните данни;
- уточняване дали съществуващите данни се използват повторно;
- посочване на произхода на данните;
- посочване на очаквания обем на данните;
- очертаване на полезността на данните, т.е., за кого ще бъдат полезни;
- сигурността на данните също трябва да бъде внимателно разгледана по отношение на възстановяването на данните, както и по отношение на сигурността, на съхранението и прехвърлянето на чувствителни данни;
- правните/етичните аспекти също следва да бъдат обхванати (които могат да окажат въздействие върху обмена на данни),, в смисъл на етичен преглед, отразяващ, също така, раздела за етиката в описанието на действията в рамките на дадения проект, както и в контекста на изпълнението на докладите/изискванията, посветени на етичните съображения.
Значимостта на Принципите за FAIR (справедливи) данни, респективно, на Плана за управление на данните, в рамките на проектите на „Хоризонт Европа“, както и след изтичането на срока на същите, е безспорна. Както застъпват Уилкинсън и Дюмонтие в своята публикация „Ръководни принципи за FAIR (справедливи) данни, за управление и стопанисване на научноизследователските данни“:
„Доброто управление на данни не е самоцел, а по-скоро ключов проводник към откриването на знания и иновации, както и към последващото интегриране и повторно използване на данни, и знания от общността, след процеса на публикуване на данните“.
*Изготвянето на настоящата публикация в блога е финансирано от Европейския съюз. Изразените възгледи и мнения, обаче, принадлежат изцяло на техния автор и не отразяват непременно възгледите, и мненията на Европейския съюз, или на Европейската комисия. За тях не носи отговорност нито Европейският съюз, нито Европейската комисия.
