Вследствие на интегрирането на автоматизираните работни процеси, както и на бързото развитие на изкуствения интелект в научните изследвания, развитието на науката е силно зависимо от отворения и рационализиран/улеснен достъп до изследователски данни. По този начин, доброто и последователно управление на данните, се превръща в задължително условие. Тъй като целта е данните да бъдат не само отворени, но и FAIR (т.е., да бъдат откриваеми, да са достъпни, да са оперативно съвместими, както и да могат да бъдат използвани многократно), създаването на План за управление на данните, се счита за задължение. Всъщност, добре изготвеният План се е превърнал в една от основните предпоставки за повишаване на осведомеността за изследователските данни, като значението му се подсилва от задължителното му представяне, изискуемо от Европейската комисия, в рамките на първите шест месеца, по отношение на проектите на Европейския съвет за научни изследвания и „Хоризонт Европа“.

В стремежа си да направи изследователските данни откриваеми, достъпни, оперативно съвместими и многократно използваеми, един добре поддържан План за управление на данните включва, наред с други елементи, следната информация:

  • боравенето с изследователски данни по време на проекта и след приключването му; какви данни трябва да се събират, обработват и/или генерират;
  • методологията и стандартите, които ще се прилагат;
  • дали данните ще се споделят/ще се осигури свободен достъп до тях; начина на куриране и съхранение на данните, включително след края на проекта.

Конкретните насоки, произтичащи от Принципитеза FAIR(справедливи) данни, са описани по-долу.

Да бъдат откриваеми:

  • (мета)данните получават глобално уникален и постоянен идентификатор;
  • данните се описват с богати метаданни (съгласно раздела за многократна използваемост, по-долу);
  • метаданните ясно и изрично включват идентификатора на данните, които описват;
  • (мета)данните са регистрирани или индексирани в ресурс за търсене.

Да бъдат достъпни:

  • (мета)данните могат да бъдат извличани по техния идентификатор чрез стандартизиран комуникационен протокол;
  • протоколът е отворен, безплатен и универсално приложим;
  • протоколът позволява процедура за удостоверяване и оторизация, когато е необходимо;
  • метаданните са достъпни, дори, когато същите вече не са налични.

Да бъдат оперативно съвместими:

  • (мета)данните използват формален, достъпен, споделен и широко приложим език за представяне на знания;
  • (мета)данните използват речници, които следват принципите Принципите за FAIR (справедливи) данни;
  • (мета)данните включват квалифицирани препратки към други (мета)данни.

Да бъдат повторно използваеми:

  • мета(данните) са детайлно описани, с множество точни и релевантни атрибути;
  • (мета)данните се публикуват с ясен и достъпен лиценз за използване на данни;
  • (мета)данните са свързани с подробно описание за произхода;
  • (мета)данните отговарят на стандартите на общността, свързани с домейна.“

Основната логика на принципите е да се предоставят рамковите характеристики, които трябва да бъдат демонстрирани от ресурсите на данни, инструментите, речниците и инфраструктурите, за да се даде възможност за откриване и повторно използване от трети страни, т.е. да се направи така, че данните да могат да се използват повторно от тези, които не са участвали в първоначалното генериране на данните. Значението на поддържането на добро управление на данните се подсилва допълнително от факта, че то позволява не само правилното съхранение на данни, свързани с публикувани открития, но също така и разработването на по-нататъшни изследователски знания върху предварително генерирани изследователски данни.

Трябва да се отбележи, че макар Принципите за FAIR (справедливи) данни да са на преден план в един добър План за управление на данните, това не е единственият аспект, който трябва да се вземе предвид при осигуряване на добро управление. Документът трябва да бъде конкретен и по отношение на предоставянето на добро обобщение на данните, и да отговаря на изискванията по отношение на сигурността, както и на правните/етичните аспекти, а именно:

  • посочване на целта на събирането/генерирането на данни;
  • обяснение на връзката с целите на проекта;
  • посочване на видовете и форматите на генерираните/събраните данни;
  • уточняване дали съществуващите данни се използват повторно;
  • посочване на произхода на данните;
  • посочване на очаквания обем на данните;
  • очертаване на полезността на данните, т.е., за кого ще бъдат полезни;
  • сигурността на данните също трябва да бъде внимателно разгледана по отношение на възстановяването на данните, както и по отношение на сигурността, на съхранението и прехвърлянето на чувствителни данни;
  • правните/етичните аспекти също следва да бъдат обхванати (които могат да окажат въздействие върху обмена на данни),, в смисъл на етичен преглед, отразяващ, също така, раздела за етиката в описанието на действията в рамките на дадения проект, както и в контекста на изпълнението на докладите/изискванията, посветени на етичните съображения.

Значимостта на Принципите за FAIR (справедливи) данни, респективно, на Плана за управление на данните, в рамките на проектите наХоризонт Европа“, както и след изтичането на срока на същите, е безспорна. Както застъпват Уилкинсън и Дюмонтие в своята публикацияРъководни принципи за FAIR (справедливи) данни, за управление и стопанисване на научноизследователските данни“:

Доброто управление на данни не е самоцел, а по-скоро ключов проводник към откриването на знания и иновации, както и към последващото интегриране и повторно използване на данни, и знания от общността, след процеса на публикуване на данните“.

*Изготвянето на настоящата публикация в блога е финансирано от Европейския съюз. Изразените възгледи и мнения, обаче, принадлежат изцяло на техния автор и не отразяват непременно възгледите, и мненията на Европейския съюз, или на Европейската комисия. За тях не носи отговорност нито Европейският съюз, нито Европейската комисия.