Zarządzanie danymi badawczymi – między planem a sprawozdaniem

ikony danych na tle osoby

W ostatnich latach zarządzanie danymi badawczymi stało się obowiązkowym elementem projektów finansowanych przez Narodowe Centrum Nauki (NCN). Choć NCN konsekwentnie wymaga od badaczy przygotowania planu zarządzania danymi (data management plan – DMP), to wciąż brakuje jasnych wskazówek, jak sporządzić końcowe sprawozdanie z realizacji tego planu. Jak je przygotować, by bez przeszkód rozliczyć projekt?

DMP JAKO ŻYWY DOKUMENT

Kluczem do sprawnego przygotowania sprawozdania końcowego jest zrozumienie, że DMP to nie przykry obowiązek, który należy spełnić w momencie składania wniosku. Jest to „żywy” dokument, który musi ewoluować wraz z projektem. Początkowe założenia badawcze mogą się przecież zmieniać. Dlatego aby końcowe sprawozdanie nie stało się udręką, naukowcy powinni regularnie aktualizować DMP i odnotowywać każdą istotną zmianę w sposobie zbierania, przechowywania czy archiwizowania danych. Dzięki temu sprawozdanie końcowe będzie jedynie podsumowaniem faktycznie podjętych działań, a nie próbą odtworzenia historii projektu z pamięci.

PLAN A RZECZYWISTOŚĆ: CO ZAWRZEĆ W SPRAWOZDANIU?

W raporcie końcowym dla NCN najważniejsze jest opisanie stanu faktycznego w odniesieniu do pierwotnych założeń. Warto skupić się na kilku kluczowych obszarach. Po pierwsze, trzeba porównać to, co zaplanowano w DMP, z tym, co faktycznie zostało zrealizowane. Należy jasno wskazać, czy udało się pozyskać zakładaną liczbę danych. Jeśli wystąpiła jakaś rozbieżność, trzeba opisać, dlaczego tak się stało.

Po drugie, należy podać ostateczną objętość zbiorów (np. w GB) oraz zastosowane formaty plików. Warto podkreślić wybór formatów otwartych (na przykład .odt, .csv) lub innych powszechnie stosowanych standardów. Ułatwi to udostępnienie i w konsekwencji późniejsze wykorzystanie danych.

Po trzecie, warto wyjaśnić kryteria selekcji danych do udostępnienia. Nie wszystkie dane mogą lub muszą zostać udostępnione zgodnie z zasadą „as open as possible, as closed as necessary” (tak otwarte, jak to możliwe, tak zamknięte, jak to konieczne – red.). Warto wskazać, które dane zostały uznane za kluczowe dla poparcia wniosków badawczych i przeznaczone do długotrwałego przechowywania, a które (np. wersje robocze czy dane wrażliwe bez zgody na udostępnienie) zostały usunięte.

STANDARDY FAIR I METADANE

Niezwykle ważne jest wykazanie, że dane są zgodne z zasadami FAIR (Findable, Accessible, Interoperable, Reusable – wyszukiwalne, dostępne, interoperacyjne, wielokrotnego użytku). Wówczas, jeśli same dane muszą pozostać zamknięte (np. ze względu na prywatność osób badanych), metadane muszą być publicznie dostępne w otwartym repozytorium.

Trzeba też wskazać w sprawozdaniu, w jakim repozytorium dane zostały zdeponowane. Powinno to być repozytorium o potwierdzonej rzetelności, co sprawdzimy na platformie re3data.org. Należy również dołączyć numer DOI (Digital Object Identifier – cyfrowy identyfikator dokumentu elektronicznego), jaki zbiór danych otrzymał w repozytorium.

Częstym błędem przy udostępnianiu danych są braki w dokumentacji pomocniczej, co może utrudnić lub wręcz uniemożliwić ponowne wykorzystanie przez innych badaczy udostępnionych danych. Należy więc pamiętać o dołączeniu do danych pliku readme.txt, który dokładnie opisuje projekt, metodologię, rodzaje zebranych danych, ich nazewnictwo, klasyfikację itd. W sprawozdaniu warto zaznaczyć, że taki plik z dokumentacją został stworzony i zdeponowany wraz z danymi.

Plan zarządzania danymi jest deklaracją intencji. Sprawozdanie – dowodem ich realizacji. To właśnie w sprawozdaniu badacz pokazuje, co faktycznie powstało, jakie dane zostały udostępnione i jakie zmiany wprowadzono względem pierwotnego planu i dlaczego. W praktyce sprawozdanie staje się więc nie tylko dokumentem rozliczeniowym, ale także narzędziem budowania wiarygodności i jakości badań.

Zachęcamy badaczy do korzystania z pomocy Centrum Wspierania i Otwierania Nauki (CWON) zarówno przy sporządzaniu planu zarządzania danymi, jak i przy przygotowywaniu raportów z badań. Właściwe podejście do kwestii zarządzania danymi nie tylko zadowoli grantodawcę, ale przede wszystkim przyczyni się do zwiększenia widzialności i cytowalności dorobku naukowego naszej uczelni. 

 


Anna A. Janowska

DR ANNA ANETTA JANOWSKA, zastępca dyrektora CWON