4 Casussen

Hieronder zie je vier casussen met waar gebeurde verhalen over acquisitie. In sommige casussen is er een voorbeeldstap uit het onderliggende proces gelicht, in andere casussen wordt het onderliggende proces ook beschreven.  
De boodschap van alle casussen is hoe dan ook: Ga op pad en maak het verschil. Elke bijdrage, hoe klein of groot ook, draagt bij aan het uiteindelijke resultaat. Maak gebruik van elkaars expertise en doe het samen. Tijdens de cursus gaan we samen zo'n stapje maken. 

1. TU Delft

Goed voorbereid op pad  

"Toeval speelt een rol, 
het toeval oppakken ook"

                          
                    Anke Versteeg, TUDelft 

 


“Acquireren werkt vaak het best als het niet te nadrukkelijk, misschien zelfs tussen neus en lippen door gebeurt. Wees daarom voorbereid en weet (wanneer je bijvoorbeeld al voor iets of iemand bij een faculteit moet zijn) welke wetenschappers interessant data-materiaal zouden kunnen hebben. Zo was ik laatst bij de faculteit voor civiele techniek om een promovendus op te sporen, met wie we geen contact meer kregen via e-mail of telefoon. Zijn werkkamer bleek in gebruik genomen te zijn door nieuwe PhD’ers die vertelden dat hij voor langdurig onderzoek in het buitenland was en ze gaven zijn mobiele nummer. Dat was dus al een meevaller, want eenmaal opgespoord, bleek hij zeer bereid zijn links naar zijn datasets toe te willen voegen aan zijn proefschrift. (dat punt vergat ik nog te melden: je moet soms volhardend zijn om het contact tot stand te brengen). 

Op deze zelfde gang, wist ik, heeft ook een chief-editor van een bekend Open Access Journal een kamer. We zouden het op prijs stellen als hij zijn eigen datasets zou willen delen met ons. En ook als hij wetenschappers, die bijdragen leveren aan zijn Open Access Journal, zou willen stimuleren om hetzelfde te doen. De kamerdeur van zijn secretaresse stond open: gauw even naar binnengegaan om te informeren of ik haar baas spreken over dit onderwerp, dat zijn tijdschrift nog zichtbaarder zou kunnen maken. Hij bleek precies 10 minuten tijd te hebben voor een belangrijk overleg zou beginnen. En in die 10 minuten bleek hij zeer geïnteresseerd te zijn om zijn data te delen. De belangrijkste trigger bij hem was om dataopslag te presenteren als een verdieping van Open Access uitgeven. Hij gaf onmiddellijk aan dat we contact konden opnemen met zijn uitgever (en dat loopt nu, dus ik zal jullie verder op de hoogte houden…) 

Kortom, push je boodschap niet; wees geïnteresseerd in wat de wetenschapper wil vertellen; waar gaat zijn/ haar onderzoek over; lees je daarover bij voorbaat ook al goed in zodat je klaar bent om van het toeval gebruik te maken wanneer het op je pad komt.” 

2. UT

Ervaring met databeheer ondersteuning

"De verbetering 
kwam vanuit de groep
naar voren"

                          Maarten van Bentum, UT

 

"Behoefte aan databeheer is vaak latent aanwezig. Wanneer je er naar vraagt is databeheer in eerste instantie geen probleem. Maar na enig doorvragen komen toch wel kanttekeningen bij het beheer van data naar boven. Zoals de wens om de binnen de groep geproduceerde data beter te kunnen delen.  

Zo ook bij de groep Water Engineering and Management (WEM) aan de UT. Na een eerste gesprek met de hoogleraar stelde ze voor om het bestaande interne databeheer eens onder de loep te nemen en te kijken hoe er tegen zo laag mogelijke kosten verbeteringen aangebracht konden worden. Deze activiteiten zouden worden uitgevoerd als pilot binnen het SURF project CARDS.

Toen ik het eerste gesprek had met de verantwoordelijke voor het databeheer bij WEM, bleek dat hij nauwelijks noodzaak zag tot verbeteringen in het databeheer van de groep. Het bestaande databeheer beperkte zich tot het verzamelen van datasets op een centrale schijf, zonder nadere beschrijving van deze sets of de mogelijkheid deze schijf te doorzoeken. De data werden dus wel bewaard (hoewel niet systematisch) maar niet of nauwelijks binnen de groep hergebruikt.

We besloten om een inventarisatie te maken van de ideeën over databeheer binnen de groep. Uit interviews met promovendi en onderzoeksmanagers kwam naar voren dat bij PhD-ers databeheer en het (intern) delen van data niet of nauwelijks leeft. Bij de onderzoeksmanagers leefde het echter wel. In overleg met één van hen kwam een concreet idee naar boven voor het implementeren van een tool voor intern databeheer. Op basis van een dergelijke tool zullen afspraken gemaakt worden over het omgaan met data. De kosten van deze verbeteringen beperken zich tot het aanschaffen van een pc waarop de tool geïnstalleerd wordt. Het beheer komt in handen van de huidige verantwoordelijke databeheerder van de groep.

Waarin zit nu het succes van deze casus? Ten eerste in het zoeken naar en werken aan een concrete verbetering van een bestaande databeheerpraktijk. Een verbetering die vanuit de groep naar voren kwam. Ten tweede in de bescheiden omvang, ook wat betreft de kosten, van deze verbetering. Veel groepen hebben te maken met een krap budget dat in de komende jaren ook niet veel ruimer zal worden. Ten slotte door de intensieve samenwerking met de databeheerder van de groep.  Als databeheer ondersteuner ben je enerzijds degene die kennis en ervaring inbrengt, anderzijds degene die adviseert over de stappen in een proces van verandering van het databeheer"

3. TU Delft 

"Follow the five Ps': 
Plan and be Professional, Precise, 
Persistent and especially patient"

                                          

                                                Alenka Princic, TUDelft

 

"I believe that acquisition is largely dependent on thorough and good planning for both a bottom-up and a top-down approach. When I started to explore the world of research datasets at the faculty of Civil Engineering I first informed the 'guys on the top' about my plans. I thought: "If they instruct their younger fellow researchers that they should store their research data in a data portal like 3TU.Datacentrum, then my bottom-up acquisition will be more efficient. My belief was based on my own experiences in microbiology research where a culture of sharing data such as gene sequences is well established.

One can argue that the data producers should have the right to judge form themselves what will happen to their datasets and how they will deal with storing and sharing their data. Well, that remains to be seen. Most of the university research data are to some extent produced with public funding. So to whom do the data actually belong and who can make decisions on how the data will be handled? In the end it should be the public having a say. But what this 'public' needs is advice from experts.  

So, I made a tactic and concrete plan to approach all chairs of the departments of the faculty Civil Engineering and their secretaries. I approached them by mail introducing myself briefly when needed and explaining the benefits of the services of 3TU.Datacentrum. I thought: "You never get a second chance to make a first impression, so my mail better be good". Hoping for enthusiastic reactions, I waited patiently. And I waited a bit longer, still patiently. Naturally, then there was time for a diplomatic reminder. This worked in once case but not for the remaining five. But what had also been a part of my plan was finding a moment when the department was getting together for an informal chat. That was the moment when I 'coincidently' passed by. So I said: "Hi, how are you doing? You must be the head of the department Traffic and Planning, right? I recognize your face from another occasion but it is great to meet you in person. By the way, I sent you an email two weeks ago which I am sure is interesting for you and your group. It is about research data management. Seeing your busy agenda I do not want to waste your precious time. I am actually on my way to another appointment now, so I suggest that I forward the mail once more and we can then discuss it further? An hour later, there was a pleasant email in mijn inbox, stating: "Dear Alenka. Thank you for the email, that sounds very good indeed! We have such datasets and are certainly interested. Perhaps you can first make an appointment with our ICT/data specialist. On the basis of his/your findings we can then do a bit of PR in the department and see how we further could use your facilities."

An important aspect of acquisition is to be aware of not waisting the precious time of researchers. They are fast thinkers so one has to get to the point with the right message quickly. And besides planning and being professional one should also be patient. No immediate reaction does not mean that the work has been done for nothing.    

Half a year later I started up a mini-symposium to attract researchers, do some branding and inform about 3TU.Datacentrum. Also, this was part of the plan: to get back to the same people with a similar subject and wake up in them the thought "Yes, I heard about this before". Once heard is not enough. It needs repetition and name dropping at several levels simultaneously. I guess I can call it a PPPPP principle: Plan and be Professional, Precise, Persistent and especially Patient".  

4. TU Eindhoven 

 


“Het krijgen 
van datasets
 is soms 
een zaak 
van lange adem”

Leon Osinski, TU Eindhoven

 

De onderzoeksgroep Architecture of Information Systems (AIS) van TU/e-hoogleraar Wil van der Aalst leek een prima kandidaat om te benaderen voor de opslag en publicatie van datasets in het 3TU.Datacentrum. Sinds een jaar of tien houdt deze groep zich bezig met ‘process mining’, het bestuderen van informatiestromen zoals die in informatiesystemen vastgelegd worden in zogeheten event logs. Event logs zijn de onderzoeksdata van process mining. Het is een zeer data-intensief en empirisch vakgebied. Daarmee leek het een goede kandidaat voor het 3TU.Datacentrum. Natuurlijk speelde het ook een rol dat ik een aantal personen bij deze onderzoeksgroep wat beter kende en regelmatig trof. 

De eerste contacten met de groep van Wil van der Aalst over 3TU.Datacentrum dateren van najaar 2009. Die contacten resulteerden uiteindelijk in een presentatie over 3TU.Datacentrum tijdens de wekelijkse woensdagbijeenkomst van de onderzoekers van de AIS-groep. Deze bijeenkomst vond plaats in februari 2010. Je verhaal doen tijdens een reguliere bijeenkomst werkt vaak goed en is daarbij efficiënt. In een uur bereik je circa 15 personen die sowieso toch al bij elkaar zouden komen. Dat bleek ook hier: direct na de bijeenkomst werden er spijkers met koppen geslagen en afspraken gemaakt. 

Het probleem met de AIS-groep was niet dat men datasets niet wilde opslaan of publiceren. Integendeel, men speelde al langer met de gedachte een repository met event logs op te zetten. Maar het ontbrak aan capaciteit om dit zelf te doen. Het 3TU.Datacentrum kon hier concreet iets aan doen door 2 studenten-assistenten te betalen. De bijdrage van de AIS-groep bestond hieruit dat deze studenten eenzelfde tijdsinvestering zouden doen maar dan als onderwijsopdracht. Hun taken bestonden uit het bepalen van de standaard en specifieke metadata-elementen van event logs, de mapping van de standaard metadata naar het DataCite-format en een visualisering van de metadata in het 3TU.Datacentrum. Dat laatste vergde ook overleg met de technici van het 3TU.Datacentrum. In augustus zat het werk van de student-assistenten (en de technici) er op. Toch duurde het nog tot oktober 2010 dat de eerste event logs dataset werd gepubliceerd in het 3TU.Datacentrum. 

Het krijgen van datasets is soms een zaak van lange adem. Al met al duurde het ongeveer een jaar voordat de eerste event logs werden gepubliceerd in het 3TU.Datacentrum. Voor een belangrijk deel kwam dit omdat het ging om een complexe collectie van data waarvoor nog veel (maat)werk verzet moest worden op bijvoorbeeld het gebied van metadata. Een collectie van data brengt voor een data librarian nog een andere verantwoordelijkheid met zich mee. Je moet zorgen dat men data blijft aanleveren, dat de datastroom niet verslapt. Contacten met de onderzoeksgroep moet je blijven onderhouden.

Gelukkig zijn er vanuit Eindhoven ook voorbeelden te geven waarbij de acquisitie van datasets er anders aan toe ging en minder lang duurde. De datasets van Frederico Toschi bijvoorbeeld die gewoon zelf met mij contact opnam naar aanleiding van een berichtje over 3TU.Datacentrum in het universiteitsblaadje. 

In het geval van de event logs was het essentieel dat het 3TU.Datacentrum in staat en bereid was om maatwerk te leveren en dat er met steun van het 3TU.Datacentrum student-assistenten aangenomen konden worden" 

En verder

Een kijkje buiten de 3 TU's? 
Lees dan Ten Tales of Drivers and Barriers in Data Sharing1, voortgekomen uit het ODE project.  

 

 1. Alliance for Permanent Access. (2011). The ODE project. Ten Tales of Drivers and Barriers in Data Sharing. Retrieved 15-12-2011 from www.alliancepermanentaccess.org/wp-content/uploads/downloads/2011/10/7836_ODE_brochure_final.pdf

 

Twitter
Loading..