Grids in de wetenschap

In de wetenschap zijn al enkele grote grids gerealiseerd als ondersteuning van e-Science.

Een casestudie: het Europese DataGrid

Een van de grootse grids in de wereld is het Europese DataGrid dat is gemaakt door de hogere-energie natuurkundigen in Europa onder leiding van CERN. Bij CERN in Genève staan grote versnellers voor het doen van onderzoek naar elementaire deeltjes. Binnenkort komt daar nog een grote machine bij die petabytes aan gegevens zal genereren. Een petabyte is een miljard mbyte.

Computers die over heel Europa verspreid staan, zullen worden betrokken bij de analyse van deze gegevens. Ook moet deze informatie worden gekoppeld met gegevens uit andere databanken en beschikbaar zijn voor alle natuurkundigen die aan een experiment op de nieuwe versneller werken.

Elke groep wetenschappers die aan een experiment werkt, is een virtuele organisatie. Het zijn honderden mensen uit allerlei Europese landen met ieder een specifieke rol in het experiment. Vanuit hun eigen instituut (in Nederland is dat bijvoorbeeld het NIKHEF in Amsterdam) moeten ze toegang hebben tot de gegevens in Genève, en tot alle computers die bij het experiment zijn betrokken. Ze moeten kunnen samenwerken met de anderen alsof ze in hetzelfde kantoor zitten.

Alsof dat al niet moeilijk genoeg is om te realiseren, moet het ook op een veilige manier gebeuren en moet het transparant zijn voor de natuurkundigen. Voor hen moet het eruit zien alsof ze slechts bij het experiment hoeven in te pluggen, kenbaar hoeven te maken wie ze zijn, en op die manier automatisch toegang krijgen tot alle systemen waartoe ze gerechtigd zijn. Dit lijkt een beetje op het stopcontact idee: je stopt de stekker in het stopcontact en hebt stroom, zonder dat je je druk hoeft te maken waar het wordt gegenereerd en hoe het bij je thuis komt.

Binnen het Europese DataGrid project, dat tot eind 2003 liep, is een eerste stap gezet om een echt transparant grid te bouwen.