3c. Wat dóet een WU nu eigenlijk?
(vrije vertaling van
deze tekst van een medewerker van de Pande Group van Stanford)
Laten we eerst beginnen met wat basale natuurkunde. Het basis-idee is dat van een "trajectory". Je zult je Newton's 2e wet nog wel herinneren. Die stelt dat de versnelling a (verandering van snelheid) die een deeltje ervaart in verhouding staat (via de massa van het deeltje) met de kracht die op het deeltje werkt. Dit betekent dat als we alle krachten op het deeltje in kaart brengen en zijn massa weten, we zijn versnelling kunnen berekenen. Als we de versnelling weten, kunnen we, door "calculus" te gebruiken, bepalen waar het deeltje zich bevindt ten opzichte van de locatie waar hij zich bevond. Dat betekent dus dat we kunnen bepalen waar het deeltje is in functie van de tijd. Dat resulteert in een zogenoemde "trajectory": een soort kaart waarop staat waar het deeltje zich op welk moment bevindt en waar het heen zal gaan. Trouwens, als ik hier deeltje zeg, dan bedoel ik dat we deze analyse op atomen, eiwitten, tennisballen, de space shuttle, de zon en alles wat ertussen zit zouden kunnen doen.
Dat doen we niet.
De analyse wordt een stuk moeilijker als er meer deeltjes in het systeem zitten. Bijvoorbeeld: als we een systeem op zouden zetten met alleen de aarde en de zon als zijnde 2 deeltjes die elkaars zwaartekracht ervaren, dan zou je de 2e wet van Newton erg makkelijk op kunnen lossen en een functie opschijven die beschijft waar de aarde en de zon zich ten opzichte van elkaar bevinden voor elke denkbaar moment in de tijd. Zou je de maan erbij betrekken en evt nog enkele planeten, dan zou deze functie helemaal niet meer uitgeschreven kunnen worden, maar je kan de 2e wet van newton dan wel numeriek oplossen. Dat is eigenlijk wat er gebeurt bij Folding@Home: de 2e wet van Newton numeriek oplossen voor duizenden atomen, duizenden keren, elke femtoseconde weer. Een femtoseconde is een seconde x 10
-15. Wat daaruit komt is een "trajectory" voor atomen in een eiwit.
Als wij het vouwen van een eiwit simuleren, dan zou de trajectory misschien resulteren in een gevouwen eiwit. Misschien ook niet, we hebben geen manier om na te gaan of dit gebeurt vanuit een vastgestelde startopstelling van het eiwit. (maar desondanks bestuderen we het wel, dankzij ons Leger van Ondo....eeeeuh....jullie...Het Leger van Ondoden wordt gebruikt voor een heel ander project).
Dus, op mijn werk-pc kan ik een systeem simuleren van ongeveer 16.000 atomen groot, dat gedurende 1 nanoseconde beweegt. Daar doe ik (nuja, mijn pc) dan 1 werkdag over. Maar het eiwit dat ik aan het vouwen ben, heeft ongeveer 1 microseconde nodig om te vouwen! Om te simuleren dat mijn eiwit 1 microseconde vouwt, is mijn pc dus 1000 dagen aan het vouwen! Dan heb ik het nog niet eens over gemiddelde of grotere eiwitten die er honderden microseconden of zelfs hele milliseconden over zouden doen om te vouwen.
Misschien heb ik heel veel geluk en zou mijn eiwit vouwen in die tijd. Misschien heb ik heel veel pech en lukt het niet, en zouden ze me 35 jaar later vinden in een soort kelder van een kruipruimte onder het chemistry-gebouw van Stanford, een volslagen gestoord persoon, waanzinnig geworden door zijn PhD-onderzoek, 's nachts op zoek naar verspilde gist-extracten of iets anders om op te eten, NMR-buisjes verzamelend als primitieve juwelen (ik heb ooit horen zeggen.....)
Teneinde levensverspillende tragedies als deze te vermijden (het is toch al moeilijk voor de ouders), hebben wij honderdduizenden geïnteresseerde mensen gerecruteerd (jullie!) om ons een handje te helpen met dit werk. Ik zou aan een trajectory kunnen laten rekenen voor 1000 dagen, maar in plaats daarvan hebben we een stukje afgesneden en is er bedacht dat we aan 1000 of 10.000 of 100.000 trajectories gaan laten rekenen voor een paar dagen (of maanden, of jaren). Gemiddeld genomen komen uit een paar van die trajectories een volledig gevouwen eiwit (en we hebben zo onze methodes om nuttige informatie uit al het vouwwerk van FAH te halen).
Okee, hier komt 'ie: De CLONE-nummers zijn labels voor elke trajectory die we runnen. Elke GENeration is een klein stukje tijd van die trajectory. Stel je nu eens voor dat ik CLONE 0, GEN 0 (de eerste 4 nanaseconden) zou benchmarken. Dat is mijn WorkUnit. Als FAH dat afgevouwen heeft bouwt FAH meteen een nieuwe WU met de startcoördinaten, snelheden en temperaturen waar de mijne zijn opgehouden. Dat komt WorkUnit GEN 1, CLONE 0 naar jou toe om de volgende 4 nanoseconden te simuleren. Dat gaat zo nog wel eventjes door. Samenvattend: CLONE is een label voor een individuele trajectory en GENerations zijn tijdstappen van die trajectory.
RUNs zijn groepen van gelijke CLONEs. Alle CLONEs in een RUN hebben exact dezelfde atomen op exact dezelfde plaatsen bij dezelfde snelheid etc. Het verschil zit hem in de startsnelheid: de startbeweging van elk individueel atoom in het eiwit wordt random door elkaar gehusseld. Statistisch gezien worden de snelheden bepaald door de temperatuur, maar er zijn oneindig veel mogelijkheden om de atomen met verschillende snelheden te laten bewegen. Daarom proberen we eerst ongeveer 100 CLONEs om een beetje een helder idee te krijgen van de ruimte waarbinnen het eiwit zich kan bewegen. Verschillende snelheden toewijzen blijkt van essentieel belang te zijn. Als de conformatie waarmee we starten toevalligerwijs de transition-state is (halfweg gevouwen, halfweg niet gevouwen) dan zullen 50 van de 100 CLONEs volledig invouwen en 50 zullen dat niet.
De verschillende RUNs in een PROJect stellen, in hun eenvoudigste vorm, verschillende start-conformaties voor. We zouden dus kunnen beginnen met 100 RUNs van verschillende gedeeltelijk gevouwen structuren en proberen degene te vinden waarvan de helft van de CLONEs volledig vouwt: die RUN heeft dan de conformatie van de transition-state.
Waarom is dat transition-state gedonder zo belangrijk? De gevouwen staat van een eiwit is relatief simpel te identificeren, helemaal als analisten de structuur van het eiwit nauwkeurig bestudeerd en geïdentificeerd hebben. De ongevouwen versie van een eiwit is wat moeilijker, maar we kunnen de ongevouwen versie genereren door te simuleren dat we de gevouwen versie verhitten en daarmee het eiwit laten "smelten". Maar de weg die een eiwit aflegt om van ongevouwen naar gevouwen te gaan is nog wat moeilijker te bepalen. Als we de transition-state weten, weten we in ieder geval een punt op de weg die een eiwit aflegt en dat is belangrijk voor onderzoek naar het vouwen van eiwitten.
De RUNs zouden ook licht verschillende eiwitten kunnen weergeven, bijvoorbeeld mutanten van een eiwit. Ze zouden ook andere dingen kunnen voorstellen waar ik nog niet aan heb gedacht, maar ze zijn in ieder geval gelijkend genoeg aan andere RUNs in hetzelfde PROJect, zodat ze wel samen lid kunnen zijn van hetzelfde PROJect.
Om het samen te vatten: als ik een project opzet, zou ik het volgende doen.
- 100 verschillende ongevouwen of gedeeltelijk ongevouwen conformaties van mijn eiwit van interesse uitkiezen. Dit worden mijn RUNs
- Dan zet ik 100 verschillende CLONEs op voor elke RUN (Eigenlijk doe ik dat niet, ik loop gewoon een computerprogramma door, maar ik loop het programma wel heel goed door! En intelligent! En ik zie er ook nog goed uit als ik dat doe!) Elke CLONE bevat 1 WU op dit punt.
- Dan laat ik de 100 RUNs x 100 CLONEs = 10 000 WU's los op de wereld! (jullie)
- Ik ga lunchen
- Ik lunch nog steeds
- Na een paar weken kom ik terug en vind ik gekraakte WU's en GENerations vooruitgaan. Elk van de 10000 WU's was het begin van een trajectory, dus aan het eind heb ik 10.000 trajectory's van 50 of 100 nanoseonden.
- Ik analyseer de data en leer weer iets nieuws over eiwitvouwingen!
En zo gaat dat. Ik ben eigenlijk nog niet zo lang bezig, dus stap 4,5,6 en 7 moet ik nog doen, maar ik ben een leuk eind op weg met stap 1,2 en 3 en nu is het dus een kwestie van wachten (en stap 1,2 en 3 nog heel vaak doen).
Contacteer mij niet, ik ben een slechts een robot.