RĂĽckblick: Ein Jahr Team Heise Falter bei Folding@home
Seit dem März 2020 nimmt der Heise-Verlag am Projekt Folding@Âhome im Kampf gegen Covid-19 und Co. teil. Ein Jahr später ist das Team unter den Top 20 weltweit.
- Benjamin Kraft
Das Projekt Folding@home (FAH) unterteilt komplexe Simulationen davon, wie sich Proteine falten, in kleine Work Units (WU, Arbeitspakete), die der heimische Rechner der Teilnehmer mit CPU oder Grafikkarte durchrechnet und anschließend wieder zurücksendet. Für jedes Paket bekommen die Teilnehmer Punkte gutgeschrieben – und zwar umso mehr, je schneller das Paket durchgerechnet und retourniert wurde.
Doch warum interessiert überhaupt, welche räumliche Struktur Proteine einnehmen? Dr. Lucie Delemotte von der Königlichen Technischen Hochschule in Stockholm (siehe Interview) erklärt es so: Proteine sind so etwas wie kleine molekulare Maschinen, die für viele der Prozesse verantwortlich sind, die wir mit Leben in Verbindung bringen, etwa Muskelbewegungen, Verdauen von Nahrung oder die Fähigkeit, Licht wahrzunehmen. Ein Protein besteht aus einer Kette von chemischen Bausteinen, den Aminosäuren. Viele Aminosäureketten falten sich zu bestimmten dreidimensionalen Strukturen, die bestimmte biochemische Funktionen haben.
FAH berechnet anhand von Modellen, wie sich Proteine falten, die mit bestimmten Krankheiten in Verbindung stehen. Dabei ist die Frage nicht nur, welche die dominante Struktur ist, die das jeweilige Protein einnimmt, sondern auch, wie es diese einnimmt und welche anderen Formen es gibt. Denn das Molekül bleibt nicht statisch, sodass durch die stetige Bewegung zu verschiedenen Zeitpunkten unterschiedliche Bereiche freiliegen. Dieses Wissen erlaubt die Entwicklung neuer Wirkstoffe, die an Stellen eingreifen können, die bislang unbekannt waren.
Was ist Ihrer Meinung nach der größte Erfolg des FAH-Projekts?
Delemotte: Die größte Leistung ist sicherlich, so viele über die ganze Welt verteilte Leute in ein derart großes Forschungsvorhaben einzubeziehen, das neue Erkenntnisse über zahlreiche medizinische und pharmakologische Systeme bringt. Die Art von Berechnungen, die wir im Zuge unserer Forschung vornehmen, erlauben uns, neue Medikamente und Wirkstoffe zu entwickeln, indem sie uns bildlich zeigen, wo sich Wirkstoffe mit ihren Zielmolekülen verbinden und wie sie funktionieren. Allerdings sind solche Berechnungen sehr aufwendig.
Vereinfacht gesagt ist die Idee hinter FAH, die ungenutzte Rechenleistung vieler Computer überall auf der Welt zu nutzen, um Proteindynamik zu simulieren. Bildlich gesprochen ist jede Simulation eine Art Entdecker. Indem wir Tausende von ihnen in alle möglichen Richtungen aussenden, können wir Aufgaben in Angriff nehmen, die auf einem einzelnen Rechner unlösbar sind.
Die biomedizinischen Anwendungen der FAH-Technik sind sehr breit und umfassen Erkrankungen wie Alzheimer, Krebs und Infektionsbekämpfung. Aktuell konzentrieren wir uns darauf, SARS-CoV-2 besser zu verstehen. Mit dem COVID-Moonshot-Projekt sind wir aktiv an der Entwicklung antiviraler Wirkstoffe beteiligt und haben bereits erste Kandidaten ermittelt. Die Tests mit Modellen, die auf Tieren basieren, werden gerade finalisiert. Derzeit arbeiten wir an der Anwendbarkeit beim Menschen. Ziel ist die Entwicklung und Produktion eines patentfreien antiviralen Medikaments zur oralen Einnahme. Das würde weltweit den Schutz gegen neue Varianten von SARS-CoV-2 stärken.
Was ist der wichtigste Meilenstein des vergangenen Jahres?
Delemotte: Ich würde sagen, dass die Wissenschaftler hinter FAH an "COVID Moonshot" teilnehmen. Die Entwicklung eines neuen Wirkstoffs gegen Covid-19 stützt sich auf Beiträge vieler Forscherteams auf der ganzen Welt. FAH hat dazu mit zahlreichen Berechnungen und Simulationen beigetragen, andere Gruppen führen darauf aufbauend Laborexperimente durch. Es gibt bereits vielversprechende Wirkstoffkandidaten, von denen wir hoffen, dass sie in die Entwicklung und Erprobung gehen.
Was ist die größte Herausforderung an einem verteilten Rechenprojekt wie diesem?
Delemotte: Abgesehen von den technischen Herausforderungen, bei denen ich mich auf andere Mitglieder des FAH-Konsortiums verlasse, ist es wohl dies: den Rechenzeitspendern (und der Allgemeinheit) zu erklären, dass unsere Forschung ein langwieriges, vom Zufall abhängiges Unterfangen ist. Ein Großteil des Fortschritts bleibt für Außenstehende unsichtbar und wäre auch schwer zu erklären, ist für uns aber unverzichtbar. Nicht auf ein konkretes Medikament zeigen und sagen zu können, "Das haben wir entwickelt, und jetzt rettet es Leben!" macht es schwer, das Interesse über längere Zeit aufrecht zu halten.
Haben die von FAH erzielten Erkenntnisse Ihres Wissens zur Entwicklung eines Covid-19-Impfstoffs beigetragen?
Delemotte: Nein, denn FAH nimmt nicht an der Impfstoffforschung teil; dafür sind unsere Methoden auch nicht besonders geeignet. Die Impfstoffentwicklung und -optimierung zielt darauf ab, das körpereigene Immunsystem anzuregen, das Virus möglichst schnell zu bekämpfen, damit es Zellen nicht infiziert.
Wir konzentrieren uns stattdessen auf ein einzelnes Protein des Virus, das Zielmolekül (Target), und versuchen mit Wirkstoffen seine Funktion gezielt zu stören. Das können kleine Moleküle oder Peptide sein, die eine selektive, starke Bindung mit dem Target eingehen. Beispielsweise helfen sie, die Vermehrung des Virus zu stoppen – das ist der Fall beim Angriff auf die Virus-Protease, also beim Projekt COVID Moonshot. Oder sie richten sich gegen das Spike-Protein des Virus und stören seine Bindung an menschliche Zellen und damit seinen Eintritt in die Zellen. Mit unserer Methode visualisieren wir, ob und wie stark Wirkstoffkandidaten an ein bestimmtes Virusprotein ankoppeln und ob sie tatsächlich seine Funktion unterbinden. So erlangen wir Hinweise darauf, wie wir den Wirkstoff verbessern können.
Schon vor dem COVID-Projekt nutzte FAH die von den Teilnehmern bereitgestellte Rechenzeit, um andere Krankheiten wie Alzheimer, Huntington oder Krebs zu erforschen. Gab es dabei Erfolge?
Delemotte: Ja, sogar einige, etwa beim Ebola-Virus. Darüber hinaus entdeckten Forscher beispielsweise an diversen Bakterien neue empfindliche Stellen für Medikamente, sogenannte "druggable sites" – wichtig im Kampf gegen Antibiotikaresistenz. Ein Problem der Wirkstoffentwicklung ist, dass häufig nur ein einziger Schnappschuss vom Aussehen eines Proteins vorliegt. Aber Proteine sind nicht statisch, sie haben viele bewegliche Teile. Wir versuchen mithilfe der FAH-Simulationen, diese zu entdecken und mit den Erkenntnissen neue Methoden zu entwickeln, bestimmte Proteine mit Wirkstoffen ins Visier zu nehmen.
Antibiotikaresistenz ist ein zunehmendes medizinisches Problem, das jedes Jahr mehrere zehntausend Leben kostet und unfassbar viel Geld verschlingt. Eine der häufigsten Resistenzen besteht darin, dass infektiöse Bakterien -Lactamase produzieren. Dieses Protein zerlegt das Antibiotikum und schützt so die Bakterien.
Unsere Simulationen der -Lactamase zeigten, dass sich bei üblichen Proteinbewegungen ein Teil öffnet und eine verdeckte Tasche freilegt (Cryptic Pocket), die zuvor unbekannt war. In anschließenden Experimenten konnten wir belegen, dass Moleküle, die Arzneimitteln sehr ähnlich sind, genau in diese Tasche gleiten, dort festklemmen und so die -Lactamase hemmen. Diese Methode wollen wir künftig auf Moleküle anwenden, die bislang als nicht behandelbar gelten. [Anmerkung der Redaktion: Eine Open-Access-Version dieser Arbeit finden ist frei einsehbar.]
Wie sehen Sie AlphaFold, den Algorithmus zur Vorhersage von Proteinstrukturen der Google-Tochter DeepMind? Ist er eher ein Konkurrent oder ein weiteres Werkzeug, das Wissenschaftlern zur VerfĂĽgung steht?
Delemotte: DeepMind ist mit dem AlphaFold-Algorithmus ein gewaltiger Fortschritt bei der Vorhersage von Proteinstrukturen gelungen; sie haben sich damit an die Spitze des Feldes gesetzt. Dazu möchte ich dem Team gratulieren! Allerdings erklärt AlphaFold nicht, wie sich Proteine falten – das ist nach wie vor ein ungelöstes Phänomen. Der Algorithmus beantwortet auch keine der anderen Fragen, die direkt oder peripher mit Proteinfaltung zusammenhängen.
Demgegenüber konzentrierte sich FAH ursprünglich genau auf diese Frage: Wie falten sich Proteine, um ihre dominante Struktur anzunehmen. Inzwischen bezieht das Projekt aber auch andere verwandte Fragen in seine Forschung ein, da alle diese Phänomene den gleichen physikalischen Prinzipien unterliegen. Synergien zwischen AlphaFold und Folding@home könnten uns in diesen Punkten voranbringen.
Wird es neue Projekte bei Folding@home geben?
Delemotte: Es sind stets neue Projekte in Entwicklung. Dabei geht es nicht nur um Covid-19, sondern auch um andere Bereiche wie neurodegenerative Störungen, Herzrhythmusstörungen, andere virale Krankheiten oder Muskeldystrophie. Mit mehr Rechenleistung können wir schlicht mehr Forschung in allen möglichen Gebieten des Gesundheitswesens und der Biotechnologie vorantreiben.
GPUs liefern inzwischen weit mehr Rechenleistung als CPUs. Können klassische Prozessoren trotzdem noch einen sinnvollen Beitrag in den FAH-Simulationen leisten?
Delemotte: Auf jeden Fall! Für die von uns eingesetzte Simulationstechnik gibt es zwei Engines: OpenMM läuft auf GPUs, GROMACS auf CPUs. Sie decken unterschiedliche Teilbereiche ab, liefern also beide hilfreiche Daten.
Welche Kenngröße verspricht den höchsten Durchsatz beim Falten – hohe FP32-/FP64-Rechenleistung, Speicherbandbreite, Cache (Größe, Durchsatz, Latenz) oder etwas anderes?
Delemotte: Moderne, schnelle Prozessoren und Grafikchips liefern die beste Leistung. Wichtiger ist aber aus unserer Sicht, dass uns möglichst viele Teilnehmer Rechenzeit spenden, auch wenn sie nicht die optimale Hardware besitzen. Wir können unsere Berechnungen auf viele Rechner verteilen und die Ergebnisse dann zusammensetzen.
Top 20 Player
Seit Ende März 2020 spendet auch der Heise-Verlag Rechenzeit zusammen mit Lesern im Kampf gegen Covid-19 und andere Erkrankungen. Die Jahresbilanz kann sich sehen lassen, denn die mehr als 3,6 Millionen durchgerechneten WU ergeben über 100 Milliarden Punkte und bescheren dem Team einen Platz in den Top 20 der Weltrangliste – nicht zuletzt ein Verdienst der starken Community.
Frust über gefühlte Ohnmacht, Tatendrang und viel Hardware – das waren die Gründungszutaten für das Team Heise Falter, das am 25. März 2020 offiziell startete. Unserem Aufruf, dem Virus mit freier Rechenkapazität den Kampf anzusagen, schlossen sich erfreulich viele Leser an: 6294 insgesamt.
Zur Spitzenzeit im Mai 2020 steuerten mehr als 3000 von ihnen gleichzeitig Rechenzeit bei und erzielten gemeinsam rund 12 Milliarden Punkte pro Monat. Mit dieser geballten Leistung stieg das Team nach nur einem Monat in die Top 100 weltweit. Seitdem schrumpft die Zahl der aktiven Falter im Heise-Team, derzeit sind es rund 750. Damit ist zwar auch die Punktzahl eingebrochen, zwischen 190 und 225 Millionen Punkte pro Tag (Points per Day, PPD) können sich aber immer noch sehen lassen.
Etwa 80 Millionen PPD gehen auf das Konto des c’t-Sammelnutzers ctTEAM, bei dem wir auf den Hardware-Testfundus der Redaktion zurückgreifen und immerhin Platz 42 in der weltweiten Rangliste belegen. Doch nur die rechenstarke Unterstützung unserer Mitglieder lässt unseren Faltverein weiter im Ranking aufsteigen. Daher ein großes Dankeschön nicht nur an unsere Top-5-Punkteschrubber (nach Gesamtpunktzahl) – Fabo, Fliegendekuh, maigner, eicastro, SEOkicks –, sondern auch an alle anderen, die mitmachen oder es in der Vergangenheit getan haben.
Aktuell liegen die Heise Falter nach durchschnittlich pro Tag erzielten Punkten auf Platz 14 weltweit, nach Gesamtpunktzahl belegen wir Platz 20. Und wir dürften bald weiter aufrücken: Intel, SAP und CERN & LHC Computing haben wir bereits hinter uns gelassen, die Teams Custom PC & bit-tech und Tom’s Hardware sind in Reichweite. Von unten bedrängen uns Element AI Inc und Theta Edge Compute. Das Rennen bleibt also spannend.
Die Team- und Einzelstatistiken, finden sie in den Ranglisten und Auswertungen:
Extreme Overclocking Stats: Team Heise Falter
Eine detailliertere Statistikseite zu den Teamleistungen, mit Ansichten zur täglichen, wöchentlichen und monatlichen Leistung und Teilnahme.
Folding@home: Team Heise Falter
Die Team-Seite der Heise Falter bei Folding@home.
Rechenprojekt Folding@home: Heise Falter in den Top-500-Teams
Der erste Meilenstein des Teams Heise Falter: Nach zwei Wochen unter den Top 500.
Folding@home: Team Heise Falter in Top 100
Der nächste Meilenstein: Nach einem Monat sind die Heise Falter unter den Top 100 Teams.
CUDA-Boost …
Dass sich die Leistung trotz Teilnehmerschwund so gut entwickelt hat, geht auch auf eine kleine, erfreuliche Überraschung zurück, die Nvidia im September 2020 für die Falt-Community in petto hatte: Dank Optimierungen am CUDA-Client stieg die Rechenleistung auf identischer Hardware ohne weiteres Zutun um etwa 20 Prozent. Da ein Großteil der c’t-Cruncher GeForce-Grafikkarten nutzt, machte sich das Update schnell in Form steigender Punktezahlen und höheren Work-Unit-Durchsatzes bemerkbar.
Die Top 3 der Falter-Farm bringen es zusammen auf gut 21 Millionen PPD: Rechenmeisterinnen sind die RTX 3090 FE, ob ihres wuchtigen Kühlers auch liebevoll Findlings-Edition genannt, und ihre Halbschwester von MSI. Sie schaffen an guten Tagen jeweils bereits 8 Millionen PPD. Mit einigem Abstand folgen dann das Spitzenmodell der Vorgängergeneration, die GeForce RTX 2080 Ti mit 5,6 Millionen PPD.
Apropos Dickschiffe: Die Nvidia Tesla P100 haben wir inzwischen stillgelegt. Sie ist zwar eine ausgewiesene Rechenkarte ohne DisplayanschlĂĽsse, aber auch eine ziemliche Diva, mit der nicht jedes Board bootet. Zuletzt machte sie im Dauerfalteinsatz noch mehr Ă„rger als ihre Gaming-Geschwister der GeForce-Garde: mal stand das System ohne erkennbaren Grund, mal meldete der Client GPU-Fehler. Fazit: Sie ist kein Team-Player und wurde nicht erneut fĂĽr den Kader nominiert.
Radeons spielen im Heise-Faltpark eher eine Nebenrolle, nur fünf unserer 20 verbleibenden Dauerfalter nutzen eine AMD-Grafikkarte. Sie liefern weniger Punkte als die CUDA-gedopten GeForces und ließen sich bislang zumindest bei uns nur unter Windows einfach einrichten – wir bevorzugen aber aus verschiedenen Gründen Linux. Der Radeon-Einsatz ist mit dem freien Betriebssystem deutlich anspruchsvoller, weshalb nur eine RX 5700 unter Linux faltet, und zwar konkret mit Ubuntu 20.04.1. Nachteil: Weil das benötigte Treiberpaket amdgpu pro nur mit genau einer Kernelversion funktioniert, trauen wir uns kaum, auf diesem System Updates einzuspielen.
Die GPUs von ctTEAM
GPU-Typ | theoretische Rechenleistung FP32Âą (TFlops) |
AMD-Grafikkarten | |
1 Ă— Radeon VII | 11,14 |
1 Ă— Radeon RX 5700 | 6,75 |
1 Ă— Radeon RX 6700 XT | 11,88 |
1 Ă— Radeon RX 6800 XT | 16,82 |
1 Ă— Radeon RX 6900 XT | 18,69 |
Nvidia-Grafikkarten | |
1 Ă— GeForce GTX 1660 Super | 5,03 |
1 Ă— GeForce GTX 1660 Ti | 5,44 |
1 Ă— GeForce GTX 1070 | 6,46 |
1 Ă— GeForce GTX 1070 Ti | 8,19 |
3 Ă— GeForce GTX 1080 | 3 Ă— 8,87 |
2 Ă— GeForce GTX 1080 Ti | 2 Ă— 11,34 |
1 Ă— GeForce Titan X Pascal | 10,97 |
3 Ă— GeForce RTX 2060 | 3 Ă— 6,45 |
2 Ă— GeForce RTX 2060 Super | 2 Ă— 7,18 |
1 Ă— GeForce RTX 2070 | 7,46 |
1 Ă— GeForce RTX 2070 Super | 9,06 |
1 Ă— GeForce RTX 2080 | 10,07 |
1 Ă— GeForce RTX 2080 Ti | 13,45 |
1 Ă— GeForce RTX 3060 | 9,46 |
1 Ă— GeForce RTX 3070 | 20,31 |
2 Ă— GeForce RTX 3090 | 2 Ă— 35,58 |
1 Ă— Quadro P4000 | 5,3 |
1 Ă— Quadro P5000 | 8,9 |
1 Ă— Quadro P6000 | 12,6 |
1 Ă— Quadro RTX 4000 | 14,2 |
Gesamtrechenleistung | 366,34 |
Âą bei Nominaltakt |
… und CPU-Schwund
Die Kehrseite der GPU-Gewichtung ist allerdings, dass CPUs noch stärker benachteiligt werden als zuvor: Sie brauchen pro Work Unit in der Regel ohnehin schon länger, wenn es sich nicht gerade um Vielkerner ab 24 CPU-Cores handelt, und bekommen im Verhältnis noch weniger Punkte für ihre Arbeit. Deshalb haben wir bereits vor Monaten in allen Rechnern mit maximal acht Kernen den CPU-Slot deaktiviert, zumal der FAH-Client für jeden Grafikkartenslot einen CPU-Core abzweigt.
Unsere großen Kaliber haben wir ebenfalls ausgedünnt: Threaddy the Folder (AMD Threadripper TR 3990X, 64 Kerne/128 Threads) ist nach treuem Dienst an der Faltfront von uns gegangen. Keine Sorge, es geht ihm gut – er war eine Leihstellung von AMD und wurde in die Heimat zurückgerufen. Big Threaddy (TR 3970X, 32 Kerne/64 Threads) dient inzwischen als Test- und Vergleichssystem.
So ist von AMDs Vielkern-Trio nur Threaddy Junior (TR 3960X, 24 Kerne/48 Threads) übrig geblieben. Er ackert im Team zusammen mit unserer GeForce RTX 2080 Ti und einer RTX 2060. Gekühlt wird der kleine Threaddy übrigens von der Billigwasserkühlung Xilence LiQuRizer LQ240, die quasi einen Dauerstresstest absolviert. Wie im Test kam sie bislang nicht in thermische Bedrängnis, was für eine 50-Euro-WaKü wahrlich keine schlechte Leistung ist.
Ein alter Neuzugang ist der Threadripper TR 1920X, der allerdings nicht selbst mitrechnet – dafür fällt seine Effizienz zu schlecht aus. Vielmehr dient seine X399-Platine mit ihren zahlreichen, mit reichlich Lanes angebundenen PCIe-Steckplätzen als Plattform für drei Quadro-Karten aus Nvidias Pascal-Generation.
Unsere Dual-Socket-Server sind auch (r)aus, allerdings aus anderen GrĂĽnden: Wir brauchen sie fĂĽr Vergleichstests mit den neuen Serverplattformen von AMD und Intel: Epyc 7003 (alias Milan mit Zen-3-Architektur) und Xeons mit Ice-Lake-Kernen. Ob wir sie in Anbetracht ihrer hohen Leistungsaufnahme wieder in Betrieb nehmen, ist derzeit nicht klar. Andererseits sind wir natĂĽrlich gespannt zu sehen, was ein Milan-Falter im Tandem mit Intels Eis-See so schafft. Zumal es ja nicht nur um die Punkte geht: Auch die CPU-Clients erledigen wichtige Arbeit und rechnen andere Modelle durch als die GPUs (siehe Interview).
Blick nach vorn
Wie geht es nun weiter im zweiten Jahr der Heise Falter? Für uns ist klar: Wir machen weiter. Zumal das Virus noch nicht besiegt ist. Und selbst wenn: Mit Alzheimer, Huntington, Krebs und diversen anderen Krankheiten gibt es noch viele andere lohnende Falt-Aufgaben. Wir hoffen, dass wir auch weiterhin so faltkräftige Unterstützung von unseren Teammitgliedern erhalten! Wer noch nicht dabei ist, aber mithelfen und sich dem Team Heise Falter anschließen möchte, für den haben wir eine Anleitung, wie man den Client einrichtet. Nicht die Teamnummer vergessen: 251999. Wir sehen uns in den Ranglisten!
In c’t 11/2021 untersuchen wir die Chancen und Risiken von Kryptogeld. Außerdem zeigen wir, wie Sie den Ton im Videocall verbessern können, wir haben 4K-Monitore mit USB-Dock und Tischaufsätze fürs Homeoffice getestet und Software fürs Vereinsmanagement. Sie erfahren, wie Sie den Raspi blitzschnell einrichten, Fotos per KI entrauschen und mit 3D-Fotos Googles Street View bereichern können. Ausgabe 11/2021 ist ab dem 7. Mai im Heise-Shop und am gut sortierten Zeitschriftenkiosk erhältlich.
(bkr)