Fleißige Falter
Rückblick: Ein Jahr Team Heise Falter bei Folding@home
Seit Ende März 2020 nimmt der Heise-Verlag am Projekt Folding@home im Kampf gegen Covid-19 und andere Krankheiten teil. Ein Jahr, über 3,6 Millionen Work Units und 100 Milliarden Punkte später ist das Team unter den Top 20 weltweit.
Das Projekt Folding@home (FAH) unterteilt komplexe Simulationen davon, wie sich Proteine falten, in kleine Work Units (WU, Arbeitspakete), die der heimische Rechner der Teilnehmer mit CPU oder Grafikkarte durchrechnet und anschließend wieder zurücksendet. Für jedes Paket bekommen die Teilnehmer Punkte gutgeschrieben – und zwar umso mehr, je schneller das Paket durchgerechnet und retourniert wurde.
Doch warum interessiert überhaupt, welche räumliche Struktur Proteine einnehmen? Dr. Lucie Delemotte von der Königlichen Technischen Hochschule in Stockholm (siehe Interview) erklärt es so: Proteine sind so etwas wie kleine molekulare Maschinen, die für viele der Prozesse verantwortlich sind, die wir mit Leben in Verbindung bringen, etwa Muskelbewegungen, Verdauen von Nahrung oder die Fähigkeit, Licht wahrzunehmen. Ein Protein besteht aus einer Kette von chemischen Bausteinen, den Aminosäuren. Viele Aminosäureketten falten sich zu bestimmten dreidimensionalen Strukturen, die bestimmte biochemische Funktionen haben.
FAH berechnet anhand von Modellen, wie sich Proteine falten, die mit bestimmten Krankheiten in Verbindung stehen. Dabei ist die Frage nicht nur, welche die dominante Struktur ist, die das jeweilige Protein einnimmt, sondern auch, wie es diese einnimmt und welche anderen Formen es gibt. Denn das Molekül bleibt nicht statisch, sodass durch die stetige Bewegung zu verschiedenen Zeitpunkten unterschiedliche Bereiche freiliegen. Dieses Wissen erlaubt die Entwicklung neuer Wirkstoffe, die an Stellen eingreifen können, die bislang unbekannt waren.
Top 20 Player
Seit Ende März 2020 spendet auch der Heise-Verlag Rechenzeit zusammen mit Lesern im Kampf gegen Covid-19 und andere Erkrankungen. Die Jahresbilanz kann sich sehen lassen, denn die mehr als 3,6 Millionen durchgerechneten WU ergeben über 100 Milliarden Punkte und bescheren dem Team einen Platz in den Top 20 der Weltrangliste – nicht zuletzt ein Verdienst der starken Community.
Frust über gefühlte Ohnmacht, Tatendrang und viel Hardware – das waren die Gründungszutaten für das Team Heise Falter, das am 25. März 2020 offiziell startete. Unserem Aufruf, dem Virus mit freier Rechenkapazität den Kampf anzusagen, schlossen sich erfreulich viele Leser an: 6294 insgesamt.
Zur Spitzenzeit im Mai 2020 steuerten mehr als 3000 von ihnen gleichzeitig Rechenzeit bei und erzielten gemeinsam rund 12 Milliarden Punkte pro Monat. Mit dieser geballten Leistung stieg das Team nach nur einem Monat in die Top 100 weltweit. Seitdem schrumpft die Zahl der aktiven Falter im Heise-Team, derzeit sind es rund 750. Damit ist zwar auch die Punktzahl eingebrochen, zwischen 190 und 225 Millionen Punkte pro Tag (Points per Day, PPD) können sich aber immer noch sehen lassen.
Etwa 80 Millionen PPD gehen auf das Konto des c’t-Sammelnutzers ctTEAM, bei dem wir auf den Hardware-Testfundus der Redaktion zurückgreifen und immerhin Platz 42 in der weltweiten Rangliste belegen. Doch nur die rechenstarke Unterstützung unserer Mitglieder lässt unseren Faltverein weiter im Ranking aufsteigen. Daher ein großes Dankeschön nicht nur an unsere Top-5-Punkteschrubber (nach Gesamtpunktzahl) – Fabo, Fliegendekuh, maigner, eicastro, SEOkicks –, sondern auch an alle anderen, die mitmachen oder es in der Vergangenheit getan haben.
Aktuell liegen die Heise Falter nach durchschnittlich pro Tag erzielten Punkten auf Platz 14 weltweit, nach Gesamtpunktzahl belegen wir Platz 20. Und wir dürften bald weiter aufrücken: Intel, SAP und CERN & LHC Computing haben wir bereits hinter uns gelassen, die Teams Custom PC & bit-tech und Tom’s Hardware sind in Reichweite. Von unten bedrängen uns Element AI Inc und Theta Edge Compute. Das Rennen bleibt also spannend.
Wer sich die Team- und Einzelstatistiken anschauen möchte, findet die Ranglisten und Auswertungen über ct.de/ysva.
CUDA-Boost …
Dass sich die Leistung trotz Teilnehmerschwund so gut entwickelt hat, geht auch auf eine kleine, erfreuliche Überraschung zurück, die Nvidia im September 2020 für die Falt-Community in petto hatte: Dank Optimierungen am CUDA-Client stieg die Rechenleistung auf identischer Hardware ohne weiteres Zutun um etwa 20 Prozent. Da ein Großteil der c’t-Cruncher GeForce-Grafikkarten nutzt, machte sich das Update schnell in Form steigender Punktezahlen und höheren Work-Unit-Durchsatzes bemerkbar.
Die Top 3 der Falter-Farm bringen es zusammen auf gut 21 Millionen PPD: Rechenmeisterinnen sind die RTX 3090 FE, ob ihres wuchtigen Kühlers auch liebevoll Findlings-Edition genannt, und ihre Halbschwester von MSI. Sie schaffen an guten Tagen jeweils bereits 8 Millionen PPD. Mit einigem Abstand folgen dann das Spitzenmodell der Vorgängergeneration, die GeForce RTX 2080 Ti mit 5,6 Millionen PPD.
Apropos Dickschiffe: Die Nvidia Tesla P100 haben wir inzwischen stillgelegt. Sie ist zwar eine ausgewiesene Rechenkarte ohne Displayanschlüsse, aber auch eine ziemliche Diva, mit der nicht jedes Board bootet. Zuletzt machte sie im Dauerfalteinsatz noch mehr Ärger als ihre Gaming-Geschwister der GeForce-Garde: mal stand das System ohne erkennbaren Grund, mal meldete der Client GPU-Fehler. Fazit: Sie ist kein Team-Player und wurde nicht erneut für den Kader nominiert.
Radeons spielen im Heise-Faltpark eher eine Nebenrolle, nur fünf unserer 20 verbleibenden Dauerfalter nutzen eine AMD-Grafikkarte. Sie liefern weniger Punkte als die CUDA-gedopten GeForces und ließen sich bislang zumindest bei uns nur unter Windows einfach einrichten – wir bevorzugen aber aus verschiedenen Gründen Linux. Der Radeon-Einsatz ist mit dem freien Betriebssystem deutlich anspruchsvoller, weshalb nur eine RX 5700 unter Linux faltet, und zwar konkret mit Ubuntu 20.04.1. Nachteil: Weil das benötigte Treiberpaket amdgpu pro nur mit genau einer Kernelversion funktioniert, trauen wir uns kaum, auf diesem System Updates einzuspielen.
| Die GPUs von ctTEAM | |
| GPU-Typ | theoretische Rechenleistung FP321 (TFlops) |
| AMD-Grafikkarten | |
| 1 × Radeon VII | 11,14 |
| 1 × Radeon RX 5700 | 6,75 |
| 1 × Radeon RX 6700 XT | 11,88 |
| 1 × Radeon RX 6800 XT | 16,82 |
| 1 × Radeon RX 6900 XT | 18,69 |
| Nvidia-Grafikkarten | |
| 1 × GeForce GTX 1660 Super | 5,03 |
| 1 × GeForce GTX 1660 Ti | 5,44 |
| 1 × GeForce GTX 1070 | 6,46 |
| 1 × GeForce GTX 1070 Ti | 8,19 |
| 3 × GeForce GTX 1080 | 3 × 8,87 |
| 2 × GeForce GTX 1080 Ti | 2 × 11,34 |
| 1 × GeForce Titan X Pascal | 10,97 |
| 3 × GeForce RTX 2060 | 3 × 6,45 |
| 2 × GeForce RTX 2060 Super | 2 × 7,18 |
| 1 × GeForce RTX 2070 | 7,46 |
| 1 × GeForce RTX 2070 Super | 9,06 |
| 1 × GeForce RTX 2080 | 10,07 |
| 1 × GeForce RTX 2080 Ti | 13,45 |
| 1 × GeForce RTX 3060 | 9,46 |
| 1 × GeForce RTX 3070 | 20,31 |
| 2 × GeForce RTX 3090 | 2 × 35,58 |
| 1 × Quadro P4000 | 5,3 |
| 1 × Quadro P5000 | 8,9 |
| 1 × Quadro P6000 | 12,6 |
| 1 × Quadro RTX 4000 | 14,2 |
| Gesamtrechenleistung | 366,34 |
| 1 bei Nominaltakt | |
… und CPU-Schwund
Die Kehrseite der GPU-Gewichtung ist allerdings, dass CPUs noch stärker benachteiligt werden als zuvor: Sie brauchen pro Work Unit in der Regel ohnehin schon länger, wenn es sich nicht gerade um Vielkerner ab 24 CPU-Cores handelt, und bekommen im Verhältnis noch weniger Punkte für ihre Arbeit. Deshalb haben wir bereits vor Monaten in allen Rechnern mit maximal acht Kernen den CPU-Slot deaktiviert, zumal der FAH-Client für jeden Grafikkartenslot einen CPU-Core abzweigt.
Unsere großen Kaliber haben wir ebenfalls ausgedünnt: Threaddy the Folder (AMD Threadripper TR 3990X, 64 Kerne/128 Threads) ist nach treuem Dienst an der Faltfront von uns gegangen. Keine Sorge, es geht ihm gut – er war eine Leihstellung von AMD und wurde in die Heimat zurückgerufen. Big Threaddy (TR 3970X, 32 Kerne/64 Threads) dient inzwischen als Test- und Vergleichssystem.
So ist von AMDs Vielkern-Trio nur Threaddy Junior (TR 3960X, 24 Kerne/48 Threads) übrig geblieben. Er ackert im Team zusammen mit unserer GeForce RTX 2080 Ti und einer RTX 2060. Gekühlt wird der kleine Threaddy übrigens von der Billigwasserkühlung Xilence LiQuRizer LQ240, die quasi einen Dauerstresstest absolviert [1]. Wie im Test kam sie bislang nicht in thermische Bedrängnis, was für eine 50-Euro-WaKü wahrlich keine schlechte Leistung ist.
Ein alter Neuzugang ist der Threadripper TR 1920X, der allerdings nicht selbst mitrechnet – dafür fällt seine Effizienz zu schlecht aus. Vielmehr dient seine X399-Platine mit ihren zahlreichen, mit reichlich Lanes angebundenen PCIe-Steckplätzen als Plattform für drei Quadro-Karten aus Nvidias Pascal-Generation.
Unsere Dual-Socket-Server sind auch (r)aus, allerdings aus anderen Gründen: Wir brauchen sie für Vergleichstests mit den neuen Serverplattformen von AMD und Intel: Epyc 7003 (alias Milan mit Zen-3-Architektur) und Xeons mit Ice-Lake-Kernen. Ob wir sie in Anbetracht ihrer hohen Leistungsaufnahme wieder in Betrieb nehmen, ist derzeit nicht klar. Andererseits sind wir natürlich gespannt zu sehen, was ein Milan-Falter im Tandem mit Intels Eis-See so schafft. Zumal es ja nicht nur um die Punkte geht: Auch die CPU-Clients erledigen wichtige Arbeit und rechnen andere Modelle durch als die GPUs (siehe Interview).
Blick nach vorn
Wie geht es nun weiter im zweiten Jahr der Heise Falter? Für uns ist klar: Wir machen weiter. Zumal das Virus noch nicht besiegt ist. Und selbst wenn: Mit Alzheimer, Huntington, Krebs und diversen anderen Krankheiten gibt es noch viele andere lohnende Falt-Aufgaben. Wir hoffen, dass wir auch weiterhin so faltkräftige Unterstützung von unseren Teammitgliedern erhalten! Wer noch nicht dabei ist, aber mithelfen und sich dem Team Heise Falter anschließen möchte, findet über ct.de/ysva eine Anleitung, wie man den Client einrichtet. Nicht die Teamnummer vergessen: 251999. Wir sehen uns in den Ranglisten! (bkr@ct.de)
Weitere Infos: ct.de/ysva