Neues von Apache

Über 400 Teilnehmer trafen sich im November auf der ApacheCon North America, um über den bekannten Webserver, aktuelle Technologien wie Hadoop und Lucene, das Data Grid Framework OODT sowie Business- und Community-Aspekte von Open Source zu diskutieren.

In Pocket speichern vorlesen Druckansicht
Lesezeit: 7 Min.
Von
  • Isabel Drost
  • Dr. Oliver Diedrich

Über 400 Teilnehmer trafen sich vergangene Woche in Vancouver auf der ApacheCon North America, der Nutzerkonferenz der Apache Software Foundation, um über den bekannten Webserver, aktuelle Technologien wie Hadoop und Lucene, das Data Grid Framework OODT sowie Business- und Community-Aspekte von Open Source zu diskutieren. Die Apache Con NA ist die Hauskonferenz der Apache Software Foundation; sie will Kernentwickler mit den Nutzern der bei Apache gehosteten Projekte zusammenzubringen.

In seiner Eröffnungsrede zum "State of the feather" gab Jim Jagielski, Mitgründer und Direktor der ASF, einen Überblick über den aktuellen Stand der Foundation: Knapp 400 Mitglieder, über 2500 Committer, 95 Top-Level- und 32 Labs-Projekte sowie 50 ehemals externe, noch zu integrierende Incubator-Projekte zeigen die breite Aufstellung der ASF. Bei lediglich zweieinhalb bezahlten Systemadministratoren und einer Assistentenstelle wird der Großteil der Arbeit noch immer von Freiwilligen entweder in deren Freizeit oder mit Unterstützung durch deren Arbeitgeber übernommen.

Open-Source-Spezialist David A. Wheeler stellte in seiner Keynote die Themen Security und Open Innovation in den Mittelpunkt. Seiner Ansicht nach stehen Open-Source-Projekte vor der Herausforderung, ein Umfeld zu schaffen, in dem mehr Augenmerk auf die Entwicklung sicherer Software gelegt wird. So seien beispielsweise Quellcodeverwaltungssysteme ein beliebtes Ziel für Angriffe. Softwareentwickler sollten sich insbesondere über gängige Sicherheitslücken auf dem Laufenden halten und die OWASP Top 10 Security Issues sowie die CEW/SANS Top 25 als aktuelle Quellen für häufige Implementierungsprobleme im Blick behalten. Aber auch die Handhabung sicherheitsrelevanter Einstellungen in der Default-Konfiguration bei Auslieferung könne für mehr Security sorgen: Oft würden Nutzer Pakete in dieser Konfiguration einsetzen, ohne sich über potenzielle Risiken zu informieren.

In den weiteren Vorträgen ging es unter anderem um die aktuellen Verbesserungen der Lucene-Performance und um Apache OODT (Object Oriented Data Technologies). So erkärte die NASA, wie OODT dort Forschungsprojekte unterstützt, indem es Aufgaben wie den Import von Messreihen in ein zentrales Repository und die Verwaltung der zuehörigen Metadaten übernimmt. Im Business-Track ging es um unternehmensrelevante Fragen rund um das Thema Open Source, wobei sowohl die die Bewertung des Einsatzes von Open-Source-Projekten als auch die Veröffentlichung von eigenem Code und die Beteiligung an existierenden Projekten angesprochen wurde.

Die Vorträge des zweiten Tages konzentrierten sich auf aktuelle Entwicklungen beim Apache-Websever httpd: das verbesserte mod-proxy-Modul, das jetzt seine Konfiguration auch aus einer Datenbank auslesen kann; die mod-balancer-Implementierung, die jetzt zur Laufzeit dynamisch umkonfiguriert werden kann; die Verfügbarkeit verschiedener MPM-Implementierungen als Modul. Auch Hadoop, NoSQL sowie Enterprise Java waren Thema.

In seiner Keynote zum "Apache Way" ging Eric Baldeschwieler von Hortonworks auf die Umsetzung einer offenen und transparenten Entwicklungskultur beim Projekt Hadoop ein. Gestiegene kommerzielle Interessen und die Beteiligung von Entwicklern mit unterschiedlichstem Fokus stellen das Projekt täglich vor die Herausforderung, Konflikte auflösen zu müssen. Auch wenn es keine perfekte Lösung gebe, hätten sich drei Herangehensweisen bei Hadoop über die vergangenen Jahre bewährt: Erstens eine offene, transparente Kommunikation, die offline diskutierte Designentwürfe als Vorschlag, nicht aber als Entwicklungsvorgabe kommuniziert. Bei Kommunikation über Mailingliste empfahl Eric eine "aggresiv optimistische" Herangehensweise, die von einer positiven Einstellung des Gegenübers ausgeht. Zweitens gehörten gegenseitiger Respekt und Meritokratie zu einer sachlichen und zielorientierten Diskussion. Als dritten Aspekt führte Eric Pragmatismus und Nachsichtigkeit auf: Auch wenn es Zeit kostet, neue Committer zu coachen, zahle sich dieser Aufwand langfristig aus.

Der dritte Tag war geprägt von technischen Vorträgen zum Thema Hadoop. So stellte Owen O’Malley Map Reduce Next Gen vor, das Anfang nächsten Jahres in Alphaversionen und für Mitte nächsten Jahres in einer stabilen Version erwartet wird. Mit dieser Umstrukturierung des MapReduce-Frameworks wird erstmals eine Trennung zwischen der Programmierschnittstelle MapReduce und der Resourcenverwaltung von MapReduce-Jobs erreicht. Auf diese Weise wird es für Entwickler möglich, MapReduce-API-Versionen unabhängig von der auf dem Cluster installierten Hadoop-Version zu verwenden und einen Hadoop-Cluster mit anderen APIs zu nutzen.

In weiteren Tracks wurden auch Themen wie OSGi und Java-Code-Instrumentierung behandelt. Auch Themen aus dem Operationsbereich wurden geboten: Von der Vorstellung der Infrastruktur hinter www.apache.org selbst bis hin zu Erfahrungen mit der Einführung und Umsetzung von DevOps-Konzepten wurde eine breite Palette an Themen abgedeckt.

In seiner Keynote stellte David Boloker, CTO von IBMs Emerging Internet Technology Group, Watson vor, ein System, das Anfragen mit der Komplexität natürlichsprachiger Fragen beantworten können soll. Als erste Demonstration wurde ein Jeopardy-Spieler implementiert, der es mit menschlichen Spielern aufnehmen kann – die Herausforderung hier liegt einerseits in der Komplexität der gestellten Aufgaben und dem Umfang der zu untersuchenden Eingabedaten (die in den allermeisten Fällen in Form unstrukturierter Daten wie Texten vorliegen) und andererseits in der Geschwindigkeit, mit der Antworten geliefert werden müssen. Ein Video von Watsons Endspiel ist auf Youtube verfügbar. Eine erste praktische Evaluierung des Systems erfolgt derzeit in Form eines Prototypen, der Mediziner bei der Diagnose von Krankheiten auf der Grundlage aktueller Forschungsergebnisse unterstützen soll.

Die Konferenz schloß mit einer insbesondere für deutsche Entwickler spannenden Ankündigung: Im November 2012 kommt die ApacheCon zurück nach Europa – sie soll in Deutschland stattfinden. Für die Organisation hauptverantwortlich ist Nick Burch.

Das in fünf Tracks gegliederte Programm der Hauptkonferenz wurde durch weitere Veranstaltungen ergänzt: Bei dem der Konferenz vorgelagerten Hackathon kamen weltweit verstreute Entwicklerteams zusammen, um Bugs zu beheben und Features zu implementieren. Der Inhalt des Apache Barcamps wurde ad hoc von seinen Besuchern selbst bestimmt. Abendliche Meetups nach den Haupt-Tracks boten dem Besucher die Möglichkeit, direkt mit den Entwicklern der jeweiligen Projekte ins Gespräch zu kommen. Auch der Humor kam nicht zu kurz: Die Lightning Talk Session eröffnete Shevek mit einem Brain Teaser; weiter ging es mit einer Zusammenfassung "How to make your sys admin happy" von Philip M. Gollucci ("Freibier" stand ganz weit oben auf der Liste, andere Einträge: "use ssh keys instead of passwords", "do not only suggest improvements to the Apache infrastructure but provide actual help to make them happen").

Für alle, die die Konferenz verpasst haben, sind Audiomitschnitte zu allen Vorträgen der Konferenz online verfügbar. Die Folien der Vorträge werden in den kommenden Tagen auf der Konferenzwebseite online gestellt. (odi) (odi)