Linux Cluster

Einleitung


[ Seminar Linux und Apache ] [ Inhalt ] [ Aufbau ]

Übersicht

[ nach oben ]

Parallel Computing

Was ist eigentlich der Grund dafür, dass überhaupt über paralleles Rechnen und somit über Parallel-Computer nachgedacht wird. Gründe gibt es dafür verschiedene. Zum einen benötigt die Simulation von realen Problemen (z.B. 3D-Modellation, Klima- und Wettermodellierung, Astrologische Berechnungen) sehr viel Rechenzeit. Außerdem sind serielle Prozessoren schnell veraltet, die Entwicklung ist auf diesem Sektor einfach sehr schnell. Das theoretisch Einfache an paralleler Hardware ist, daß man sie einfach duch Hinzufügen neuer Prozessoren erweitern kann. So treten also an die Stelle speziell entwickelter serieller Prozessoren viele "Standard"-Prozessoren in paralleler Hardware. Doch auch die Physik setzt dem Einzelprozessor irgendwann eine Grenze. Daten innerhalb des Prozessors können einfach nicht schneller als mit Lichtgeschwindigkeit zwischen den einzelnen Bauteilen eines Prozessors verschickt werden. Spätestens an diesem Punkt ist die Entwicklung vorbei, man kann dann nur noch die Entfernungen, die von Daten zurückzulegen sind, verkleinern.

Serial Computing (von Neumann):

Parallel Computing:

[ nach oben ]

Was ist ein Cluster?

Definition:

Ein Cluster besteht aus mehreren unabhängigen Server-Systemen. Diese sind lose miteinander verbunden. Ein Cluster erscheint nach außen hin als ein System.

Cluster werden meist entweder als Verfügbarkeits-Cluster oder als Performance-Cluster implementiert. Anwendungen für Verfügbarkeits-Cluster, bei den es wichtig ist, daß ein bestimmter Dienst ständig ausfallsicher zur Verfügung steht, können Authentifizierungsserver, Webserer oder Datenbankserver sein. Performance-Cluster sind rein darauf ausgelegt, Rechenzeit zur Verfügung zu stellen. Anwendungen sind zum Beispiel 3D-Modellierung, Klimaberechnung oder auch technische Simulationen.

[ nach oben ]

Was ist ein Beowulf?

Der erste Beowulf wurde 1994 von den beiden Informatikern Sterling und Becker gebaut. Er bestand aus 16 DX4 Prozessoren. Er wurde an der CESDIS, einem Kontraktor der NASA aufgestellt, um Probleme zu beherrschen, die mit den großen Datenmengen der Anwendung der NASA auftraten. Dabei ging es um Simulationen von Erde und All.

Beowulf ist ein Name für eine bestimmte Art von Cluster. Ein Beowulf ist ein hochperformanter Parallel Computer. Er ist primär gebaut aus "Hardware von der Stange". Als Betriebsystem kommt ein Freies (z.B. Linux oder FreeBSD) zum Einsatz. Die Prozessoren im Beowulf sind über ein privates Hochgeschwindigkeits-LAN verbunden. Der Beowulf besteht also aus einem Cluster von PCs oder Workstations. Der einzige Zweck einen Beowulfs ist es, Aufgaben zu erledigen, die hohe Performance benötigen. Die Nodes im Beowulf werden nicht als Desktops genutzt, ihr einziger Zweck ist es, Cluster-Jobs auszuführen. Der Zugang zum Beowulf von außen ist normalerweise nur duch einen Node möglich.

Abzugrenzen ist der Beowulf also von den "Verfügbarkeits"- und "Zuverlässigkeits"-Clustern.

[ nach oben ]

[ Seminar Linux und Apache ] [ Inhalt ] [ Aufbau ]