Decodierung der Eingabedaten

... [ Seminar WWW und JAVA ] ... [ Thema CGI ] ... [ CGI-Skripte ] ...

Decodierung und Weiterleitung der Eingabedaten durch den WWW-Server an das Skript

Serverkonfiguration und Skripte
method=get
method=post
Parsen der Eingabedaten
Environment-Variablen
Environment-Variablen auslesen: TEST-CGI

Serverkonfiguration und Skripte

Auf dem Server sollen die Eingabedaten aus dem Formular mit Hilfe eines Scriptes verarbeitet werden. Um dieses zu ermöglichen, muß der Server erst speziell konfiguriert werden, denn normale HTTP-Server erlauben es aus Sicherheitsgründen nicht, daß Programme auf ihnen gestartet werden können. Es muß ein Verzeichnis auf dem Server als "ausführbares" EXEC-CGI Verzeichnis definiert werden. Dieses Verzeichnis wird aber aus Sicherheitsgründen nur über virtuelle Pfade angesprochen. Die ScriptAlias-Direktive verbindet dann erst den physischen mit dem logischen Pfadnamen. Das physische Verzeichnis beinhaltet die Script-Files, die dann nicht wie normale HTML-Seiten zum Client gesandt werden, sondern anstatt dessen ausgeführt, und erst deren Ergebnisse als HTML-Seiten zum Client gesandt werden.

Bevor jedoch die eigentliche Verarbeitung beginnen kann, müssen die Formulareingabedaten, die vom WWW-Browser codiert worden sind, auf dem Server wieder entcodiert und dem CGI-Skript zur Verfügung gestellt.

Die Angabe aus dem Formular method= gab dazu die Methode an, mit der die Formulardaten an den Server-Rechner übermittelt wurden. Möglich waren die Varianten method=post oder method=get.

GET :

die Daten des ausgefüllten Formulars werden an die URL-Angabe angehängt (URL-Encodeing) und dann vom Server in der Standard-Umgebungsvariablen QUERY_STRING gespeichert. Das CGI-Programm muß den Inhalt dieser Umgebungsvariablen auslesen und verarbeiten.

POST :

die Daten des ausgefüllten Formulars werden als eigenständiger Datenstrom an den Server-Rechner gesandt. Der Server stellt die Daten dem CGI-Programm über die Standardeingabe "stdin" bereit, und das Skript muß die Daten wie eine Benutzereingabe behandeln, die auf der Kommandozeile gemacht wurde. Da in diesem Fall kein EndOfFile-Signal (EOF) gesendet wird, muß das CGI- Programm die Standard-Umgebungsvariable CONTENT_LENGTH auslesen, um die Länge der übermittelten Daten und damit deren Ende zu ermitteln.

Das Parsen der Form-Eingabefelder

HTML-Formulare werden als Name/Wert-Paare zum CGI-Programm gesandt:

name1=value1&name2=value2&name3=value3&name4=value4& etc...

Beim Parsen wird der Datenstrom in Namen- und Wertfelder wie folgt aufgespalten:

Jedes "=" Zeichen signalisiert das Ende eines Variablennamens
Jedes "&" Zeichen signalisiert das Ende eines Variablenwertes. Außer bei dem letzten Variablenwert, der nicht mit & abgeschlossen wird.

Sonderzeichen

Sind die Eingabedaten erst einmal in Namen und Werte aufgespalten, müssen die Sonderzeichen wieder in die ASCII-Zeichen umgewandelt werde:

Jedes "+" Zeichen in ein Leerzeichen
Jedes %xx Zeichen in das entsprechende Zeichen aus dem Hexadezimalen ASCII-Code
Diese Transformation wird sowohl für die Variablennamen, als auch für die Variablenwerte durchgeführt.

Bei einem DOS/Windows-Server wird das Parsen z.B. wie folgt realisiert :

Es wird eine Batchdatei, die die Environment-Variablen setzt, erzeugt und dann ausgeführt
DOS mit POST Methode: legt temporäre StdIn- und StdOut-Dateien für den ein-/ausgehenden Datenstrom an, die über die CONTENT_FILE und OUTPUT_FILE Umgebungsvariablen referenziert werden
DOS mit GET Methode: Die Umgebungsvariable QUERY_STRING übergibt die Eingabedaten an einen DOS-Parameter %1% (ACHTUNG: Umgebungsspeichergröße auf dem Server muß groß genug sein !)

Environment-Variablen

Zahlreiche Informationen über sich selbst und über den vom Client empfangenen Request vermittelt der Server dem CGI-Skript in Form von Environment-Variablen. CGI spezifiziert die Namen und Inhalte dieser Variablen.

Folgende Variablen besitzen unabhängig vom jeweiligen Zugriff für einen bestimmten Server stets einen festen Wert:


SERVER_SOFTWARE:

SERVER_NAME:

GATEWAY_INTERFACE:
Die Werte der folgenden Variablen hängen vom jeweiligen Zugriff ab:

SERVER_PROTOCOL:

SERVER_PORT:

REQUEST_METHOD:

PATH_INFO:

PATH_TRANSLATED:

QUERY_STRING

REMOTE_HOST:

REMOTE_ADDR:

AUTH_TYPE:

REMOTE_USER:

REMOTE_IDENT:

CONTENT_TYPE:

CONTENT_LENGTH:

Zusätzlich zu den obigen Environment-Variablen vermittelt ein CGI/1.1-kompatibler Server dem Skript diejenigen Header-Zeilen des HTTP-Requests, die oben keine Entsprechung haben, über entsprechende Variablen. Dazu setzt er den Namen des Header-Elementes in Großbuchstaben um und ersetzt alle Bindestriche durch »_«-Zeichen. Dem Ergebnis wird die Zeichenfolge »HTTP_« vorangestellt. Aus dem Header »Accepted-Language: de« beispielsweise wird so die Environment-Variable HTTP_ACCEPTED_LANGUAGE mit dem Wert »de«. Weitere typische Beispiele sind HTTP_ACCEPT und HTTP_USER_AGENT. Die erste Variable listet alle MIME-Content-Types, die die Client akzeptiert. Der Server sollte nur ein solches Dokument schicken, dessen Format in dieser Liste enthalten ist. HTTP_USER_AGENT nennt das WWW-Client-Programm, mit dem der Anwender den Request abgeschickt hat.

Hier zwei Beispiel-Skripte, die die Environment Variablen auswerten: als DOS-Skript

und als Shell-Skript

Ein vergleichbares Skript ließt hier die Environment-Variablen aus: test-cgi?var=hallo (incl.Parameterübergabe => QUERY_STRING beachten)

... [ Seminar WWW und JAVA ] ... [ Thema CGI ] ... [Decodierung der Eingabedaten] ... [ CGI-Skripte ] ...