Hier sieht man den Quellcode eines ganz einfachen Programms, jeweils in den Hochsprachen Java, C und Pascal:
public class Addierer {
public static void main(String[] args) {
int x = 2;
int y = 5;
int z = x + y;
}
}
Listing 1: Java
void main(void) {
int x = 2;
int y = 5;
int z = x + y;
}
Listing 2: C
PROGRAM Addierer;
VAR
x, y, z: Integer
BEGIN
x := 2;
y := 5;
z := x + y;
END.
Listing 3: Pascal
Dieses Programm ist sehr einfach zu verstehen:
In C oder Pascal wird nun der Compiler auf den Quellcode angesetzt und heraus kommt eine ausführbare Datei. Bei dem Java-Quelltext sieht es etwas anders aus, da hier der Compiler nicht direkt eine ausführbare Datei erzeugt, sondern zunächst nur eine Datei mit sogenannten Bytecode, der später interpretiert wird. Wir beschränken uns in der weiteren Betrachtung auf die direkt vom Compiler erzeugte ausführbare Datei.
Nach dem Start der ausführbaren Datei wird der sogenannte Programmtext in den Hauptspeicher (Speicherwerk) geladen. Der Programmtext enthält die tatsächlich von der CPU ausführbaren Befehle, es handelt sich um die sogenannte Maschinensprache.
Unter Maschinensprache oder Maschinencode versteht man eine Folge von Einsen und Nullen, die einen oder mehrere Befehle repräsentieren, die auf einer CPU ausgeführt werden können.
Unterschiedliche CPUs unterstützen üblicherweise eine unterschiedliche Anzahl an Befehlen, auch die Notation von evtl. gleichbedeutenden Befehlen kann bei unterschiedlichen CPUs variieren.
Hier sieht man ein Beispiel für Maschinencode:
0000000011000010000000010000110100000000110001010000000100001110000000 0010001101000000011000111000000001000011110000001110000000
Listing 4: Maschinencode (Programmtext)
Und an genau dieser Stelle beginnen die Probleme für den Menschen. Eine sehr lange Reihe von Einsen und Nullen ist nicht wirklich dafür geeignet, dass der Mensch sie problemlos versteht.
Das folgende Video bringt etwas Licht ins Dunkel und erläutert die Bedeutung dieser Reihe.
Wenn Sie dieses Element öffnen, werden Inhalte von externen Dienstleistern geladen und dadurch Ihre IP-Adresse an diese übertragen.
Am Ende des Videos wird auf eine SWF-Animation verwiesen. Das Bearbeiten der Animation stellt eine sinnvolle Fortsetzung des Videos dar, weshalb die folgende Aufgabe dieses aufgreift.
Bearbeite die SWF-Animation unterhttp://courses.cs.vt.edu/csonline/MachineArchitecture/Lessons/CPU/sumprogram.html
und vertiefe damit das Verständnis für die Ausführung von Maschinensprache auf einer CPU.
(Leider ist der hier angegebene Link nicht mehr verfügbar. Bitte verwende stattdessen die auf YouTube bereitgestellten Videos mit der Aufzeichnung der Animation:)
Sum program (Assembler) --> http://youtu.be/_HwoiEkW8nI (03:33)
Sum program (Maschinensprache) --> http://youtu.be/i2sREE1aAOc (03:23)
Diese Videos sind ohne Ton aufgezeichnet.
Die aufgezeichnete Animation steht sowohl für den Ablauf mit Maschinensprache, als auch mit Assembler zur Verfügung. Bedenke, dass Assembler nur eine Vereinfachung für den Menschen darstellt. Auf der CPU werden immer binär codierte Befehle (--> Maschinensprache) ausgeführt.
Die oben gezeigte Reihe aus Einsen und Nullen besteht in diesem Beispiel also aus insgesamt acht Befehlen, von denen jeder aus genau 16 Bit besteht.
0000000011000010
0000000100001101
0000000011000101
0000000100001110
0000000010001101
0000000110001110
0000000100001111
0000001110000000
Listing 5: Acht Maschinensprachebefehle, bestehend aus je 16 Bit
Diese Maschinensprachebefehle lassen sich für Menschen besser als Assemblercode darstellen:
LOAD #2
STORE 13
LOAD #5
STORE 14
LOAD 13
ADD 14
STORE 15
HALT
Listing 6: Assembler
Wie die verschiedenen auf dieser Seite angegebenen Videos zeigen, ist anhand des Assemblercodes sehr leicht nachvollziehbar, dass der Programmtext auf der betrachteten Beispiel-CPU tatsächlich eine Übersetzung des oben auf dieser Seite gegebenen Quellcodes in einer der Hochsprachen ist.
Hinweis
Der hier verwendete Begriff Assembler wird beispielhaft anhand einiger sehr einfach gehaltener Befehle erläutert. Es soll an dieser Stelle darauf hingewiesen werden, dass es für jeden Computertyp eine spezielle, auf den Befehlssatz des Prozessors zugeschnittene Assemblersprache gibt.
Eine tiefergehende Auseinandersetzung mit Assembler soll an dieser Stelle nicht erfolgen. Bei Bedarf können weitere Hintergründe zu Assemblersprachen in einem gleichnamigen Wikipedia-Artikel nachgelesen werden.
In diesem Zusammenhang veranschaulicht die verlinkte Auflistung von Hallo-Welt-Programmen in verschiedenen Assemblersprachen deutliche Unterschiede.
Ein paar zusätzliche Aufgaben sollen das Thema noch vertiefen.
Betrachte folgende Internet-Seite, auf der ganz unten das Count program mit SWF-Animation zu finden ist. Starte die SWF-Animation zum Count program und beobachte den Ablauf.http://courses.cs.vt.edu/csonline/MachineArchitecture/Lessons/CPU/Lesson.html
(Leider ist der hier angegebene Link nicht mehr verfügbar. Bitte verwende stattdessen die auf YouTube bereitgestellten Videos mit der Aufzeichnung der Animation:)
Count program (Assembler) --> http://youtu.be/IwjR83896p0 (09:37)
Count program (Maschinensprache) --> http://youtu.be/zIDj4FlOV7U (09:32)
Diese Videos sind ohne Ton aufgezeichnet.
Wie funktioniert der im Count program enthaltene EQUAL-Befehl?
Wie funktioniert der im Count program enthaltene JUMP-Befehl?
Arbeitet JUMP auch auf dem Akkumulator?
Der Assemblercode des Count program sieht wie folgt aus:
LOAD #5
STORE 15
LOAD #0
EQUAL 15
JUMP #6
HALT
ADD #1
JUMP #3
Erarbeite einen Vorschlag für ein äquivalentes Programm in einer Hochsprache wie Java, C, Pascal oder ähnlich. Diskutiere deinen Vorschlag in deiner Lerngruppe! (Keine Idee? Dann frag in deiner Lerngruppe mal nach einem Tipp!)
Weise jedem Assembler-Befehl aus der vorangegangenen Aufgabe eine Speicherzelle in der folgenden Abbildung des Speicherwerks zu.