Parameter | Kursinformationen |
---|---|
Veranstaltung: | @config.lecture |
Semester | @config.semester |
Hochschule: | Technische Universität Freiberg |
Inhalte: | Realisierung grundlegender arithmetischer Operationen im Rechner |
Link auf GitHub: | https://github.com/TUBAF-IfI-LiaScript/VL_EingebetteteSysteme/blob/master/11_Modell_CPU.md |
Autoren | @author |
** Fragen an die Veranstaltung**
- Welche Funktionalität sollte eine ALU bereitstellen?
- Welcher Trade-Off ist mit der Entscheidung über die Wortbreite einer
- CPU und der Breite des möglichen OP-Codes verbunden?
- Welche Register gehören zum Programmiermodell eines Rechners?
- Welche Register sind für das Laden der Programmbefehle erforderlich und wir arbeiten sie zusammen?
- Erklären Sie die Vorgänge in der Fetch- und Execute-Phase der Befehlsabarbeitung.
Abstraktionsebenen
+----------------------------+ -.
Ebene 6 | Problemorientierte Sprache | |
+----------------------------+ |
⎬ Anwendungssoftware
+----------------------------+ |
Ebene 5 | Assemblersprache | |
+----------------------------+ -.
+----------------------------+
Ebene 4 | Betriebssystem | Systemsoftware
+----------------------------+
+----------------------------+
Ebene 3 | Istruktionsset | Maschinensprache
+----------------------------+
+----------------------------+ -. ╔═══════════════╗
Ebene 2 | Mikroarchitektur | | ◀══║ HIER SIND WIR!║
+----------------------------+ | ╚═══════════════╝
⎬ Automaten, Speicher, Logik
+----------------------------+ |
Ebene 1 | Digitale Logik | |
+----------------------------+ -.
+----------------------------+
Ebene 0 | E-Technik, Physik | Analoge Phänomene
+----------------------------+ .
@startditaa
+------------------+
|c88F |
| Speicher |
| |
+---------+-+------+
^ | ^
| | |
+----------+ Adresse | | | +-----+-----+
|cF88 +-----------+ | | | A | B |
| | | | Daten +-----+-----+
| | Befehl | +-------------->+cFF4 |
| Steuer- |<------------+ | |
| werk | Kontrolle | ALU |
| +------------------------------>+ |
| | | |
| | Status | |
| |<------------------------------+ |
| | | |
| | Kontrolle | |
| +-------------+ Daten | |
| | | +-------------->| |
| | Status | | | |
| |<----------+ | | | |
+----------+ | | | +-----------+
| | |
| V V
+-------+-----------+
|c8F8 |
| Ein/Ausgabe |
| |
+-------------------+
@endditaa
Der Prozessor ist die Einheit eines Rechners, die Daten nach einem vom Anwender spezifizierten Programm manipuliert. Das Programm wird als eine Folge von Anweisungen oder Befehlen für die CPU formuliert. Die CPU besteht daher:
- aus einer Komponente, welche die Befehle liest, interpretiert und die korrekte Folge der Befehlsabarbeitung einhält - das Steuerwerk
- aus einer Komponente, welche die Operationen auf den Daten, die durch die Befehle spezifiziert werden, ausführt
Das Steuerwerk besteht im wesentlichen aus einem Befehlsdecoder und einer Ablaufsteuerung. Befehle werden aus dem Befehlsspeicher gelesen und dekodiert.
Befehl | Codierung | |||
---|---|---|---|---|
ADD_B | 0110 | 011 | 0 | 11 |
Der Programmzähler berechnet welcher Befehl im nächsten Schritt bearbeitet werden soll. Die Ablaufsteuerung erzeugt, entsprechend dem auszuführenden Befehl, die Steuer- oder Kontrollsignale, um Daten zu lesen, im Datenpfad zu bearbeiten und die Resultate zu speichern.
Bei der Bearbeitung der Daten werden vom Datenpfad Statussignale generiert, die wiederum den Ablauf des Programms beeinflussen können, wie z.B. eine Programmverzweigung, die abhängig davon ist, ob das Resultat einer Berechnung größer oder kleiner einem bestimmten Wert ist.
Der Datenpfad besteht aus der ALU, die im einfachsten Falle arithmetische und logische Grundoperationen ausführen kann und einem Registersatz, in dem Daten bei der Verarbeitung zwischengespeichert werden.
Auf dieser Basis wollen wir nun einen Modellrechner entwerfen, an dem die zentralen Komponenten eingehender Untersucht werden können. Wo fangen wir an?
Um einen konkreten Maschinenbefehlssatz festlegen zu können, müssen die Randbedingungen unseres Prozessors betrachtet werden. Ein entscheidender Parameter ist die Wortbreite der Speicherschnittstelle. Die Wortbreite der Speicherschnittstelle bestimmt, wie viele Bits in einem Speicherzugriff zwischen Prozessor und Speicher transferiert werden können. Der intuitive Ansatz, diese Schnittstelle möglichst breit zu machen, hat weitreichende Auswirkungen auf die Rechnerarchitektur insgesamt.
Was nützt es, wenn wir zwar die Daten schnell aus dem Speicher lesen können, diese aber nur mit der halben Breite verarbeiten? Die Wortbreite des Speicher und der Breite der Verarbeitungseinheiten des Prozessors müssen abgestimmt sein.
Da Befehle und Daten in unserem Modellrechner in ein- und demselben Schreib/Lesespeicher stehen, muss die Wortbreite der Speicherschnittstelle auch für das Befehlswort berücksichtigt werden. Für unseren Modellrechner wählen wir eine Wortbreite von 16 Bit.
Welche Befehle soll unser Modellrechner nativ umsetzen können? Wir gehen von einem einfachen System aus, das arithmetisch/logische Operationen umsetzt, Sprünge realisiert und Eingaben von einem Schalterfeld lesen kann.
| Opcode | Mnemonic | Opperand | Beschreibung | | | ------ | -------- | -------- | ---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------- | | 0000 | HLT | | HLT hält den Computer an. Kann auch manuell eingegeben werden. Nach HLT kann der Rechner nur manuell gestartet werden. Fortsetzung beim nächsten Befehl. | | 0001 | JMA | addr | (Jump on Minus) Bedingter Sprung. Wenn das Ergebnis einer Berechnung negativ ist. Die Adresse "addr" wird in den Befehlszähler geladen. Der nächste Befehl wird von "addr" genommen. | | 0010 | JMP | addr | Unbedingter Sprung. Die Adresse "addr" wird in den Befehlszähler geladen. Der nächste Befehl wird von "addr" genommen. | | 0011 | JSR | addr | Unterprogrammsprung. Die Adresse, die im Befehlszähler enthalten ist, wird ins Register A geladen. Die Adresse "addr" wird in den Befehlszähler geladen. Der nächste Befehl wird von "addr" geladen. | | 0100 | SWR | | (Copy Switch Register to A) Der Zustand der Schalter wird in das Register A geladen. | | 0101 | RAL | | (Rotate A Left) Zyklischer Links-Shift. Der Inhalt von Register A wird um 1 Stelle nach links rotiert. Ringshift : Bit A0 ← Bit A15 | | 0110 | INP | | INPUT | | 0111 | OUT | | OUTPUT | | 1000 | NOT | | Komplementbildung des Inhalts von Register A. | | 1001 | LDA | addr | Laden des Registers A von Speicheradresse addr. | | 1010 | STA | addr | Speichern des Registerinhalts auf Speicheradresse addr . | | 1011 | ADD | addr | Inhalt des Speicherwortes mit Adresse adr wird auf den Inhalt des Registers A addiert. Der ursprünglich Inhalt von A wird mit dem Ergebnis überschrieben. | | 1100 | XOR | addr | Inhalt des Speicherwortes mit Adresse adr wird mit dem Inhalt des Registers A durch XOR verknüpft. Der ursprüngliche Inhalt von A wird mit dem Ergebnis überschrieben. | | 1101 | AND | addr | Inhalt des Speicherwortes mit Adresse adr wird mit dem Inhalt des Registers a durch log. UND verknüpft. Der ursprünglich Inhalt von A wird mit dem Ergebnis überschrieben. | | 1110 | IOR | addr | Inhalt des Speicherwortes mit Adresse adr wird mit dem Inhalt des Registers A durch log. ODER verknüpft. Der ursprünglich Inhalt von A wird mit dem Ergebnis überschrieben. | | 1111 | NOP | | (No Operation) Der Befehlszähler wird um 1 erhöht. |
Nun muss die Aufteilung ein Befehlswort in ein Feld für den Operationscode und ein Feld zur Adressierung des Operanden aufgeteilt werden. Mit 16 Bit für das Operandenfeld können insgesamt 64 k Worte adressiert werden. Jedes Bit, das wir für die Codierung der Befehle brauchen, halbiert diesen Wert. Als einen Kompromiss zwischen der Größe des Speicheradressraums und einem Befehlssatz, der die wesentlichen arithmetisch/logischen Operationen enthält, nehmen wir eine Aufteilung vor in ein:
Befehlsformat:
@startditaa
15 12 11 0
+------------+-------------------------------+
|c00F OPCODE | cFF0 Operantenaddresse |
+------------+-------------------------------+
@endditaa
Datenformat:
@startditaa
15 0
+--------------------------------------------+
| cFF0 Datensatz |
+--------------------------------------------+
@endditaa
Negative Zahlen werden im Zweierkomplement dargestellt.
Aufgabe: Implementieren Sie einen variablen Rechtsshift - der Nutzer gibt bis zu 15 Shiftschritte an, die ausgeführt werden sollen.**
Herausforderung: Wir haben nur einen 1-Schritt zyklischen Linksschift auf dem Modellrechner vorgesehen. Die Lösung muss in Software realisiert werden.
Das eigentliche Programm belegt 16 aufeinander folgende Speicherplätze zwischen
Unser Rechner wird nur ein echtes Register
Adresse | Speicherinhalt | Programmzeilen | Kommentar |
---|---|---|---|
00010000 |
|
LDA 10000001 |
Lade Anzahl der Rechts-Shifts aus dem Speicher |
00010001 |
|
NOT |
Komplementieren von a |
00010010 |
|
ADD 10000010 |
2-Komplement |
00010011 |
|
ADD 10000100 |
Berechne : 16 + (-AR) |
00010100 |
|
STA 10000011 |
Speichere Anzahl der Links-Shifts |
00010101 |
|
NEXT: LDA 10000000 |
Lade Datum |
00010110 |
|
RAL |
Links-Shift |
00010111 |
|
STA 10000000 |
Speichere Datum |
00011000 |
|
LDA 10000010 |
Lade Konstante “1“ |
00011001 |
|
NOT |
Komplementieren von a |
00011010 |
|
ADD 10000010 |
2-Komplement |
00011011 |
|
ADD 10000011 |
Decrementiere Anzahl der L-Shifts |
00011100 |
|
STA 10000011 |
Speichere verbleibende Anzahl der L-Shifts |
00011101 |
|
JMA DONE |
Bed. Sprung, wenn alle L-Shifts ausgeführt wurden |
00011110 |
|
JMP NEXT |
Unbed. Sprung zum Anfang der Schleife |
00011111 |
|
DONE: HLT |
Der entsprechende Speicherauszug dazu:
Adresse | Daten | Bemerkung |
---|---|---|
10000000 | 0 0 0 0 0 0 0 0 0 0 0 0 1 1 0 1 | D: Zu shiftender Wert |
10000001 | 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 1 | AR: Anzahl der Rechts-Shifts |
10000010 | 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 | “1“: Konstante “1“ |
10000011 | 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 | TMP: Temp. Anzahl der Links-Shifts |
10000100 | 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 | “16“: Konstante “16“ |
Da wir als Befehl nur den zyklischen Linksshift (RAL
) um 1 Stelle zur Vefügung haben, müssen wir den zyklischen Rechtsshift um eine beliebige Anzahl von Stellen durch ein Programm simulieren. Im Modellrechner kann in einem Befehl kein Direktoperand angegeben werden. Deshalb werden alle Konstanten und Variablen im Speicher ablegen.
Und wie kommen wir dahin? In den seltensten Fällen wollen wir einen Rechner in der Assemblersprache programmieren. Deshalb nutzen wir Compiler, um ausgehend von einer Hochsprache (C, C++, ...) die für den Prozessor verständlichen Sprachkonstrukte zu generieren.
**Aufgabe: ** Setzen Sie folgendes Fragment eines C-Programmes in einem Assembler-Code für unseren Modellrechner um.
#include<stdlib.h>
var = -10;
if (var < 0){
var++;
digitalWrite(); // Ausgabe des Wertes von Register A auf dem Ausgabedisplay SWR Befehl
}
else
{
stop(); // Ausführen des HLT Befehls
}
{{1}}
Adresse | Speicherinhalt | Programmzeilen | Kommentar |
---|---|---|---|
00010000 |
|
LDA 10000001 |
Lade den Wert von var aus dem Speicher |
00010001 |
|
Loop JMA 00010011 |
Wenn ein negativer Wert vorliegt, springe zu AddrIf |
00010010 |
|
HLT |
Stoppe die Abarbeitung |
00010011 |
|
AddrIf ADD 10000010 |
Inkrementiere A |
00010100 |
|
SWR |
Zeige A auf dem LED Streifen an |
00011100 |
|
STA 10000001 |
Speichere A |
00011100 |
|
JMP 00010001 |
Springe zu Loop A |
{{1}}
Adresse | Speicherinhalt | Bedeutung |
---|---|---|
00010000 | ||
00010001 | ||
00010010 | ||
00010011 | ||
00010100 | ||
00011100 | ||
00011100 | ||
... | ||
10000001 | int var = -10 | |
10000010 | Konstante 1 |
{{2}}
Achtung! Unser Modellrechner hat bestenfalls didaktische Qualitäten. Vergleiche den Befehlssatz eines realen Systems (ATmega Handbuch oder Intel Instruction Set)
{{2}}
Entsprechend ändert sich auch das Ergebnis des Compiliervorganges in Abhängigkeit von der verwendeten Architektur! (vgl godbolt.org )
Die Elemente des Rechners lassen sich, wie bereits in der vergangen Vorlesung dargestellt, in 4 Kategorien einteilen - Speicher, Rechenwerk, Steuerwerk und Ein-Ausgabe.
Um Ihr Verständnis zu fördern, hat ein Kommilitone - Fabian Bär - von Ihnen eine kleine Simulation vorbereitet, die das Zusammenspiel der Komponenten illustriert. Diese ist unter
zu finden.
@startditaa
+-----------------------------------------------------+
| Speicherbezogene Komponenten |
| c88F |
| +-----------+ |
| |Memory | |
| | |<-----------------------+ |
| +-----------+ | |
| | ^ | |
| 15 V | 0 11 | 0 |
| +------+---------------+ +-----------+-----------+ |
| |Memory Buffer Register| |Memory Address Register| |
| | | | | |
| +----------------------+ +-----------------------+ |
+-----------------------------------------------------+
@endditaa
In einem Speicherzyklus muss der Prozessor zunächst eine Adresse liefern, die während des gesamten Speicherzyklus anliegen muss. Für einen Schreibzyklus betrifft dies auch das entsprechend abzulegende Datum. Bei einem Lesezyklus steht das gewünschte Wort erst mit einer gewissen Verzögerung an der Schnittstelle zur Verfügung. Da der Speicher sowohl zum Schreiben als auch zum Auslesen eines Wortes länger braucht als die Zeit, in der der Prozessor eine elementare Operation ausführen kann, sind zwei Pufferregister vorgesehen:
-
Das Speicher-Adress-Register (MAR : Memory Address Register), in das die Adresse zu Beginn des Speicherzyklus geschrieben wird. In unserem Fall ist das MAR 12 Bit breit.
-
Das Speicher-Puffer-Register (MBR : Memory Buffer Register). Bei einer Schreiboperation legt der Prozessor ein Datenwort hier ab, so dass es durch den (langsamen) Schreibvorgang im Speicher unter der Adresse abgespeichert wird, die im MAR spezifiziert ist. Beim Lesen stößt der Prozessor den Lesevorgang an und kann später das adressierte Wort aus dem MBR auslesen. Die Adresse ist bei uns 12 Bit breit. Wir können also
$2^12$ Adressen ansprechen, die jeweils 16 Bit Daten repräsentieren.
Durch MBR und MAR sind Prozessor und Speicher bezüglich ihrer Zykluszeiten weitgehend entkoppelt.
Der Datenpfad besteht aus der ALU, dem allgemeinen Register A (Akkumulator), einem Hilfsregister Z und dem Eingang-Ausgang-Schalterregister SWR. Die zweistelligen arithmetischen und logischen Befehle haben alle die Form:
< OPCODE, addr >
Sie setzen voraus, daß der eine Operand in A steht, der zweite Operand muss aus dem Speicher von Adresse addr
gelesen wird. Dabei gehen wir davon aus, dass der Operand im MBR zur Verfügung steht. Da die ALU rein kombinatorisch aufgebaut werden soll, müssen beide Operanden während der Verarbeitungszeit an den Eingängen anliegen. Das Ergebnis der Operation wird in A verfügbar gemacht. Damit das Ergebnis der Operation nicht einen der Operanden in A überschreibt, ist das Hilfsregister Z vorgesehen. Während der Befehlsausführung wird der Operand aus A nach Z transferiert, damit das Ergebnis in A gespeichert werden kann.
@startditaa
-----+ +---------------------------------+
| | Datenpfadbezogene Komponenten |
| | c88F |
| | +-----------------------------+ |
| | | Z-Register | |
| | +-----------------------------+ |
| | | | |
| | | ALU | |
| | | | |
--+ | | +-----------+-----------------+ |
| | | | ^ |
| | | v | |
--+ | | +-----------------+-----------+ |
-----+ | | A | |
| +-----------------------------+ |
-----+ | | ^ |
| | V | |
| | +-----------------+-----------+ |
| | | SWR | |
| | +-----------------------------+ |
| +---------------------------------+
|
-----+
@endditaa
Die Kontrolleinheit besteht aus:
- dem Programmzähler,
- dem Befehls- oder Instruktionsregister,
- dem RUN/HLT Flip-Flop,
- dem State-Flip-Flop,
- dem Automaten, der die der sequentiellen Kontrolle realisiert.
@startditaa
+-------------------------------------------------+
| 11 0 |
| +-------------------------------+ |
| | Program Counter | |
| +-------------------------------+ |
| |
| 15 12 11 0 |
| +------------+-------------------------------+ |
| | OPCODE | Operand | |
| +------------+-------------------------------+ |
| Instruction Register |
| |
| +-----------------+ +-------------+ |
| | Control unit | |State FF | |
| | | +-------------+ |
| | | |
| | | +-------------+ |
| | | |Run FF | |
| +-----------------+ +-------------+ |
| Kontrolleinheit bezogene Komponenten c88F |
+-------------------------------------------------+
@endditaa
Der Prozessor liest eine neue Instruktution aus dem MBR in das Instruction Register. Die Control Unit interpretiert den Operationscode und startet die Ausführung, währenddessen wird der Programmzähler bereits auf die Adresse der Instruktion gesetzt, die als nächste ausgeführt werden soll. Über den Programmzähler wird also die Sequenzierung der Instruktionen bei der Abarbeitung eines Programms gesteuert. Das State FF übernimmt die unterschiedliche Abarbeitung von Befehlen, die in einem Zyklus und zwei Zyklen umgesetzt werden können (HLT vs ADD).
Merke: Das Steuerwerk implementiert einen Automaten für die Instruktionsabarbeitung des Prozessors.
@startditaa
+-----------------------------------------------------+ +---------------------------------+
| Speicherbezogene Komponenten | | Datenpfadbezogene Komponenten |
| c88F | | c88F |
| +-----------+ | | +-----------------------------+ |
| |Memory | | | | Z-Register | |
| | |<-----------------------+ | | +-----------------------------+ |
| +-----------+ | | | | | |
| | ^ | | | | ALU | |
| 15 V | 0 11 | 0 | | | | |
| +------+---------------+ +-----------+-----------+ | | +-----------+-----------------+ |
| |Memory Buffer Register| |Memory Address Register| | | | ^ |
| | | | | | | v | |
| +----------------------+ +-----------------------+ | | +-----------------+-----------+ |
+-----------------------------------------------------+ | | A | |
| +-----------------------------+ |
+-----------------------------------------------------+ | | ^ |
| 11 0 | | V | |
| +-------------------------------+ | | +-----------------+-----------+ |
| | Program Counter | | | | SWR | |
| +-------------------------------+ | | +-----------------------------+ |
| | +---------------------------------+
| 15 12 11 0 |
| +------------+-------------------------------+ |
| | OPCODE | Operand | |
| +------------+-------------------------------+ |
| Instruction Register |
| |
| +-----------------+ +-------------+ |
| | Control unit | |State FF | |
| | | +-------------+ |
| | | |
| | | +-------------+ |
| | | |Run FF | |
| +-----------------+ +-------------+ |
| Kontrolleinheit bezogene Komponenten c88F |
+-----------------------------------------------------+
@endditaa
- Der Akkumulator (
Register A
). In dem Modellrechner ist der Akkumulator das einzige allgemeine Register. Alle arithmetischen und logischen Befehle arbeiten auf diesem Register. - Das Schalterregister (
Switch Register: SWR
) besteht aus 16 Schaltern, die z.B. an der Frontplatte eines Rechners angebracht sind. Sie können manuell gesetzt und vom Rechner abgefragt werden. - Der Programmzähler (
Programm Counter
) wird beim Unterprogrammsprung(JSR, Jump Subroutine) in den Akkumulator geladen, durch den Befehl RTS (Return from Subroutine) wird der Inhalt des Akkumulators in den Programmzähler geladen. - Das
Halt-Flip-Flop
wird durch den Befehl HLT gesetzt. Es kann nur manuell zurückgesetzt werden.
Schritt | Bedeutung |
---|---|
1. Befehl holen | Befehl entsprechend der Adressvorgabe aus dem MAR aus dem Speicher lesen und in MBR ablegen |
2. Befehl dekodieren | aktuellen Befehl aus MBR nach IR verschieben und dekodieren |
3. ggf Operanden bereitstellen | Daten entsprechend dem weiterbewegten PC (MAR) lesen und im MBR ablegen |
4. Befehl ausführen | Kontrolleinheit definiert die entsprechenden Steuerleitungen |
5. ggf Ergebnis speichern | Sichere den Inhalt von A ins MBR, Manipuliere den Inhalt des MBR |
@startuml
digraph finite_state_machine {
node [shape = point ]; qi
node[shape=Mrecord]
A[label="{1. Befehlsholphase}"];
B[label="{2. Befehlsdekodierung}"];
C[label="{3. Operandenholphase}",style=filled,color=".7 .3 1.0"];
D[label="{4. Ausführungsphase}",style=filled,color=".7 .3 1.0"];
E[label="{5. Speichern}",style=filled,color=".7 .3 1.0"];
F[label="{Fetch}"];
G[label="{Execute}",style=filled,color=".7 .3 1.0"];
qi -> A;
A -> B [ label = "" ];
B -> C [ label = "Zusätzlicher Operand \n notwendig" ];
B -> D [ label = "kein Operand \n erforderlich" ];
C -> D [ label = "" ];
D -> E [ label = "" ];
D -> A [ label = "keine Speicherung" ];
E -> A [ label = "" ];
}
@enduml
@plantUML
Zur Bearbeitung einer Instruktion, z.b. einem "ADD addr", braucht der Prozessor mehrere Schritte. Wie lässt sich aber der Daten- und Kontrollfluss zwischen den einzelnen Komponenten abbilden?
Eine Möglichkeit der Darstellung ist die Beschreibung des der Struktur des Prozessors und die Beschreibung von dessen Verhalten auf der Register-Transfer Ebene:
- Strukturbeschreibung - umfasst z.B. die vorhandenen Register, die arithmetisch/logischen Einheiten und die dazugehörige Verbindungsstruktur
- Verhaltensbeschreibung - beschreibt das Zusammenspiel der Komponenten bei der Erfüllung einer bestimmten Aufgabe. Die Zustandsdiagramme, die wir zur Beschreibung von Automaten eingeführt haben, sind eine Form der Verhaltensbeschreibung.
Die hier verwendete Register-Transfer Sprache wurde von T.C. Bartee, I.L. Lebow, I.S. Reed: Theory and Design of Digital Machines beschrieben
Grundelemente von RTL
Element | Darstellung | Bedeutung |
---|---|---|
Register | bezeichnet die Bitstellen |
|
Transfer |
|
|
Speicher | bezeichnet den Inhalt der Speicherzelle mit der Adresse "addr" | |
Bedingungen | bezeichnet den Inhalt der Speicherzelle mit d z.B. |
Beispiele
Kategorie | Beispiel | Bedeutung |
---|---|---|
Zwingende Operationen | Inhalt der Bits 4-7 werden aus Register b auf die Stellen 0-3 des Registers a übertragen. | |
Das Speicherwort an der Adresse 576 wird in Register a transferiert. | ||
Bedingte Operationen | Wenn die Bedingung R gleich Null gilt, wird der Inhalt des Registers b nach a übertragen. | |
Wenn der Takt |
||
Wenn der Takt |
-->
Einige Befehle, insbesondere die, welche keinen zweiten Operanden oder ALU-Aktivitäten benötigen, können vollständig in der IF-Phase abgearbeitet werden. Dies gilt für
Während bei
Bei den Befehlen, zu deren Ausführung die EX-Phase benötigt wird, wird in CP8 das SF in den Zustand E (Execute) gesetzt. Wird ein zweiter Operand benötigt, wird das Operandenfeld der Instruktion, das die Adresse enthält, in das MAR geladen, um den neuen Speicherzyklus zu initiieren
In der EX-Phase werden die arithmetisch/logischen Operationen, sowie Speicherbefehle LOAD/STORE und Ein/Ausgabebefehle ausgeführt.
OPCode | 0000 | 0001 | 0010 | 0011 | 0100 | 0101 | 0110 | 0111 | 1000 | 1001 | 1010 | 1011 | 1100 | 1101 | 1110 | 1111 |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
HLT |
JMA |
JMP |
JSR |
SWR |
RAL |
INP |
OUT |
NOT |
LDA |
STA |
ADD |
XOR |
AND |
IOR |
NOP |
|
CP1 | @colspan(16) |
|||||||||||||||
CP2 | ||||||||||||||||
CP3 | @colspan(16) |
|||||||||||||||
CP4 | @colspan(16) |
|||||||||||||||
CP5 | ||||||||||||||||
CP6 | ||||||||||||||||
CP7 | ||||||||||||||||
CP8 | @colspan(6) |
|||||||||||||||
|
@colspan(4) |
|||||||||||||||
|
||||||||||||||||
|
||||||||||||||||
|
||||||||||||||||
|
||||||||||||||||
|
||||||||||||||||
|
||||||||||||||||
|
@colspan(7) $ MAR \leftarrow PC, SF \leftarrow F$ |
Der folgende Automat bildet die Abarbeitung der Instruktionen HLT
, JMP
, JMA
und JSR
in einem Automaten ab.
@startditaa
Instruction Register
+---------+------------+
|OPCODE | |
+-+-+-+-+-+------------+
| | | |
V V V V
+-----------------------------------------------------------------+
| 1 aus 16 Dekodierer |
| |
+--+---+---+---+---+---+---+---+---+---+---+---+---+---+---+---+--+
| | | | | | | | | | | | | | | |
| | | | | | | | | | | | | | | |
HLT JMA JMP SRJ CSA RAL INP OUT NOT LDA STA ADD XOR IOR AND NOP
| | | | | | | | | | | | | | | |
V V V V V V V V V V V V V V V V
+-----------------------------------------------------------------+ Steuersignale:
|cF41 +---> ALU,
| | Register Kontrolle,
| +---> Speicher Kontrolle,
Clock--->| Sequentielles Schaltnetz | ...
| | ...
| | Flags:
| |<--- Signum, Zero, Overflow, Carry, ...
+-----------------------------------------------------------------+
@endditaa
Die Kontrolleinheit benötigt einen Trigger für die Abarbeitung der Instruktionen. Grundlage für den Zeitablauf einer Maschinenoperation ist der Speicherzyklus und der Prozessortakt. Im Modellrechner wird der Ablauf in Phasen zu 8 Taktintervalle unterteilt. In jedem dieser Taktintervalle kann eine Instruktion vollständig oder zur Hälfte ausgeführt werden.
@startditaa
Dauer einer Phase Fetch/Execute
RUN/HLT 3 Bit |<-------------->|
| Zähler +---+
| +---+ +---+ | | +-+ +-
+-------+ +->| | | Q+-->| +--> -+ +--------------+ CP1
| | | & +-->|T | | |
| +-+ +--->| | | | | | +-+
| | | | +---+ |---| | +--> ---+ +-------------- CP2
| -+ +- | | Q+-->| |
| | | | | | +-+
+-------+ | | | +--> ------+ +----------- CP3
Oscillator |---| | |
| Q+-->| | +-+
| | | +--> --------+ +--------- CP4
| | | |
+---+ | | +-+
| +--> ----------+ +------- CP5
| |
| | +-+
| +--> ------------+ +----- CP6
| |
| | +-+
| +--> --------------+ +--- CP7
| |
| | +-+
| +--> ----------------+ +- CP8
| |
+---+
3 zu 8 Decoder
@endditaa
Die folgende Abbildung gibt die Kontrolleinheit im schematische Aufbau wieder. Die wesentlichen Komponenten sind:
- der 8-Phasen Taktgenerator
- der Instruktionsdekoder
- die Status-Flip-Flops
- das kombinatorische Schaltnetz zu Erzeugung der Steuersignale.
Instruction Register
+---------+------------+
|OPCODE | |
+-+-+-+-+-+------------+
| | | |
V V V V
+-----------------------------------------------------------------+
| 1 aus 16 Dekodierer |
| |
Benutzer +--+---+---+---+---+---+---+---+---+---+---+---+---+---+---+---+--+
Eingaben +---+ | | | | | | | | | | | | | | | |
HLT----->| OR|<-----------------+ | | | | | | | | | | | | | | | |
RUN----+ +-+-+ | HLT JMA JMP SRJ CSA RAL INP OUT NOT LDA STA ADD XOR IOR AND NOP
| | | | | | | | | | | | | | | | | | |
V V Status FF | V V V V V V V V V V V V V V V V
+-------+ +---+ +---+ | ++----------------------------------------------------------------+ Steuersignale:
| R | H | | F | | E |<-+ +-+HLT |
+-+-----+ ++--+ +-+-+ | | |
|Run FF | ^ | +----+E' |
| | | +-------->|E |
| | +--------------+F' |
| +--------------->|F |
| | |
| +---+ |cF41 |
| +---+ +---+ | | | |
+-------+ +->| | | Q+-->| +-->|CP1 +---> ALU,
| | | & +-->|T | | | | | Register Kontrolle,
| +-+ +--->| | | | | +-->|CP2 Kombinatorisches Schaltnetz +---> Speicher Kontrolle,
| | | | +---+ |---| | | | | ...
| -+ +- | | Q+-->| +-->|CP3 | ...
| | | | | | | | Flags:
+-------+ | | | +-->|CP4 |<--- Signum, Zero, Overflow, Carry, ...
Oscillator |---| | | | |
| Q+-->| +-->|CP5 |
| | | | | |
8-Phasen | | | +-->|CP6 |
Taktgeber +---+ | | | |
3 Bit | +-->|CP7 |
Zähler | | | |
| +-->|CP8 |
| | | |
+---+ +-----------------------------------------------------------------+
3 zu 8 Decoder
Bus off
== Lesender Zugriff auf den Bus /
Bus on
== schreibender Zugriff
@startditaa
+----------------------------------+
|c42C +------->
| |
| +-------> Kontroll
| | Signale
| Kombinatorische Logik +------->
| |
| +------->
| |
| +------+
+-+-+-+-+---+----------+-----------+ |
^ ^ ^ ^ ^ ^Aktueller |
| | | | | | Zustand |
| | | | | +----+-----------+ |
| | | | | |Zustandsspeicher| |
| | | | | |cC42 | |
| | | | | | +--+ +--+ | |
| | | | | | |FF| |FF| ... | |
| | | | | | +--+ +--+ | |
| | | | | +------------+---+ |
| | | | | ^ ^ |
Opcode | | | |
Alu States | | |
| +----------+
| Neuer Zustand
|
Clock
@endditaa
{{0-1}}
Aspekt | Kombinatorische Logik |
---|---|
Grundlegende Repräsentation | Endlicher Automat |
Fortschaltung der Kontrolle | Expliziter Folgezustand |
Logische Repräsentation | Boolesche Gleichungen |
Implementierungstechnik | Gatter, Programmierbare Logikbausteine |
{{1-2}}
@startditaa
+----------------------------------+
|c8C2 +------->
| |
| +-------> Kontroll
| | Signale
| Mikroprogramm Speicher +------->
| |
| +------->
| |
| +-------+
+-+--------------------------------+ |
^ ^Aktuelle Microcode |
| |Instruction Adresse|
| +-----------------+-----------+ |
| |Adressspeicher | |
Alu States| | | |
| | +--+ +--+ +--+ | |
| |FF| |FF| |FF| ... | |
| +--+ +--+ +--+ cC42| |
+-----------------------------+ |
^ ^Folgeadresse |
| | |
| +----------+----------+ |
| | Adress Generierung | |
Clock| |cFF0 | |
| ++-+-+-+------------+-+ |
^ ^ ^ ^ ^ |
| | | | | |
| | | | | |
Opcodes +-----------+
Folgezustands
Kontrolle
@endditaa
{{1-2}}
Aspekt | Kombinatorische Logik | Mikroprogramm |
---|---|---|
Grundlegende Repräsentation | Endlicher Automat | Programm |
Fortschaltung der Kontrolle | Expliziter Folgezustand | Programmzähler |
Logische Repräsentation | Boolesche Gleichungen | Wahrheitstabelle |
Implementierungstechnik | Gatter, Programmierbare Logikbausteine | R/W-Speicher, ROM |
Realisierung am Beispiel der Implementierung eines JMA
-Befehls als Mikroprogramm
| |
+----------------------+ -+ <-----+
| MBR <- M[MAR] | | |
+----------------------+ | |
| NOP | | |
+----------------------+ |> Prolog für |
| PC <- PC + 1 | | alle |
+---------+ +----------------------+ | Mikroprogramme |
| OPCODE | <---------- | IR <- MBR | | |
+---------+ +----------------------+ -+ |
| | | |
v +----------------------+ |
+---------+ | | |
| Adress- | +----------------------+ |
| magie | ----------> |A15=0: skip next inst.| |
+---------+ +----------------------+ |
| PC<-IR{11-0} | |
+----------------------+ |
| MAR <- PC | --------------------+
+----------------------+ Rücksprung
| |
- Fortlaufende Abarbeitung der Mikroprogramminstruktionen
- Die externe Quelle der Bedingungen auszuwählen.
- Einen Indexmechanismus einzuführen, der es erlaubt, eine Adresse aus dem Adressfeld der MIP und externen Adressinformationen zu bilden (bedingte Adressfortschaltung)
Das Mikroprogrammwortes umfasst alle Steuersignale für Register, ALU, Speicher, usw., die jeweils durch ein Bit in der repräsentiert sind. Eine Steuerleitung wird aktiviert, wenn dieses Bit auf "1" gesetzt ist. Wird das Bit auf "0" gesetzt, wird die Steuerleitung deaktiviert. Der erste Teil des Mikroprogrammwortes wird entsprechend als Steuerwort bezeichnet.
@startditaa
Instruction Register
+---------+-------------------+
A_15 | OPCODE | |
| | +---------+-------------------+
v v |
+------------------+ |
+----| Adressgenerator | <-+
| | | <-------------------------------------------------------------------+
| +------------------+ |
| |
| +--------------------------------------------------------------------------------- --+ |
| | Mikroprogrammspeicher | |
| | +---------------------------------------------+------------------+-------+-------+ | |
+->| |cC42 |cFF0 |c8C2 |c8C2 | | |
| +---------------------------------------------+------------------+-------+-------+ | |
| |cC42 |cFF0 |c8C2 |c8C2 | | |
| +---------------------------------------------+------------------+-------+-------+ | |
| |cC42 |cFF0 |c8C2 |c8C2 | | |
| +---------------------------------------------+------------------+-------+-------+ | |
+------------------------------------------------------------------------------------+ |
| | | | |
21 v 0 v v v |
+---------------------------------------------+------------------+-------+-------+ |
|cC42 Mikroinstruktionsregister |cFF0 Folgeadresse |c8C2 c |c8C2 s | |
+---------------------------------------------+------------------+-------+-------+ |
Steuersignale | | |
+----------------+---------------+ |
Mikroinstruktion im Detail +------------------------+
+------+-------+-------+--------+---------+-------+-----+-----+-------+-----+-----+-------+
| init | init | .... | MBR | MBR | .... | RUN | HLT | .... | ADD | XOR | .... |
| Read | Write | | on Bus | off Bus | | | | | | | |
|cC42 | cC42 | cC42 |cC42 | cC42 |cC42 |cC42 |cC42 |cC42 |cC42 |cC42 |cC42 |
+------+-------+-------+--------+---------+-------+-----+-----+-------+-----+-----+-------+
@endditaa
Das Mikroprogrammwort enthält außer dem Steuerteil noch den Adressteil. Der Adressteil eines Mikroprogrammwortes enthält direkt die Adresse des nächsten Mikroprogrammwortes. Allerdings muss der Modellrechner auch auf Statusinformation der ALU und auf den Inhalt des OPCODE-Feldes des IR reagieren, so dass der Ablauf des Mikroprogramms nicht immer gleich ist.
Um die Sprünge zu realisieren werden dem Mikroprogrammwort neben der Folgeadresse zwei Flags beigefügt:
-
"computed next"
c
- Die Folgeadresse wird aus der Adresse im Adressfeld der MIP und dem OPCODE-Feld des$IR_{15-12}$ gebildet. Dabei wird das OPCODE-Feld auf die Adresse im Adressfeld des MIP-Wortes addiert. -
skip next on condition
s
- Berücksichtigt wird das Vorzeichenbit des Akkumulators$A_{15}=0$ . Trifft die Bedingung zu, d.h.$A_{15}=0$ , wird die nächste Instruktion übersprungen (Folgeadresse +1). Trifft die Bedingung nicht zu, wird die nächste Instruktion von der spezifizierten Folgeadresse genommen.
Und wie sieht das nun konkret aus?
{{1}}
**Frage: ** Welche Vereinfachungsmöglichkeiten sehen Sie?
-
Wie kann der Micro-Code optimiert werden? Zielkonflikt: Hardwarekosten gegen Geschwindigkeit und Flexibiltät
-
Wie kann des Micro-Wort verkürzt und der M-Speicher vekleinert werden? Zielkonflikt: Wortlänge gegen Dekodierungsaufwand und Flexibilität
-
Wie erreicht man größtmöglichen Komfort bei der Programmierung? Zielkonflikt: Komfort gegen Effizienz und Flexibilität
Horizontale Mikroprogrammierung | Vertikale Mikroprogrammierung | |
---|---|---|
Idee | Jedes Bit des Mikroinstruktionswortes steuert direkt eine Kontroll-Leitung | Mikroinstruktionswort ist in Felder aufgeteilt, die codierte Steuerinformation enthalten |
Vorteil | maximale Flexibilität, Geschwindigkeit | Kurzes Mikroinstruktionswort, kleiner Mikroprogrammspeicher , übersichtlicher Mikroprogramme |
Nachteil | sehr langes Mikroinstruktionswort, großer Mikroprogrammspeicher | Zusätzliche Dekodierungshardware, Flexibilität, Geschwindigkeit |
Ausgangspunkt der Mikroprogrammierung:
- Mächtige Maschinenbefehle unterstützen den Programmierer.
- Leichte Änderbarkeit der Maschinenbefehle ist notwendig, um die Fortentwicklung des Befehlssatzes und Spezialanwendungen zu unterstützen.
- Mikroprogramme können leichter entworfen werden als Logik.
- Mikroprogramme können komplexe Operationen effizienter bereitstellen als eine Sequenz von Maschineninstruktionen, da sie die Parallelität der Hardware ausnutzen können.
- Mikroprogramme können komplexe Operationen effizienter bereitstellen als eine Sequenz von Maschineninstruktionen, da Mikroprogrammspeicher schneller ist als Speicher für Maschinenprogramme.
- Entwerfen Sie die Implementierung einer Subtraktionsinstruktion für den Modellrechner.
- Schreiben Sie ein Assemblerprogramm für den Modellrechner, dass im Speicher die Zahlen von 0-9 ablegt und darüber eine Summe bildet.