본문 바로가기
CS/컴퓨터 구조

[Chapter 2.3 컴퓨터 구조 및 설계] MIPS 명령어의 기계어 표현과 형식 (format)

by 베어 그릴스 2022. 7. 8.
본 정리는 CS422-컴퓨터 구조 및 설계 : 하드웨어/소프트웨어 인터페이스. David A. Patterson,존 헤네시 책을 바탕으로 하고 있음을 미리 알립니다.

 

명령어의 컴퓨터 내부 표현


컴퓨터는 2진수 만을 사용하기 때문에 앞에서 배운 레지스터, 각종 어셈블리 명령어들도 2진수로 해석되어 컴퓨터에 전달된다.

 

레지스터가 명령어에서 참조가 되기 때문에 레지스터 이름을 숫자로 매핑하는 규칙이 있어야 하는데,

 

$zero는 0번

$t0 – $t7는 8 – 15번

$t8 – $t9는 24 – 25번

$s0 – $s7는 16 – 23번

등의 매핑 규칙이 있다.

 

명령어 즉, MIPS 어셈블리어는 어떻게 해석될까?

 

우선, 하나의 명령어가 해석된 MIPS 명령어 즉, 기계어는 데이터 워드와 마찬가지로 32비트의 길이를 가진다.

 

명령어의 종류마다 이 32비트가 가지고 있는 형식들 (R format, I format)이 정해져 있다.

 

컴퓨터의 2가지 중요한 원칙


  1. 명령어는 숫자로 표현된다.
  2. 프로그램은 메모리에 기억되어 있어서 숫자처럼 읽고 쓸 수 있다.

이것이 바로 내장 프로그램의 개념이다. 

내장 프로그램의 개념

내장 프로그램 개념은 회계 처리를 하던 컴퓨터가 눈 깜짝할 사이에 작가의 원고 집필을 도와주는 컴퓨터로 변할 수 있게 한다. 

 

프로그램과 데이터를 메모리에 적재하고 컴퓨터한테 어떤 위치에서 실행할지 알려주면 이런 전환이 일어난다. 명령어를 2진수의 데이터와 똑같이 취급함으로써 컴퓨터 시스템의 메모리 하드웨어와 소프트웨어가 모두 간단해진다. 즉, 데이터 저장을 위해 개발된 메모리 기술이 프로그램 저장에도 그대로 사용되며, 컴파일러 같은 프로그램이 인간에게 편리한 형태로 작성된 코드를 컴퓨터가 이해할 수 있는 코드로 바꿀 수 있는 것도 이 특성 덕분이다.

 

즉, 명령어를 숫자처럼 취급하게 된 결과 프로그램이 이진수 파일 형태로 판매되게 되었고, 이것이 만약 기존 명령어 집합과 호환성이 있다면 다른 컴퓨터의 소프트웨어를 물려받을 수 있다는 의미를 갖는다. 이를 '이진 호환성(binary compatibility)'라고 한다. 그러나 이 때문에 다른 명령어 집합 구조가 나오기 쉽지 않아 졌다.

 

 

다음부터 명령어의 다양한 형식에 대한 설명이 이어지겠습니다.

MIPS R-format Instruction


다음부터 설명될 op코드와 funct 코드는 정해진 값으로 다음 사이트에서 확인할 수 있습니다.

 

Mips opcodes

MIPS Instruction Types Type R I J -31format (bits) -0opcode (6) rs (5) rt (5) rd (5) shamt (5) funct (6) opcode (6) rs (5) rt (5) immediate (16) opcode (6) add…

www.slideshare.net

 

 

보통 add, sub, and 등의 산술 연산 그리고, 피연산자가 두 개가 있고 목적지가 하나인 명령어에 쓰인다. 

R format 총 32비트이다.

  • op : 6bit를 차지한다. 명령어가 실행할 연산의 종류로서 연산자(opcode)라고 부른다.
  • rs  : 5bit를 차지한다. 첫 번째 근원지(source) 피연산자 레지스터. ex) add $t1 $t2 $t3 이면 피연산자인 t2
  • rt   : 5bit를 차지한다. 두 번째 근원지(source) 피연산자 레지스터. ex) add $t1 $t2 $t3 이면 피연산자인 t3
  • rd  : 5bit를 차지한다. 목적지 레지스터. 연산 결과가 기억된다. ex) add $t1 $t2 $t3 이면 목적지인 t1
  • shamt : 5bit를 차지한다. shift 연산 시 shift 양을 나타낸다. shift연산이 아닐 시에는 0으로 채워둔다.
  • funct : 6bit를 차지한다. op필드에서 연산의 종류를 표시하고 funct 필드 애 서는 그중의 한 연산을 구체적으로 저장한다.

6 + 5 + 5 + 5 + 5 + 6 = 32bit를 차지하는 것을 알 수 있다.

 

5bit인 이유는 레지스터가 총 32개이므로 어떤 레지스터인지 지정하려면 총 5bit의 공간이 필요하기 때문이다. shamt도 마찬가지로 bit가 32만큼만 나타낼 수 있기 때문에 31까지만 표현해도 충분하다

 

 

예를 들어서, add $t0, $s1, $s2의 명령어를 기계어로 표현한다면,

다음과 같이 표현될 수 있을 것이다.

 

컴퓨터는 2진수를 사용하므로 최종적으로,

000000 10001 10010 01000 00000 100000의 기계 코드를 받을 수 있을 것이다.

 

그렇다면 레지스터들이 도대체 어디에 있어서 우리가 번호로 어떤 레지스터에서 값을 사용하고 어떤 레지스터에 값을 저장하고 할 수 있는 것인가.

 

바로 Register File에서 모든 레지스터들을 관리한다.

Register File

두 개의 read port로 피연산자 레지스터 번호를 보내면 해당 레지스터의 값을 두개의 출력 port로 받아올 수 있고,

하나의 write port로 목적지 레지스터 번호를 보내면 해당 레지스터에 값을 저장하게 되는 것이다.

 

 

 

다양한 논리 연산 명령어도 R-format을 사용한다.

다양한 논리 연산

shift 연산의 경우 다음과 같다.

 

명령어

sll $t2, $s0, 8 #shift left logical $t2 = $s0 << 8 bits 
srl $t2, $s0, 8 #shift right logical $t2 = $s0 >> 8 bits

 

다음과 같이 sll 명령어가 있다고 할 때,

op코드에 0 rs에 0 rt에 so인 16 rd에 t2인 10 shamt에 4 funct에 0이 들어가게 된다.

 

shift 연산은 자릿수를 하나 올려주는 것과 같으므로 2진수에선 shift left n는 2의 n제곱과 같은 역할을 한다.

반대로 shift right는 2의 n제곱으로 나눈 것과 같은 역할을 한다.(부호 없는 수에서)

 

bit wise 논리 연산도 MIPS ISA에서 다음과 같이 표현한다.

and $t0, $t1, $t2 #$t0 = $t1 & $t2
or $t0, $t1, $t2 #$t0 = $t1 | $t2
nor $t0, $t1, $t2 #$t0 = not($t1 | $t2)

 

이제 따로 기계어를 쓰지 않아도 어느 정도 감이 잡혔을 것이다.

(각 명령어에 따른 op코드와 funct 코드는 굳이 외우지 않아도 좋다.)

 

AND 연산과 OR 연산 그리고 NOR 연산은 다양한 활용법이 있다.

 

AND의 경우 특정 비트를 제외한 나머지를 전부 0으로 만들어버릴 수 있다.

 

and $t0, $t1, $t2한 경우

 

OR의 경우, 나머지는 그대로 두고 특정 비트만 1로 만들 수도 있다.

or $t0, $t1, $t2한 경우

NOR의 경우, nor는 0과 만나면 반대가 되는 효과가 있기 때문에 NOT 명령어를 만들 수 있다.

nor는 0과 만나면 반대가 되는 효과가 있다.

 

nor $t0, $t1, $zero

 

MIPS I-format Instruction


우리는 앞서 상수 연산이 필요한 연산인 addi lw 같은 명령어들도 배웠다.

 

이때, 똑같은 R format을 사용한다면?

상수는 5bit 자리에 들어가서 0~32의 값만 나타낼 수 있게 될 것이다.

 

즉, R format과 다른 형식이 필요했고,

 

설계 원칙 4: 좋은 설계에는 적당한 절충이 필요하다.

 

설계 원칙 4에 따라 상수 표현을 위해 나온 formatI format이다.

MIPS&nbsp;I format

  • op: R format과 동일하다
  • rs : R format과 동일하다
  • rt : rd를 대신해서 목적지 레지스터의 번호가 되거나 R format과 동일한 역할을 한다.
  • constant : 말 그대로 상수가 들어가거나 lw나 sw에서 offset 값이 들어간다.

 

lw sw 명령어

lw $t0, 4($s3) #load word from memory
sw $t0, 8($s3) #store word to memory

여기서 4와 8은 offset을 뜻하는데, offset은 쉽게 생각해서 배열의 index 값이라고 생각하면 된다.

위 명령어에서 그러면 $s3에 배열의 시작 주소가 담겨 있고, 그것에 offset을 더한 것이 값이 load 되거나 store 될 목표 address가 되는 것이다.

 

lw $t0, 24($s3) 명령어로 인해 메모리에서 값이 load 되는 과정을 살펴보자.

 

우선 lw 이므로,

op코드에 35

배열의 주소가 담겨있는 변수 $s3가 rs 즉, 19

load 될 목적지 변수인 $t0가 rt 즉, 8

상수에 offset 값 24가 담기게 된다.

 

이후 24에 $s3에 담겨 있는 값을 더한 것이 목적지 address가 되고, 그곳에 담겨있는 값이 $t0에 저장되는 것이다. 

lw가 실행되는 과정

lw와 sw는 word를 가져오므로, 32bit의 값을 가져오는데 1byte 즉, 8bit만 가져오고 싶다면 이와 비슷한 lb(
load byte) sb(store byte)를 사용하면 된다.

lb $t0, 1($s3) #load byte from memory
sb $t0, 6($s3) #store byte to memory

 

상수 연산 명령어

addi $sp, $sp, 4 #$sp = $sp + 4
slti $t0, $s2, 15 #$t0 = 1 if $s2<15

동일하게 I format을 사용한다.

 

여기서 의문이 들 수도 있는데 I format에서 constant field는 16bit로 사이즈가 한정되어있는데 그보다 더 큰 상수가 필요로 하면 어떻게 해야 할까?

 

이럴 때 우리는 32bit 크기의 상수를 레지스터에 저장할 필요가 있다. 이럴 때 명령어 lui, ori 2개를 사용하여야 한다.

 

lui $t0, 1010101010101010
ori $t0, $t0, 1010101010101010

이렇게 두 가지 명령어를 수행하면,

 

$t0 상위 16bit에 lui를 통해 1010101010101010이 저장되고,

$t0와 하위 16bit에 1010101010101010이 있는 상수와 or을 진행하여 최종적으로

10101010101010101010101010101010의 32bit가 $t0에 저장되게 된다.

 

즉, 원하는 상위 16bit를 lui 하고, 원하는 하위 16bit의 상수와 ori 해주면 원하는 상수를 얻을 수 있다.

 

요약


컴퓨터는 2진수의 0101만 알기 때문에 어셈블리어도 기계어 표현식으로 바꾸어야 하고,

MIPS에선 하나의 명령어를 32bit의 opcode로 변환한다.

 

이렇게 명령어를 2진수로 바꾼 혁명 덕분에 내장 프로그램 개념이진 호환성 개념이 생겨났다

 

명령어가 기계어로 변환될 때는 설계 원칙에 따라 일정한 형식들이 존재한다.

 

명령어의 종류에 따라 형식이 정해진다.

 

4대 설계 원칙

  • 간단하게 하기 위해서는 규칙적인 것이 좋다.
    • 명령어는 고정된 사이즈의 크기(32bit)를 갖는다
    • 명령어의 형식이 복잡하지 않고 3가지로 적다
    • 처음 6bit는 무조건 opcode이다 
  • 작은 것이 더 빠르다
    • 명령어 집합은 제한된다
    • 레지스터의 개수는 32개로 제한적이다
  • 자주 생기는 일을 빠르게 하라
    • 산술 연산은 레지스터를 통해 이루어진다
    • 상수가 명령어에 포함되어 있다.
  • 좋은 설계에는 적당한 절충이 필요하다.
    • 형식을 1가지로 제한하지 않고 3가지(I, R, J)로 늘렸다