0과 1로 숫자를 표현하는 방법

정보단위 

비트(bit): 0과1을 나타내는 가장 작은 정보단위 

N비트는 2^n가지 정보를 표현할 수 있다. 

 

바이트(byte): 8bit

킬로바이트(kb) : 1000byte

메가바이트(mb): 1000kb

기가바이트(gb): 1000mb

테라바이트(tb): 1000gb

 

워드(word) : CPU가 한번에 처리할 수 있는 데이터 크기를 의미한다. 

만약 CPU가 한번에 16비트를 처리할 수 있다면 1워드는 16비트가 되고 한번에 32비트를 처리할 수 있다면 1워드는 32비트가 되는 것이다. 

 

이진법

:수학에서 0과 1만으로 모든 숫자를 표현하는 방법 

이진법으로 표현한 수: 이진수 

 

이진수의 음수표현

이진수의 음수 또한 0과1만으로 표현해야한다. 

가장 널리 사용되는 방법으로 2의 보수를 구해 이값을 음수로 간주하는 방법이다. 

2의보수: 어떤 수를 그보다 큰 2^n 에서 뺀값

 

'모든 0과1을 뒤지고 거기에 1을 더한 값 '

EX)1011-> 0100->0101   글므로 1011의 보수는 0101이다.

 

이진수만 보고 음수인지 양수인지 구분하기가 어렵기 때문에 컴퓨터 내부에서 어떤 수를 다룰 때는 이 수가 양수인지 음수인지 구분하기 위해 플래그를 사용한다. 플래그는 쉽게 말해 부가정보라는 말이다. 

 

0과1로 문자를 표현하는 방법

문자 집합과 인코딩 

문자집합: 컴퓨터가 인식하고 표현할 수 있는 문자의 모음

문자 인코딩: 컴퓨터가 문자를 0과1로 변환하여 이해하는 방법 

문자 디코딩: 0과1로 이루어진 코드를 사람이 이해할 수 있는 문자로 변환하는 과정 

 

아스키코드

아스키: 초창기 문자 집합 중 하나로 영어 알파벳과 아라비아 숫자 그리고 일부 특수 문자를 포합한다. 아스키 문자 집합에 속한 문자들은 각각7비트로 표현되는데 7비트로 표현할 수 있는 정보의 가짓수는 2^n 개로 총 128개의 문자를 표현할 수 있다. 

아스키코드: 아스키 문자에 대응된 교유한 수, 아스키 코드를 이진수로 표현함으로써 아스키 문자를 0과1로 표현할 수 있다. 

 

장점: 간단하게 인코딩 가능 

단점: 한글, 특수문자 표현이 불가능하다. --> 아스키 문자집합에 속한 문자들은 7비트로 표현하기에 128개보다 많은 문자를 표현하지 못하기 때문이다.

 

EUC-KR

한국을 포함한 영어권 외의 나라들이 자신들의 언어를 0과1로 표현할 수 있는 고유한 문자 집합과 인코딩 방식이 필요함을 인식하고 이후 등장한 한글 인코딩 방식 

 

한글인코딩의 두가지 방식 

1. 완성형 인코딩: 초, 중, 종성의 조합으로 이루어진 완성된 하나의 글자에 고유한 코드를 부여하는 인코딩 방식. 

2. 조합형 인코딩: 초성을 위한 비트열, 중성을 위한 비트열, 종성을 위한 비트열을 할다아여 그것들을 조합으로 하나의 글자 코드를 완성하는 인코딩 방식.

 

유니코드

:ERUC-KR보다 훨씬 다양한 한글을 포함하며 대부분의 나라의 문자 특수문자 화살표까지도 표현가능하다. 

'컴퓨터구조' 카테고리의 다른 글

01. 컴퓨터 구조 시작하기  (0) 2023.08.21
0. 컴퓨터 구조  (0) 2023.08.20

+ Recent posts