0과 1로 숫자를 표현하는 방법
정보단위
비트(bit): 0과1을 나타내는 가장 작은 정보단위
N비트는 2^n가지 정보를 표현할 수 있다.
바이트(byte): 8bit
킬로바이트(kb) : 1000byte
메가바이트(mb): 1000kb
기가바이트(gb): 1000mb
테라바이트(tb): 1000gb
워드(word) : CPU가 한번에 처리할 수 있는 데이터 크기를 의미한다.
만약 CPU가 한번에 16비트를 처리할 수 있다면 1워드는 16비트가 되고 한번에 32비트를 처리할 수 있다면 1워드는 32비트가 되는 것이다.
이진법
:수학에서 0과 1만으로 모든 숫자를 표현하는 방법
이진법으로 표현한 수: 이진수
이진수의 음수표현
이진수의 음수 또한 0과1만으로 표현해야한다.
가장 널리 사용되는 방법으로 2의 보수를 구해 이값을 음수로 간주하는 방법이다.
2의보수: 어떤 수를 그보다 큰 2^n 에서 뺀값
'모든 0과1을 뒤지고 거기에 1을 더한 값 '
EX)1011-> 0100->0101 글므로 1011의 보수는 0101이다.
이진수만 보고 음수인지 양수인지 구분하기가 어렵기 때문에 컴퓨터 내부에서 어떤 수를 다룰 때는 이 수가 양수인지 음수인지 구분하기 위해 플래그를 사용한다. 플래그는 쉽게 말해 부가정보라는 말이다.
0과1로 문자를 표현하는 방법
문자 집합과 인코딩
문자집합: 컴퓨터가 인식하고 표현할 수 있는 문자의 모음
문자 인코딩: 컴퓨터가 문자를 0과1로 변환하여 이해하는 방법
문자 디코딩: 0과1로 이루어진 코드를 사람이 이해할 수 있는 문자로 변환하는 과정
아스키코드
아스키: 초창기 문자 집합 중 하나로 영어 알파벳과 아라비아 숫자 그리고 일부 특수 문자를 포합한다. 아스키 문자 집합에 속한 문자들은 각각7비트로 표현되는데 7비트로 표현할 수 있는 정보의 가짓수는 2^n 개로 총 128개의 문자를 표현할 수 있다.
아스키코드: 아스키 문자에 대응된 교유한 수, 아스키 코드를 이진수로 표현함으로써 아스키 문자를 0과1로 표현할 수 있다.
장점: 간단하게 인코딩 가능
단점: 한글, 특수문자 표현이 불가능하다. --> 아스키 문자집합에 속한 문자들은 7비트로 표현하기에 128개보다 많은 문자를 표현하지 못하기 때문이다.
EUC-KR
한국을 포함한 영어권 외의 나라들이 자신들의 언어를 0과1로 표현할 수 있는 고유한 문자 집합과 인코딩 방식이 필요함을 인식하고 이후 등장한 한글 인코딩 방식
한글인코딩의 두가지 방식
1. 완성형 인코딩: 초, 중, 종성의 조합으로 이루어진 완성된 하나의 글자에 고유한 코드를 부여하는 인코딩 방식.
2. 조합형 인코딩: 초성을 위한 비트열, 중성을 위한 비트열, 종성을 위한 비트열을 할다아여 그것들을 조합으로 하나의 글자 코드를 완성하는 인코딩 방식.
유니코드
:ERUC-KR보다 훨씬 다양한 한글을 포함하며 대부분의 나라의 문자 특수문자 화살표까지도 표현가능하다.
'컴퓨터구조' 카테고리의 다른 글
01. 컴퓨터 구조 시작하기 (0) | 2023.08.21 |
---|---|
0. 컴퓨터 구조 (0) | 2023.08.20 |