본문 바로가기

사이버보안 1학년 1학기/컴퓨터구조론

04. 데이터 단위와 코드

컴퓨터 단어=컴퓨터 워드(computer word)

컴퓨터에서 한 번에 처리하는 고정된 크기의 비트 그룹의 단위


[참고용] MS 운영체제와 커널의 비트 수

커널 기반

비트 수

MS사의 운영체제

윈도우 9.x

16

 MS-DOS, 윈도우 3.1, 95, 98, ME

 윈도우 NT

 32

 윈도우 NT, 2000

 32 / 64

 윈도우 XP 이후의 운영체제들


데이터 단위

비트 수

데이터 단위 예 

 4

 니블(nibble)

 8

 바이트(byte)

 16

 워드(word)

 32

 더블 워드(double word, dword) 16x2

 64

 쿼드러플 워드(quadruple word, qword) 16x4

 128

 악터플 워드(octuple word, oword) 또는 16x8

 더블 쿼드러플 워드(double quadruple word, dqword)


문자 세트(character set): 정보를 표현하는 문자 코드의 집합

문자 인코딩(character encoding)=코드 페이지(code page)

문자 세트에 정의된 문자들을 부호화


아스키(ASCII, american standard code for information interchange)

: 정보 교환을 위한 미국 표준 부호라는 뜻. 1980년대부터 대표적인 문자 코드

표준 아스키 코드는 7비트 인코딩을 사용한다.

0~127개 즉, 128개이다.

영문 알파벳 대소문자 52개, 숫자 10개, 특수 문자 32개, 공백 문자 1개


확장 아스키 문자 세트

문자 세트

숫자 코드

용도

 lower ASCII

(표준 아스키)

 0~127

 0~31, 127

 인쇄가 불가능한 출력 제어 문자

 32~126

 인쇄가 가능한 문자

 higher ASCII

 128~255

 표준 아스키 문자 세트에 추가

higher ASCII는 8비트 확장(extended) 문자 세트이다.

추가된 문자는 프로그램으로 변경이 가능하여 버젼별로 문자 세트가 다를 수 있다.


윈도우 문자 코드

ANSI(american national standards institute)는 미국국가표준협회의 영문 약자.

앤시 표준은 국제표준화기구(ISO)에 가입되어 있어 공통으로 채택한 규격이 많다.


유니코드(unicode, universal code, 만국공통 코드)

전 세계 언어의 문자 코드를 모두 포함하려는 컴퓨터 산업계의 국제 표준이다.

코드 범위 U+0000~FFFF인

기본 다국어 판(basic multilingual plane, BMP)에는 16진수 4자리가 사용되었다.