CS공부/컴퓨터 구조

[컴퓨터 구조] 인코딩과 디코딩, 문자 표현 방식

yepppi 2023. 6. 20. 14:36
반응형
SMALL

 

📌 인코딩

  • 문자를 0과 1로 변환하는 과정

 


📌 디코딩

  • 0과 1로 이루어진 문자 코드를 사람이 이해할 수 있는 문자로 변환하는 과정

 

 

📌 인코딩 문자 집합 종류

  • 아스키 코드
    • 영어 알파벳, 아라비아 숫자, 일부 특수 문자 포함
    • 문자를 각각 7비트로 표현
    • 총 128개의 문자 표현 가능

 

  • EUC-KR
    • 한글 인코딩 방식에는 한글 완성형 인코딩 (ex '가'→1, '나'→2 , ...) / 한글 조합형 인코딩 (초성, 중성, 종성에 각각 코드 부여) 두 가지가 있음
    • EUC-KR은 한글 완성형 인코딩 방식
    • 한글 한 글자는 2바이트 즉, 16비트 필요 → 네 자리 16진수로 표현 가능
    • 총 2350개 한글 단어 표현 가능
    • 쀍, 쀓, 믜 같은 글자는 표현 불가

 

  • CP949

 

 

📌 통일된 표준 인코딩 방식의 문자 집합

  • 유니코드
    • 한글을 포함하여 대부분 나라의 문자, 특수문자, 화살표, 이모티콘 등 표현 가능
    • 유니코드 문자에 부여된 값을 UTF-8, UTF-16, UTF-32 등으로 인코딩 가능

 

반응형
LIST

'CS공부 > 컴퓨터 구조' 카테고리의 다른 글

[컴퓨터 구조] 컴퓨터 구조 기본 지식  (0) 2023.06.19