안경잡이개발자

728x90
반응형

● 아날로그를 디지털로 변환

 

  아날로그를 디지털로 변환하는 과정을 서술하는 문제는 멀티미디어 혹은 컴퓨터 네트워크 등의 과목에서 단골 문제로 가장 많이 출제되고 있습니다.

 

1) 표본화(Sampling)

2) 양자화(Quantizing)

3) 부호화(Coding)

 

 

  아날로그 사운드를 디지털로 변환(ADC)하는 과정은 표본화, 양자화, 부호화 과정을 거칩니다.

  먼저 표본화는 아날로그 파형을 디지털 형태로 변환하기 위해 표본을 취하는 것을 의미합니다. 이 때 나이키스트 정리에 따르면 표본화 시 원음을 그대로 반영하기 위해서는 원음이 가지는 최고 주파수의 2배 이상으로 표본화를 해야 합니다. 따라서 음악 CD의 경우 표본화 율이 44.1KHz 정도는 유지되어야 사람의 가청 주파수를 모두 지원할 수 있습니다.

  두 번째로 양자화는 표본화된 각 점을 어느 정도의 정밀도로 표현할 것인지 정하는 것을 의미합니다. 8 bit로 양자화를 하면 값을 256 단계로 표현할 수 있지만, 정밀도를 높여서 16bit로 양자화를 하면 좀 더 세밀한 65,536 단계로 표현이 가능합니다.

  마지막으로 부호화는 표본화와 양자화를 거친 디지털 정보를 2진수로 표현하는 과정입니다. 대체적으로 사운드 파일의 원본의 용량은 크기 때문에 일반적으로 부호화 과정에서 압축하여 저장합니다. 

  디지털 사운드 파일의 크기 및 음질의 비교는 아래와 같습니다.

 - 표본화율이 11.025KHz이고 양자화 정밀도가 8bit이면서 1분의 길이를 가진 mono 음악 파일은 11,025 X 8 X 60  = 5,292,000 bit​ 정도의 크기를 가지고 있습니다. 약 650 KBytes로 정리가 가능합니다.

 - 표본화율이 22.05KHz이고 양자화 정밀도가 16bit이면서 1분의 길이를 가진 stereo 음악 파일은 약 5.25 MB의 용량을 가지게 됩니다.

 - 표본화율이 44.1KHz이고 양자화 정밀도가 16bit이면서 1분의 길이를 가진 stereo 음악 파일은 ​약 10.5MB의 용량을 가지며 흔한 음악 CD입니다.

● 사운드의 저장 방식

  기본적으로 사운드를​ 저장할 때는 용량은 낮추되 고품질을 유지하는 것이 관건이 되겠습니다. 아날로그 사운드는 기본적으로 PCM 방식으로 표본화되어 디지털 사운드로 변환됩니다. 그러나 실질적으로 PCM 방식은 용량이 크기 때문에 ADPCM 방식을 주로 사용합니다.

 1) PCM(Pulse Coded Modulation)

   PCM 방식은 '입력된 값 그대로를 기록하는 방법'을 의미합니다. 압축을 하지 않기 때문에 용량이 크며 CD 등에서 활용되는 고품질의 저장 방식입니다.

 2) ADPCM(Adaptive Differential Pulse Coded Modulation)

  국제 멀티미디어 협회(IMA)에서 제안한 방식으로 디지털화한 결과를 PCM 방식처럼 그대로 저장하는 것이 아니라, 바로 앞 신호와의 차이를 저장하는 방식입니다. 여기서 차이만 저장하는 방식DPCM 방식이라고 하는데, DPCM은 인접한 값과의 차이가 크면 비효율적이라는 단점을 가지고 있습니다. ADPCM 방식은 그에 반해 DPCM에서 인접한 값과의 차이가 크면 진폭을 나누는 단계를 크게 하고, 차이가 작으면 진폭을 나누는 단계를 작게하여 가변적으로 차이를 정밀하게 저장하는 방식입니다. 기본적으로 PCM 방법으로 기록한 것과 내용이 같으나 데이터 압축에 의한 값을 기록하므로 최대 4:1까지 압축이 가능합니다. 멀티미디어 협회에서 기본적인 알고리즘을 정의하였으나, 업체마다 다르게 구현하여 상호 호환성이 부족한 실정입니다.

​ 파일의 크기는 기본적으로 표본화 율 X 해상도 X 모드(Mono = 1, Stereo = 2) X 시간(초)로 계산이 가능합니다.

 1분 길이의 음악 CD는 44,100(Hz) X 16(bit) X 2(Stereo) X 60(초) = 84,672,000bit로서 약 10.6MB의 크기입니다.

 결과적으로 CD 한 장의 용량이 650MB이므로 그 안에는 약 10곡에서 15곡의 음악이 저장 가능합니다.

​ 아날로그 정보의 디지털화 과정을 블록 다이어그램으로 그리면 아래와 같습니다.

 

 

​  위 설명 중에서 표본화(Sampling) 과정에서 나이키스트 정리를 이용한다고 했습니다. 나이키스트 이론은 '표본화 시 원음을 그대로 반영하기 위해서는 원음이 가지는 최고 주파수의 2배 이상으로 표본화해야 한다'는 뜻을 가진 이론입니다. 사람의 경우 약 20Hz에서 20,000Hz 정도의 가청 주파수를 가지고 있기 때문에 음악 CD는 44.1KHz의 표본화율로 구성이 됩니다. 이를 수식으로 표현하면 f(s) >= 2 X f(m)입니다.

 

728x90
반응형

Comment +0