'멀티미디어' 카테고리의 글 목록

멀티미디어 +10

Loading..애니메이션의 개념을 알아보자!
2017.04.21

뷰어로 보기
Loading..압축의 원리에 대해서 알아보자! (허프만 코딩 알고리즘)
2017.04.21

뷰어로 보기
Loading..음악을 만드는 방법, MIDI란 무엇일까?
2017.04.21

뷰어로 보기
Loading..아날로그를 디지털로 바꾸는 방법 (표본화, 양자화, 부호화)
2017.04.21

뷰어로 보기
Loading..사운드(Sound)의 기본 개념 이해하기!
2017.04.21

뷰어로 보기
Loading..이미지와 그래픽의 개념을 정리해보자
2017.04.21

뷰어로 보기
Loading..이미지 압축 방식에 대해서 알아보자!
2017.04.21

뷰어로 보기
Loading..이미지의 입출력 방식 이해하기!
2017.04.21

뷰어로 보기
Loading..이미지(Image)에 대해서 알아보자!1
2017.04.21

뷰어로 보기
Loading..멀티미디어란 무엇일까?
2016.07.09

뷰어로 보기

애니메이션의 개념을 알아보자!

멀티미디어2017. 4. 21. 19:58

뷰어
댓글로
이전글
다음글

728x90

● 애니메이션의 개요

애니메이션은 기본적으로 일련의 정지된 이미지(Still Image)를 연속적으로 보여주어 그 이미지를 보는 사람으로 하여금 이미지들을 연속된 동작으로 착각하도록 합니다. 이러한 현상은 잔상효과에 의한 것으로 '잔상효과'란 이미지가 이미 사라졌음에도 불구하고 사람의 눈이나 뇌에 계속 남아 있으려는 경향을 의미합니다. 일반적으로 초당 15장 이상의 그림이 보여지면 자연스러운 움직임을 얻을 수 있습니다. 텔레비전, 영사기, 비디오 플레이어는 각각이 표시하는 초당 프레임 율이 다르지만 모두 잔상효과를 이용하고 있습니다.

애니메이션의 정의는 '생명이 없는 사물에 영혼이나 정신을 부여하는 행위'로 정의할 수 있습니다. 즉, 애니메이션은 생명을 지니지 않은 것이 작자의 의도에 따라 의인화되어 필름이나 VTR 등의 영상매체를 통하여 창조되는 기술이나 기법을 일컫습니다. 또한 애니메이션은 낱장의 그림 또는 사물의 이동을 한 프레임(Frame)씩 촬영하여 마치 살아 있는 것과 같은 효과를 보여주는 영화를 말하기도 하며 더 나아가서 시간, 운동, 빛에 대한 모든 영상언어와 영상기술을 총칭합니다. 현재 우리들이 접할 수 있는 대부분의 TV만화 시리즈, 단편 만화, 극장판 장편 만화영화 등의 애니메이션이 이 정의에 포함됩니다.

애니메이션은 컴퓨터가 등장하기 이전의 2차원을 기반으로 하는 전통적 애니메이션과 컴퓨터에 의해서 만들어지는 애니메이션 그리고 특수효과로 나눌 수 있습니다.

- 2차원 기반의 전통적인 애니메이션

플립북 애니메이션, 셀 애니메이션, 키프레이밍과 인비트윈 등이 있습니다.

- 컴퓨터 애니메이션

트위닝, 곡선을 따라 이동하는 스프라이트 애니메이션, 방향과 크기를 정해주는 벡터 애니메이션, 스크립트 애니메이션, 3차원 컴퓨터 애니메이션, 핵심 동작만을 정해주면 중간 단계를 예측해주는 키프레이밍 애니메이션, 관절끼리의 연관을 계산해서 자연스러운 역운동학 등 다양합니다.

- 특수효과

실 이미지에 애니메이션을 합성하는 로토스코핑, 형태의 변환을 의미하는 모핑, 알고리즘을 이용하는 절차적 방법, 미립자 시스템 등이 있습니다.

● 애니메이션의 종류

1) 플립북 애니메이션(Flip-Book Animation)

플립북 애니메이션은 가장 기본이 되는 애니메이션으로 프레임(Frame) 애니메이션이라고도 합니다. 애니메이션 내에 존재하는 모든 프레임을 한 장 한 장 그려나가는 것으로 어렸을 때 책의 가장 자리에 그림을 그려 빠르게 넘기면 나타나는 효과를 떠올리면 됩니다. 플립북 애니메이션은 파일 크기가 크기 때문에 인터넷과 같이 제한된 데이터 전송 환경에서는 사용하기 힘들다는 장점이 있습니다.

2) 셀 애니메이션(Cel Animation)

1913년 존 랜돌프가 개발하여 지금에 이르는 모든 전통적 애니메이션은 이 방법으로 만들어졌습니다. 셀 애니메이션의 "CEL"이란 단어는 투명한 종이를 뜻하는 Celluloid의 "CEL"을 의미합니다. 애니메이션을 만들기 위해서는 하나의 배경 CEL과 여러 장의 전경 CEL이 필요하고, 일반적으로 이러한 CEL들이 여러 개의 층을 이루어 하나의 프레임을 만들어 냅니다.

3) 스프라이트 애니메이션(Sprite-based Animation)

스프라이트는 애니메이션에서 독립적으로 움직이는 개체를 말합니다. 아케디으 게임 속에 등장하는 캐릭터들의 애니메이션이 이 항목에 속합니다. 스프라이트 애니메이션은 플립북 애니메이션과는 달리 스프라이트만을 다시 그려주면 되기 때문에 파일의 크기나 요구되는 데이터 전송 대여폭도 플립북 애니메이션보다 적습니다.

4) 벡터 애니메이션(Vector Animation)

이 방식은 스프라이트가 Bitmap이 아닌 수학적인 공식으로 이루어진 것을 제외하면 스프라이트 애니메이션과 일치합니다. 벡터 애니메이션의 또 하나의 장점은 크기에 상관 없이 깨끗하게 보여진다는 것입니다. 이러한 성질을 Scalable하다고 말합니다.

5) 키 프레이밍과 트위닝(Key-Framing and Tweening)

일반적인 만화영화 제작에서, 숙련된 애니메이터는 키 프레임(Key Frame)이라는 중요한 장면만을 그리고 그 나머지는 값싼 애니메이터를 이용해 애니메이션을 완성해 나갑니다. 트위닝은 이러한 키 프레임 사이(Between)를 채우면서 애니메이션을 만든다는 의미인 IN-BETWEENING에서 유래되었습니다. 여기서 프레임이란 '각 화면 이미지'를 뜻하며 보통 1초 동안 보여주는 화면의 수를 프레임 율(Frame Rate)라고 말합니다. 프레임 레이트가 높을수록 화질이 선명하고 부드러운 표현이 가능하지만 그만큼 용량이 커진다는 단점이 있습니다.

6) 모핑(Morphing)

모핑은 2개의 서로 다른 이미지나 3차원 모델 사이의 '변화하는 과정을 서서히 나타내는 것'을 말합니다. 모핑의 원리는 간단합니다. 처음 프레임과 마지막 프레임을 지정해 주고 나머지는 컴퓨터가 생성하도록 하는 것입니다. 이러한 과정을 인터폴레이션(Interpolation)이라고 합니다.

7) 로토스코핑(Rotoscoping)

로토스코핑은 크게 2가지 의미로 사용됩니다. 하나는 실제 영화의 한 장면에 애니메이션을 삽입하는 것이고, 다른 하나는 사진 속에 있는 특정 인물이나 사물을 투명종이 위에 그려 넣는 작업을 말합니다. 대개 로토스코핑은 전자보다는 후자를 일컫습니다.

8) 미립자 시스템(Particle System)

비, 불, 연기, 폭발 등의 자연 현상들을 시뮬레이션 하기에 좋은 컴퓨터 애니메이션을 의미합니다. Particle System에서는 분자들의 다발에 대해 그 행동과 특성을 하나하나 부여해 비디오나 영화에서 폭발 등의 특수효과에 사용합니다. 영화 트위스터는 토네이도를 시뮬레이션 하기 위해 미립자 시스템을 이용하였습니다.

● 애니메이션 기법

1) 양파껍질 효과(Onion-Skinning)

Onion-Skinning은 부드러운 동작을 만들어내기 위해 셀 애니메이션에서 사용되었던 방법을 빌려온 것으로, 양파 껍질이 투명하다는 사실에서 이같은 용어가 사용되었습니다. 셀 애니메이션에서 셀이 가지는 의미는 애니메이터들이 어느 한 프레임에 대한 작업을 진행하는 동안 그 전후 프레임들을 볼 수가 있다는 것입니다. 셀과 유사한 개념인 Onion-Skinning을 사용하게 되면, 한 눈으로 프레임의 처음부터 끝까지 볼 수 있어, 프레임이 어떤 식으로 흘러 가는지 쉽게 알아 볼 수 있다는 것입니다.

2) 도려내기 효과(Cut-Out)

Cut-Out은 셀 애니메이션에서 역시 사용했던 방식입니다. 손을 흔드는 등과 같이 캐릭터의 동작이 정해져 있을 경우에 캐릭터의 몸 전체를 다시 그리는 것보다는 손만을 다시 그리는 것이 효과적입니다. 따라서 캐릭터의 몸은 한 번만 그려서 백그라운드로 사용하고, 분리되어 있는 손과 합성하여 동작을 만들어냅니다.

3) 가감속(Ease-out/Ease-in)

실세계에서 사물들은 항상 같은 속도로 움직이는 것이 아닙니다. 예를 들어 차가 출발할 때 서서히 가속이 되고, 커브를 돌 때는 서서히 속도가 줄어듭니다. 애니메이션에서 출발이나 정지, 회전과 같이 하나의 동작에서 다른 동작으로의 이동은 전형적으로 키 프레임(Key-Frame)을 사용합니다. 한 물체가 키 프레임으로 다가가거나 멀어질 때, 점차 느려지는 것을 Ease-in, 점차 빨라지는 것을 Ease-Out이라고 말합니다.

4) 반복(Cycle)

많은 동작들은 반복적이어서 여러 개의 프레임을 하나의 Cycle이나 Loop로 만들 수 있습니다. 가장 기본적인 Cycle은 걷기 동작입니다. 한 번 Cycle을 만들면 그 Cycle을 반복하면서 무한정으로 움직이게 할 수 있습니다.

5) 찌그러짐과 늘어남(Squash and Stretch)

찌그러짐과 늘어남은 물체가 유연성이나 탄성을 갖도록 하여 고무과 같이 부드럽고 물컹거리는 느낌을 갖도록 한다는 것입니다. 따라서 물체가 멈추거나 방향을 바꿀 때 또는 딱딱한 물체에 부딪혔을 때 움직이는 방향으로 물체가 압축되어 눌릴 수 있습니다. 찌그러지거나 늘어나는 효과는 움직이는 물체가 무게가 있다는 것을 느끼게 하거나, 짓눌리고 잡아 당겨지는 동작을 강조하기 위해 사용되는 동작입니다.

6) 보조 액션과 중첩 액션(Secondary Action/Overlapping Action)

보조 액션은 주액션에 더해지는 간단한 동작을 의미합니다. 이렇게 만들어진 보조 액션을 주 액션에 더하여 애니메이션을 완성하여 나가는 것을 중첩 액션이라고 말합니다.

7) 과장(Exaggeration)

과장 역시 애니메이션에 강한 인상을 심어줄 수 있는 좋은 방법입니다. 특히, 웹에서의 애니메이션은 데이터 전송의 한계성을 가지므로 애니메이션의 크기가 작고, 따라서 경우에 따라 색깔과 동작을 과장을 통하여 이용자의 눈에 띄도록 합니다.

728x90

'멀티미디어' 카테고리의 다른 글

압축의 원리에 대해서 알아보자! (허프만 코딩 알고리즘) (0)	2017.04.21
음악을 만드는 방법, MIDI란 무엇일까? (0)	2017.04.21
아날로그를 디지털로 바꾸는 방법 (표본화, 양자화, 부호화) (0)	2017.04.21
사운드(Sound)의 기본 개념 이해하기! (0)	2017.04.21
이미지와 그래픽의 개념을 정리해보자 (0)	2017.04.21

압축의 원리에 대해서 알아보자! (허프만 코딩 알고리즘)

멀티미디어2017. 4. 21. 19:56

뷰어
댓글로
이전글
다음글

728x90

● 압축

기본적으로 압축의 원리는 공간적으로 중복 성격의 데이터가 존재한다는 '공간적 상관관계'와 영상에서 시간이 지나도 화면에 큰 차이가 없는 경우가 있다는 '시간적 상관관계'라는 특성을 바탕으로 합니다. 즉, 유사한 데이터의 반복을 압축함으로써 용량을 줄일 수 있다는 원리에 입각하는 것입니다. 압축의 종류는 손실 압축과 무손실 압축으로 나눌 수 있습니다. 먼저 손실 압축은 중복되고 필요하지 않은 정보가 손실되는 것을 허용하는 것을 말합니다. 인간의 시각으로는 감지할 수 없는 자료를 제거하는 것이 그 예시입니다. 그 다음으로 무손실 압축은 처리상에서 자료의 손실이 없으며 입출력 영상이 완전히 동일하도록 압축하는 것을 의미합니다. 의료영상, 설계도면 등에서 활용됩니다.

인간의 최소 가청 한계에 의하면 인간은 약 1KHz에서 2KHz 정도의 소리를 듣는데 수월하게 설계되어있습니다. 마스킹 효과란 '특정 주파수가 가지는 에너지가 다른 주파수의 에너지보다 훨씬 클 때 이를 마스커 주파수라고 말하며 마스커 주파수만 유독 잘 들리게 되는 효과'를 말합니다. 결과적으로 마스커 주파수를 위주로 필터링을 하면 듣기에는 비슷하지만 용량은 훨씬 줄일 수 있게 됩니다. MP3 또는 MPEG Layer 3는 이러한 마스킹 효과를 이용합니다. MP3는 오디오 데이터의 압축기술로서 MPEG-1 기능 사양 중 일부입니다. MPEG-1의 오디오 부분의 Layer 3를 MP3라는 이름으로 사용합니다. Layer 3의 경우 압축률이 10 ~ 12정도 되기 때문에 상당히 효율적입니다. 곡 전체의 정보를 담는 헤더 뒤에 데이터가 프레임이라는 단위로 저장되며 프레임의 크기는 고정되어 있어 압축률이 높은 부분에서도 쓸모 없는 용량을 차지한다는 단점을 가지고 있습니다.

압축과 관련하여 가장 유명한 두 방식이 바로 Run Length Coding 방식과 허프만 코딩(Huffman Coding) 방식입니다.

- Run Length Coding

AAAAAAABBCCCDEEEEFFFFFFG라는 텍스트가 있을 때 이것을 각각 '문자 X 반복 횟수'로 표현하는 방법입니다. 저 텍스트는 원래 24개의 문자를 가져 24바이트의 용량이지만 A7B2C3D1E4F6G1으로 표현이 가능하기 때문에 결과적으로 14바이트로 줄어들게 됩니다. 따라서 압축에 성공한 것입니다. 하지만 이러한 방식에 문제점이 많아 나중에 '전치문자'라는 것을 사용하게 됩니다. 반복되는 문자는 '전치문자 X 반복된 횟수 X 반복 문자'와 같은 방식으로 적용이 됩니다. 이러한 방식으로 위 텍스트를 다시 표현해보면 *7A*2B*3CD*4E*6FG가 됩니다. 반복되지 않는 문자는 그대로 쓰는 것입니다.

- 허프만 코딩(Huffman Coding)

대부분의 압축 프로그램에서 사용하는 방법입니다. 자주 사용되는 문자는 적은 비트로 된 코드로 변환해서 표현하고, 별로 사용되지 않는 문자는 많은 비트로 된 코드로 변환하여 표현함으로써 전체 데이터를 표현하는 데 필요한 비트의 양을 줄이는 방법입니다. 허프만 코딩에서는 압축 대상이 되는 데이터마다 최대한 효율적으로 압축될 수 있게끔 코드를 생성하고 그 체계에 따라 압축합니다. 그렇게 되려면 데이터마다 각 문자에 대한 특정 코드가 정해져야만 하는데 이 때 필요한 것이 허프만 트리입니다.

아래는 허프만 코딩에 관한 문제입니다.

< 문제 >

다음 데이터는 R, G, B, C, M, Y, K를 사용하여 나타낸 이미지입니다. 픽셀의 깊이는 16비트라고 가정했을 때 각각의 문항에 답하세요.

R	G	Y	G
B	B	R	R
C	R	K	C
K	B	G	R
C	B	C	K
G	M	B	G
C	G	G	C
B	B	G	R

1) 원본 이미지의 용량을 계산하세요.

이미지의 가로 픽셀 수는 4개, 세로 픽셀 수는 8개, 각 픽셀 당 16비트를 할당하므로 원본 이미지의 총 용량은 4 X 8 X 16 = 32 x 16 = 512 bit입니다.

2) 허프만 코딩을 했을 때 각 색상의 코드 값을 설명하세요.

데이터에서 사용되는 각 문자에 대한 출현 빈도수를 구하면 아래와 같습니다.

문자	R	G	B	C	M	Y	K
출현빈도	6	8	7	6	1	1	3

빈도수를 기준으로 내림차순으로 정렬하면 아래와 같습니다.

이후에 가장 작은 문자의 집합을 2개씩 계속해서 합치는 과정을 반복해 허프만 코드를 작성하면 아래와 같은 과정을 거치게 됩니다.

위와 같이 최종 호프만 코드가 완성되었습니다. 왼쪽의 경로는 0, 오른쪽의 경로는 1의 코드를 붙여서 코드를 정리하면 아래와 같이 표로 정리가 가능합니다.

색상	비트
G	01
B	10
R	11
C	000
K	0010
M	00110
Y	00111

3) 허프만 코딩 후 이미지의 용량을 계산하세요.

허프만 코드표에는 각각의 색상에 대한 비트 수가 붙어있습니다. 이것을 이용해 빈도수와 각각 곱해서 계산하면 다음과 같이 계산할 수 있습니다.

2 X 8 + 2 X 7 + 2 X 6 + 3 X 6 + 4 X 3 + 5 X 1 + 5 X 1 = 82 bit

4) 압축률을 계산하세요.

압축률은 ‘원시 자료 : 압축된 자료’로 계산할 수 있습니다. 이 경우에는 512bit에서 82bit로 압축이 이루어졌기 때문에 압축률은 256 : 41로서 약 6입니다.

728x90

'멀티미디어' 카테고리의 다른 글

애니메이션의 개념을 알아보자! (0)	2017.04.21
음악을 만드는 방법, MIDI란 무엇일까? (0)	2017.04.21
아날로그를 디지털로 바꾸는 방법 (표본화, 양자화, 부호화) (0)	2017.04.21
사운드(Sound)의 기본 개념 이해하기! (0)	2017.04.21
이미지와 그래픽의 개념을 정리해보자 (0)	2017.04.21

음악을 만드는 방법, MIDI란 무엇일까?

멀티미디어2017. 4. 21. 19:48

뷰어
댓글로
이전글
다음글

728x90

● MIDI에 대해서

지난 시간에는 아날로그 데이터를 디지털 데이터로 변환하는 과정에 대해서 학습하는 시간을 가졌습니다. 이번 시간에는 MIDI에 대해서 학습하는 시간을 가지도록 하겠습니다. MIDI가 나오기 이전에 초창기의 전자악기는 아날로그 방식을 사용하여 음색의 편집과 조작이 쉽지 않았기 때문에 디지털 악기가 개발되어 보급될 필요가 있었습니다. 이 때 각 제조업체의 악기마다 서로 다른 방식의 신호 체계를 가지고 있어 여러 대의 악기를 연결하기 쉽지 않았습니다. 따라서 1983년, MIDI 라는 표준 인터페이스가 개발되어 지금까지 사용되고 있습니다.

MIDI는 음을 특정 표기법에 따라 숫자나 문자로 상징적으로 표현한 파일을 의미합니다. MIDI는 장치를 컴퓨터와 연결하는 하드웨어 및 그 위에서 주고받는 메시지를 정의하는 하나의 프로토콜을 의미합니다. 파일 크기가 매우 작다는 장점이 있지만 정확한 소리 조절이 어렵다는 단점도 존재합니다.

신디사이저란 '음의 높이, 음표의 길이, 음의 강약 등에 대한정보에 따라 실제 음을 생성해주는 장치'입니다. 이러한 신디사이저는 악기의 대표적인 음만을 가지고 있습니다. 전기 신호를 합성해서 음을 생성하며 소리는 음원부에서 발생합니다. 음원부를 이용하여 연주를 하는 곳은 건반부입니다. 음을 합성하는 방법은 정현파를 이용하여 합성하는 FM 방식, 소리를 디지털 데이터로 변환하여 저장해 두었다가 사용하는 PCM 방식, 음향 악기와 전자 악기 소리를 재현하는 AI 방식으로 나누어집니다. 또한 악기의 모든 음을 가지고 있는 부분을 '샘플러(Sampler)'라고 합니다. 실제 소리를 디지털 방식으로 직접 녹음해 놓은 것을 의미합니다. 믹서(Mixer)란 여러 개의 오디오를 출력하여 하나의 출력으로 만들어 주는 것을 의미합니다. 드럼 모듈은 드럼의 소리를 담아놓은 모듈이며 미디 인터페이스 카드란 컴퓨터와 미디 모듈간의 연결을 담당하는 인터페이스 카드입니다.

MIDI의 모든 데이터 값은 Big-Endian 방식으로 저장이 되어집니다. 데이터 값의 다수가 Variable-Length 형식으로 저장이 됩니다. 따라서 원래의 데이터 1byte의 lower 7bit를 사용하며, 새로이 top bit를 1로 추가합니다. 단, LSB의 top bit는 0을 추가합니다. 최대 4 byte까지 가능합니다.

MIDI 파일은 하나의 Header Chunk와 여러 개의 Track Chunk 들로 이루어져 있습니다. Header Chunk는 하나의 곡 전체에 대한 정보들을 담고 있으며, 하나의 MIDI 파일 당 하나의 Header Chunk를 가집니다. 또한 파일의 가장 맨 앞에 위치하게 됩니다. 실제 데이터가 들어 있는 파일 형식을 설정하는 부분입니다.

MIDI 하드웨어 장치에 대한 설명은 아래와 같습니다.

1) 신디사이저(Synthesizer)

신디사이저는 '전기적인 신호를 합성하여 음을 생성하는 장치'를 의미합니다. 음원부는 소리를 발생시키고 건반부는 음원부를 이용하여 연주하는 부분입니다.

2) 샘플러(Sampler)

신디사이저는 악기의 대표 음을, 샘플러는 악기의 모든 음을 가지고 있습니다. 더 정교한 음 또는 음원에 없는 새로운 음을 만들고자 할 때 사용합니다. 실제 소리를 녹음하여 악기로 변환하거나 각종 효과음으로 활용합니다.

3) 믹서(Mixer)

여러 개의 오디오 출력을 섞어서 하나의 출력으로 생성합니다. 각 출력의 균형 등을 맞추어 주는 이퀄라이저(Equalizer)가 장착됩니다. 또한 음악의 균형을 맞추어 녹음하고 연주하는데 많이 이용됩니다.

4) MIDI 인터페이스 카드

컴퓨터와 미디 모듈 간의 다른 신호 체계를 연결하는 부분입니다.

5) 미디 전용 케이블

동축 케이블 형태로서 둥근 모양 5핀으로 구성됩니다.

6) 앰프와 스피커

출력 장치입니다.

( MIDI 작곡 프로그램으로 유명한 Cubase 강좌는 따로 블로그 내에서 진행하고 있습니다. )

http://blog.naver.com/ndb796/220679132914

728x90

'멀티미디어' 카테고리의 다른 글

애니메이션의 개념을 알아보자! (0)	2017.04.21
압축의 원리에 대해서 알아보자! (허프만 코딩 알고리즘) (0)	2017.04.21
아날로그를 디지털로 바꾸는 방법 (표본화, 양자화, 부호화) (0)	2017.04.21
사운드(Sound)의 기본 개념 이해하기! (0)	2017.04.21
이미지와 그래픽의 개념을 정리해보자 (0)	2017.04.21

아날로그를 디지털로 바꾸는 방법 (표본화, 양자화, 부호화)

멀티미디어2017. 4. 21. 19:47

뷰어
댓글로
이전글
다음글

728x90

● 아날로그를 디지털로 변환

아날로그를 디지털로 변환하는 과정을 서술하는 문제는 멀티미디어 혹은 컴퓨터 네트워크 등의 과목에서 단골 문제로 가장 많이 출제되고 있습니다.

1) 표본화(Sampling)

2) 양자화(Quantizing)

3) 부호화(Coding)

아날로그 사운드를 디지털로 변환(ADC)하는 과정은 표본화, 양자화, 부호화 과정을 거칩니다.

먼저 표본화는 아날로그 파형을 디지털 형태로 변환하기 위해 표본을 취하는 것을 의미합니다. 이 때 나이키스트 정리에 따르면 표본화 시 원음을 그대로 반영하기 위해서는 원음이 가지는 최고 주파수의 2배 이상으로 표본화를 해야 합니다. 따라서 음악 CD의 경우 표본화 율이 44.1KHz 정도는 유지되어야 사람의 가청 주파수를 모두 지원할 수 있습니다.

두 번째로 양자화는 표본화된 각 점을 어느 정도의 정밀도로 표현할 것인지 정하는 것을 의미합니다. 8 bit로 양자화를 하면 값을 256 단계로 표현할 수 있지만, 정밀도를 높여서 16bit로 양자화를 하면 좀 더 세밀한 65,536 단계로 표현이 가능합니다.

마지막으로 부호화는 표본화와 양자화를 거친 디지털 정보를 2진수로 표현하는 과정입니다. 대체적으로 사운드 파일의 원본의 용량은 크기 때문에 일반적으로 부호화 과정에서 압축하여 저장합니다.

디지털 사운드 파일의 크기 및 음질의 비교는 아래와 같습니다.

- 표본화율이 11.025KHz이고 양자화 정밀도가 8bit이면서 1분의 길이를 가진 mono 음악 파일은 11,025 X 8 X 60 = 5,292,000 bit 정도의 크기를 가지고 있습니다. 약 650 KBytes로 정리가 가능합니다.

- 표본화율이 22.05KHz이고 양자화 정밀도가 16bit이면서 1분의 길이를 가진 stereo 음악 파일은 약 5.25 MB의 용량을 가지게 됩니다.

- 표본화율이 44.1KHz이고 양자화 정밀도가 16bit이면서 1분의 길이를 가진 stereo 음악 파일은 약 10.5MB의 용량을 가지며 흔한 음악 CD입니다.

● 사운드의 저장 방식

기본적으로 사운드를 저장할 때는 용량은 낮추되 고품질을 유지하는 것이 관건이 되겠습니다. 아날로그 사운드는 기본적으로 PCM 방식으로 표본화되어 디지털 사운드로 변환됩니다. 그러나 실질적으로 PCM 방식은 용량이 크기 때문에 ADPCM 방식을 주로 사용합니다.

1) PCM(Pulse Coded Modulation)

PCM 방식은 '입력된 값 그대로를 기록하는 방법'을 의미합니다. 압축을 하지 않기 때문에 용량이 크며 CD 등에서 활용되는 고품질의 저장 방식입니다.

2) ADPCM(Adaptive Differential Pulse Coded Modulation)

국제 멀티미디어 협회(IMA)에서 제안한 방식으로 디지털화한 결과를 PCM 방식처럼 그대로 저장하는 것이 아니라, 바로 앞 신호와의 차이를 저장하는 방식입니다. 여기서 차이만 저장하는 방식은 DPCM 방식이라고 하는데, DPCM은 인접한 값과의 차이가 크면 비효율적이라는 단점을 가지고 있습니다. ADPCM 방식은 그에 반해 DPCM에서 인접한 값과의 차이가 크면 진폭을 나누는 단계를 크게 하고, 차이가 작으면 진폭을 나누는 단계를 작게하여 가변적으로 차이를 정밀하게 저장하는 방식입니다. 기본적으로 PCM 방법으로 기록한 것과 내용이 같으나 데이터 압축에 의한 값을 기록하므로 최대 4:1까지 압축이 가능합니다. 멀티미디어 협회에서 기본적인 알고리즘을 정의하였으나, 업체마다 다르게 구현하여 상호 호환성이 부족한 실정입니다.

파일의 크기는 기본적으로 표본화 율 X 해상도 X 모드(Mono = 1, Stereo = 2) X 시간(초)로 계산이 가능합니다.

1분 길이의 음악 CD는 44,100(Hz) X 16(bit) X 2(Stereo) X 60(초) = 84,672,000bit로서 약 10.6MB의 크기입니다.

결과적으로 CD 한 장의 용량이 650MB이므로 그 안에는 약 10곡에서 15곡의 음악이 저장 가능합니다.

아날로그 정보의 디지털화 과정을 블록 다이어그램으로 그리면 아래와 같습니다.

위 설명 중에서 표본화(Sampling) 과정에서 나이키스트 정리를 이용한다고 했습니다. 나이키스트 이론은 '표본화 시 원음을 그대로 반영하기 위해서는 원음이 가지는 최고 주파수의 2배 이상으로 표본화해야 한다'는 뜻을 가진 이론입니다. 사람의 경우 약 20Hz에서 20,000Hz 정도의 가청 주파수를 가지고 있기 때문에 음악 CD는 44.1KHz의 표본화율로 구성이 됩니다. 이를 수식으로 표현하면 f(s) >= 2 X f(m)입니다.

728x90

'멀티미디어' 카테고리의 다른 글

압축의 원리에 대해서 알아보자! (허프만 코딩 알고리즘) (0)	2017.04.21
음악을 만드는 방법, MIDI란 무엇일까? (0)	2017.04.21
사운드(Sound)의 기본 개념 이해하기! (0)	2017.04.21
이미지와 그래픽의 개념을 정리해보자 (0)	2017.04.21
이미지 압축 방식에 대해서 알아보자! (0)	2017.04.21

사운드(Sound)의 기본 개념 이해하기!

멀티미디어2017. 4. 21. 19:46

뷰어
댓글로
이전글
다음글

728x90

● 사운드의 개요

사운드란 '귀로 들을 수 있는 모든 정보'를 의미합니다. 음악, 음성, 음향 효과 등을 단독 혹은 혼합 사용하여 멀티미디어 환경을 구축할 수 있습니다. 또한 정보 전달 시 사운드의 장점은 다음과 같습니다. 먼저, 시각 + 청각 미디어로 정보전달 효과를 상승시킬 수 있습니다. 그리고 시각 + 청각 미디어를 혼합하여 피 전달자의 흥미를 유발할 수 있습니다.

사운드는 흔히 정보를 전달하는 주요한 수단 중 하나로서 '음성(Voice)'가 있고 단독으로 음악 감상, 또는 정보전달 시 부수적 효과를 제공하는 '음악(Music)'과 마지막으로 배경효과로 사용되어 상황을 좀 더 현실감 있게 전달하는 '음향효과(Sound Effect)'가 있습니다. 이러한 음향효과는 보통 자연적인 음향효과와 합성된 음향효과로 나누어집니다.

컴퓨터에서 이러한 사운드는 아날로그 형태의 사운드를 디지털화 시킨 '디지털 오디오(Digital Audio)' 혹은 전자 악기와 다른 기계 간의 정보를 전송하기 위한 통신 규약인 '미디(MIDI)'로 분류할 수 있습니다. 디지털 오디오를 생각해볼 때 원음에 충실하려면 많은 용량이 필요합니다. 예를 들어 음악 CD는 3분에 약 30MB가 필요합니다. 반면에 미디는 실제 소리는 없이 연주 방법과 시기에 대한 정보를 가지고 있습니다. 3분 정도의 미디 음악을 듣기 위해서 약 8KB 정도가 필요하며 좋은 MIDI 사운드 음원을 가지고 있는 것이 관건입니다.

인간의 감각기관은 누구나 알듯이 시각, 청각, 후각, 촉각, 미각입니다. 이 중에서 주요 정보전달 수단은 바로 시각과 청각입니다. 사람은 이중 채널 모델을 가지고 있으며 각 채널은 하정된 정보 처리 능력을 가지고 있습니다. 여기서 적극적인 학습은 학습 과정에서 인지 과정이 공동 작용하는 것을 수반합니다. 이를 위해서 사운드를 적절하게 활용하면 유리합니다. 학습 후 기억의 정도를 고려할 때 단순히 보거나 듣기만 하는 것에 비해서 보면서 동시에 들은 경우가 50% 정도로 훨씬 효율적으로 기억할 수 있었습니다.

● 사운드의 원리

사운드의 원리는 바로 물체의 진동입니다. 물체가 진동하면 주변의 공기에 진동으로 생성된 압력이 전달되면서 사운드가 생성됩니다. 이러한 사운드는 공명으로서 존재하며 공명의 형태를 파형(Waveform)이라고 부릅니다. 파형은 주기, 진폭, 주파수로 그 특징을 정할 수 있습니다. 주기(T)와 주파수(F)는 반비례 관계입니다. 주파수(F)는 1 / T Hz와 같기 때문입니다. 대역폭은 0 - 20Hz을 초저주파, 20 - 20KHz를 가청영역, 20KHz - 1GHz를 초음파, 마지막으로 1GHz - 10THz를 극초음파라고 나누고 있습니다. 여기서 가장 중요하게 봐야 할 부분은 20 - 20KHz 가청영역입니다.

- 푸리에 정리

푸리에 정리란 '어떤 주기적 파형도 많은 수의 정현파의 합으로 나타낼 수 있다는 수학적 정리'를 의미합니다.

푸리에 급수 : 임의의 주기함수를 직교관계에 있는 삼각함수의 합으로 나타내는 것

푸리에 변환 : 임의의 비주기함수를 시간영역에서 주파수의 영역으로 나타내는 것

결과적으로 주기적인 파형은 이산형 스펙트럼을, 비주기적 파형은 연속형 스펙트럼을 가지게 됩니다.

주파수 대역이란 '주파수 요소가 값을 가지는 범위'를 의미합니다.

주파수 대역의 크기는 BW = F(Upper) - F(Lower)입니다.

달팽이관의 바깥쪽에서 높은 소리를 듣고 안쪽에서 낮은 소리를 듣습니다.

728x90

'멀티미디어' 카테고리의 다른 글

음악을 만드는 방법, MIDI란 무엇일까? (0)	2017.04.21
아날로그를 디지털로 바꾸는 방법 (표본화, 양자화, 부호화) (0)	2017.04.21
이미지와 그래픽의 개념을 정리해보자 (0)	2017.04.21
이미지 압축 방식에 대해서 알아보자! (0)	2017.04.21
이미지의 입출력 방식 이해하기! (0)	2017.04.21

이미지와 그래픽의 개념을 정리해보자

멀티미디어2017. 4. 21. 19:45

뷰어
댓글로
이전글
다음글

728x90

● 글자를 표현하는 방식

지금까지 이미지와 그래픽의 전반적인 개념에 대해서 학습하는 시간을 가졌습니다. 이번 시간에는 그 개념들을 정리하고 마무리하는 시간을 가지겠습니다. 먼저 문자 폰트에 대해서 공부하겠습니다. 문자 폰트는 래스터 폰트(Raster Font)와 벡터 폰트(Vector Font)로 구분할 수 있습니다.

- 래스터 폰트(Raster Font)

글자를 표현하기 위해 픽셀들의 위치를 기억하여 비트맵 형식으로 표현하는 폰트입니다. 장점은 화면에 빠르게 디스플레이가 가능하다는 것이며 단점으로는 확대 시 '계단 현상'이 나타나는 것을 말할 수 있습니다. 저해상도 프린터/디스플레이 기기에서 사용이 가능합니다.

- 벡터 폰트(Vector Font)

선의 종류/좌표와 그에 따른 인수들을 기억합니다. 장점은 확대 시에도 깨끗한 글자를 유지한다는 것입니다. 단점은 계산이 필요하므로 디스플레이 시간이 상대적으로 더 많이 소요된다는 것입니다. 현재 윈도우 및 프린터는 대부분이 벡터 폰트를 사용합니다.

● 2D 그래픽

2차원 벡터 그래픽을 구성하는 기본 도형으로는 점, 선, 원, 타원, 다각형, 곡선 등이 있습니다.

- 선분 그리기

아무리 복잡한 그림이더라도 기본도형의 조합으로 구성되고, 기본 도형은 일반적으로 작은 선분으로 나누어 그립니다. 선분 생성과 도형 내부 채우기가 2D 그래픽의 가장 기본적 작업입니다. 선분 그리기는 XY 평면상에 양 끝점이 주어지고 두 점 사이의 선번에 해당하는 픽셀을 찾아내는 작업으로 이루어집니다.

- 내부 채우기

먼저 윤관석을 먼저 그리고 난 후 내부 영역을 채우는 방식인 '영역 채우기' 방식이 있습니다. 시드픽셀로부터 경계를 만날 때까지 사방으로 채우기를 진행합니다. 주로 칠하기(Painting) 프로그램에서 많이 사용됩니다. 그 다음으로는 '다각형 채우기' 방식이 있습니다. 윤곽선의 픽셀을 구하면서 동시에 채우기를 하는 방식입니다. 스캔의 라인 순서대로 윤곽 픽셀과 내부 픽셀을 찾아가면서 내부를 채웁니다. 다각형 도형의 채우기나 그리기 프로그램에서 주로 사용됩니다.

- 앤티앨리어싱(Antialiasing)

물체의 윤곽선이 사선의 경우 배경과의 접촉면은 계단 형태로 표시되어 미관상 부자연스러운 것을 앨리어스(Aliased) 되었다고 말합니다. 물체 경계면의 픽셀을 물체의 색상과 배경의 색상을 혼합해서 표현하여 경계면이 부드럽게 보이도록 하는 기법을 '앤티앨리어싱(Antialiasing)'이라고 말합니다. 앤티앨리어싱을 사용한 경우 훨씬 부드럽게 느껴집니다.

● 3D 그래픽

3차원 그래픽의 가장 큰 목적은 '실감 효과'입니다. 실세계에 존재하지 않는 물체를 입체적으로 표현이 가능합니다. 3차원 그래픽 생성 과정은 흔히 물체의 기하적인 형상을 모델링(Modeling)하고, 3차원 물체를 2차원 평면에 투영(Projection), 생성된 3차원 물체의 색상과 명암을 렌더링(Rendering)하는 것으로 이루어집니다.

- 모델링(Modeling)

3차원 좌표계로 모양을 표현하는 과정입니다. 와이어프레임 모델, 다각형 표면 모델 등이 존재하고 3차원 스캔에의한 모델링도 가능합니다. 실제 사람의 얼굴이나 물체를 스캐닝할 수 있습니다. 3차원 디지타이저, 3차원 레이저 스캐너를 이용합니다.

- 투영(Projection)

3차원 물체를 2차원 평면에 투영하는 것입니다. 평행 투영법과 원근 투영법이 존재합니다.

- 렌더링(Rendering)

그림자나 색채의 변화와 같은 3차원적인 질감을 더하여 현실감을 추가하는 과정입니다. 와이어프레임 이미지를 명암이 있는 이미지로 바꾸는데 사용합니다. 감추어진 면 제거, 쉐이딩, 그리고 텍스쳐 매핑을 모두 포함하는 개념입니다.

● 파일 포맷

- 래스터 방식의 파일 포맷

압축을 하지 않아 파일 크기가 큰 BMP, 스캐너에서 사용할 일반적인 파일 포맷으로 팩스, 의료 이미지 처리, 탁상출판 및 3D 응용 프로그램에서 사용하는 TIFF, 8bit 인덱스 컬러를 지원하는 대표적인 압축 포맷으로 일러스트레이션용 그래픽 파일의 경우에는 압축 효과가 높은 GIF가 있습니다. 또한 비손실 그래픽 파일 포맷으로 GIF의 256 칼라 제한을 극복하기 위해서 생성된 PNG가 있습니다. PNG는 대부분 GIF보다 압축율이 더 높으며 24비트 트루 컬러를 지원하여 원본의 색을 다 저장이 가능합니다. 다만 애니메이션은 지원하지 않습니다. 마지막으로 JPEG는 특별히 사진의 압축을 위해 고안된 파일 포맷으로 사람의 눈은 명암을 색상보다 더 잘 인식한다는 사실을 활용하여 압축하는 기법입니다. 손실 압축으로 유명하며 많은 컬러를 가지는 큰 이미지를 다룰 경우에는 당연히 JPEG가 가장 적합합니다.

- 벡터 그래픽의 파일 포맷

프린터에 사용되는 포스트스크립트언어를 활용하는 EPS, Windows에서 사용하는 메타파일 방식, 오피스 클립아트에 사용되는 WMF, Adobe Illustrator에서 사용되는 파일 포맷인 AI 등이 있습니다.

- 3차원 그래픽

3D Studio에서 사용된 파일 포맷인 3DS, Autodesk사에서 자사의 AutoCAD에 사용하기 위해 개발된 DXF, VRML을 위해 개발된 WRL 등이 있습니다.

● 이미지 편집

- 그리기 도구

벡터 방식을 기본으로 하며 이동 및 확대/축소가 용이합니다. 대부분의 편집/저작 도구에서 그리기 기능을 제공합니다. 어도비 일러스트레이터(Adobe Illustrator)와 Corel사의 Corel Draw 등이 있습니다.

- 칠하기 도구

픽셀 단위를 기본으로 하는 래스터 데이터를 가지고 있습니다. 그리기 도구의 데이터에 비해 데이터 사이즈가 큽니다.

- 이미지 편집도구

스캐너나 디지털 카메라 등 입력장치를 통해 얻은 사진이나 이미지에 다양한 그래픽 처리를 하기 위한 소프트웨어입니다. 대표적인 소프트웨어가 바로 어도비 포토샵(Adobe Photoshop)입니다.

● 3D 그래픽 소프트웨어

모델링 과정과 렌더린 과정을 포함하여 하나의 소프트웨어로 제공하는 것이 바로 3D 그래픽 소프트웨어입니다. 모델링은 앞서 말했듯이 3차원 물체를 만드는 과정을 의미하며 렌더링은 모델에 쉐이딩, 텍스쳐, 표면 처리 등의 작업을 수행하는 것을 의미합니다. 대표적 소프트웨어로는 3D Studio Max, MAYA 등이 있습니다.

728x90

'멀티미디어' 카테고리의 다른 글

아날로그를 디지털로 바꾸는 방법 (표본화, 양자화, 부호화) (0)	2017.04.21
사운드(Sound)의 기본 개념 이해하기! (0)	2017.04.21
이미지 압축 방식에 대해서 알아보자! (0)	2017.04.21
이미지의 입출력 방식 이해하기! (0)	2017.04.21
이미지(Image)에 대해서 알아보자! (1)	2017.04.21

이미지 압축 방식에 대해서 알아보자!

멀티미디어2017. 4. 21. 19:42

뷰어
댓글로
이전글
다음글

728x90

● 이미지 압축

이번 시간에는 이미지 압축에 대해서 소개하는 시간을 가지겠습니다. 이미지 압축이란 기존의 큰 용량의 이미지를 압축하여 누구나 쉽게 사용할 수 있도록 한다는 것에 의의를 두고 있습니다. 그 전에 이미지의 디지털화와 이미지 필터링에 대해서도 배우는 시간을 가지겠습니다. 기본적으로 아날로그 이미지는 픽셀들로 구성된 디지털 이미지로 변환을 해야만 컴퓨터에서 처리가 가능합니다. 이를 위해 표본화(Sampling)과 양자화(Quantization) 과정을 거치게 됩니다.

- 표본화(Sampling)

표본화는 이미지의 위치 정보를 디지털 데이터로서 정하는 것을 말합니다. 표본점은 픽셀로서 표현이 되기 때문에 표본화를 쉽게 말해 '이미지를 픽셀단위로 쪼개는 것'이라고 할 수 있습니다. 그 간격을 적게 할수록 고해상도이고 간격이 클수록 저해상도가 되는 것은 당연하겠습니다.

- 양자화(Quantization)

양자화 '연속적인 색상의 값을 이산적인 값으로 변환하는 것'을 의미합니다. 표본화 과정에서 표본 위치를, 양자화는 이 위치에서의 색상 값을 결정합니다. 각 화소의 밝기 또는 색을 숫자로 표현할 수 있습니다. 일반적으로 흑백 사진은 8 bit로 256 레벨, X선 이미지는 10bit로 1024 레벨로 구성합니다. 다만 양자화를 할 때 양자화 에러(Quantization)라고 하는 오류가 발생할 수 있습니다. 이는 양자화 레벨이 불충분할 때 발생하며 '계단현상'이 나타날 수 있게 됩니다.

이제 이미지 필터링에 대해서 알아보도록 하겠습니다. 이미지 필터링이란 '기본 이미지에 임의의 변환을 가하여 특수한 효과를 얻는 것'을 의미합니다. 카메라 등에서는 매우 어렵거나 불가능한 효과들이 필터링을 통해서는 쉽게 가능합니다. 특수 효과에만 그 쓰임이 국한되는 것이 아니라 필터링을 이용해 잡음이나 왜곡으로 인해 변형된 이미지를 원래의 품질로 복원시킬 수도 있습니다.

1) 윤곽선 추출 필터(Edge Detection)

이미지의 그레이 레벨이 급격하게 변하는 부분을 감지하여 표시합니다.

2) 평균값 필터(Average Filter)

이미지의 각 픽셀에서 일정한 주위의 픽셀 값의 평균치를 구하며 현재 픽셀 값을 그것으로 대체하는 필터입니다.

손으로 문지른 것처럼 흐려지는 효과가 있으며 잡음을 감소시키고 경계를 흐릿하게 할 수 있습니다.

3) 밝기 조절 필터(Brightness Filter)

이미지의 밝기 값을 변경시키고자 할 때 사용하며 픽셀 값이 작을수록 어둡고, 클수록 밝으므로 전체적으로 일정 값만을 곱하여 처리합니다.

4) 예술적 필터(Artistic Filter)

예술적인 효과를 나타낼 수 있는 다양한 필터가 개발되었습니다. 유화나 수채화 효과, 연필로 스케치한 효과, 찢어붙이기 효과, 모자이크 효과,

나이프 유화 등 각종 붓이나 물감에 따른 효과를 표현할 수 있습니다.

5) 히스토그램 평준화(Histogram Equalization)

한쪽으로 밀려있는 히스토그램을 전체적으로 넓게 분산되도록 합니다. 즉, 이미지에서 명암도에 따른 픽셀의 수를 고르게 분포시키는 기법입니다.

어두운 이미지는 전체적으로 밝아지고, 밝은 이미지는 전체적으로 어두워져서 명암차이가 쉽게 구분됩니다. 이미지의 밝고 어두운 부분이 거의

균등하게 분포되도록 할 수 있습니다.

이제 데이터 압축에 대해서 알아보도록 하겠습니다. 데이터 압축의 목적은 저장공간의 절약적인 측면뿐만 아니라 빠른 전송을 위하는 것에 있습니다. 이미지의 데이터 용량 크기 줄이는 방법은 다양합니다. 예를 들어 한 화소 당 데이터의 양을 줄이는 방법, 이미지를 구성하는 화소의 수를 줄이는 방법, 그리고 데이터를 압축하는 방법이 있습니다. 화소 당 데이터의 양을 줄이는 방법은 미묘한 농도의 화상을 표현이 어렵게 된다는 단점을 초래합니다. 그래서 자주 쓰이는 색으로만 구성된 팔레트를 사용하기도 합니다. 그리고 이미지를 구성하는 화소의 수를 줄이는 방법은 섬세한 선을 표현하기 어려워지며, 모자이크 현상이 발생할 수 있게 됩니다. 마지막으로 데이터를 압축하는 방법이 있을 수 있습니다. 이 방법은 화상의 변질을 최소화하면서 데이터 크기를 축소할 수 있습니다. 시각적인 영향이 적은 색상 영역에서의 정보량을 축소하는 JPEG 압축 방식과 이웃한 화소들이 같은 값을 가질 때 이들을 압축하는 GIF 압축 방식이 있습니다.

- GIF 압축

GIF 압축 방식은 이미지 파일 전송 시간을 줄이기 위해 개발되었습니다. GIF 압축 방식은 RLE(Run Length Encoding) 방식을 응용한 알고리즘을 채택합니다. RLE란, 값은 값이 몇 번 반복되는가를 나타냄으로써 압축하는 방식입니다. 예를 들어 ABBBBBBBBA의 경우 A1B8A1와 같은 식으로 표현하는 것입니다. GIF는 수평으로 데이터를 읽으며 압축을 수행하기 때문에, 수평으로 같은 색을 갖는 이미지의 경우 압축 효과가 더욱 큽니다. 결과적으로 GIF 압축 사진은 사진 이미지보다는 그래픽에 더 높은 압축률을 보이며 더 많이 사용된다고 할 수 있습니다.

- JPEG 압축

특별히 컬러 사진의 압축을 위하여 1992년 국제 표준으로 JPEG 알고리즘이 확정되었습니다. JPEG에는 다양한 압축 모드가 있는데, 그중 무손실(Loseless) 압축은 X-레이나 CT사진에서와 같이 픽셀 하나하나가 중요한 경우에 사용됩니다. 손실(Lossy) 압축은 JPEG에서 일반적으로 사용되는 방식입니다. 보통 24비트 컬러를 사용하며, 압축 특성으로 인해 일러스트레이션을 압축할 경우 색 번짐 현상이 나타날 수도 있습니다. JPEG2000 사양에서는 점진적인 압축, 무손실 압축 높은 압축효율, 대중 해상도 등의 특성을 포함합니다. JPEG의 압축 과정은 아래와 같습니다.

1) RGB 모델에서 YIQ 모델로 변환합니다.

인간의 시각이 색상보다는 화상의 밝기에 더 민감하다는 원리에 착안하여 Y에 대하여 더 정교하게 압축하기 위해서 RGB 모델을 행렬의 곱을 이용해서 YIQ 모델로 변환합니다.

2) YIQ의 매크로 블록화

이미지를 미리 정해진 크기의 16 X 16 픽셀영역으로 나눕니다. Y 매크로 블록은 그대로 두고 I와 Q 매크로 블록은 다시 한 픽셀씩 뛰어넘어 8 X 8 픽셀 크기로 표현합니다. 그 이유는 인간이 위에서 말했듯이 화상의 밝기(Y)에는 민감하나 색상(I와 Q)에는 덜 민감하기 때문에 서브 샘플링을 통해 표본화(Sampling)을 줄이기 위해서입니다.

3) 매크로 블록을 8 X 8 블록화

JPEG 압축은 8 X 8 픽셀 블록 단위로 나누어 압축을 수행합니다. 따라서 Y, I, Q 매크로 블록은 각각 4개, 1개, 1개의 8 X 8 픽셀 블록단위로 나누어집니다.

4) DCT 변환

DCT 변환은 2차원 평면공간의 픽셀값을 2차원의 주파수 정보로 푸리에 변환(Fourier Transform)하는 과정입니다. 이 과정을 거치면 인간의 시각에 민감하게 반응하는 부분과 그렇지 않은 부분을 구분할 수 있게 됩니다. DCT 변환을 거치면 64개의 DCT 계수를 얻게 되는데, 이 중에서 가장 처음에 얻는 값 B(0, 0) DC 계수라고 하며 8 X 8 픽셀 블록의 평균값을 나타내고 나머지 63개를 AC 계수라고 하며 DC 계수와의 차이값을 나타냅니다. 이 64개의 DCT 계수를 8 X 8 블록의 형태로 배열하는데, DC 계수는 제일 왼쪽 위에 위치합니다. 왼쪽 위가 가장 낮은 주파수의 DCT 계수가, 오른쪽 아래로 갈수록 높은 주파수의 DCT 계수가 위치하게 됩니다. 인간의 시각은 저주파수에는 매우 민감하지만 고주파수에는 민감하게 반응하지 않는 성질이 있습니다. 따라서 이미지를 압축할 때 높은 주파수대는 이미지 인식에 큰 영향을 미치지 않는 부분으로 이 부분을 더 압축하더라도 이미지의 질에는 큰 문제가 없습니다.

5) 양자화

양자화란 인간의 감각 능력으로는 구별하기 힘든 범위 내에서 DCT 계수를 정수로 나누어 반올림하는 과정입니다. 이 때 인간의 눈이 민감하게 반응하는 낮은 주파수는 작은 상수로 나누어 원래 값과 큰 차이가 없도록 하며, 높은 주파수는 원래 값과 어느 정도 차이가 나더라도 잘 인식하지 못하기 때문에 큰 수를 사용하여 나누게 됩니다. 여기서 가장 많은 데이터 압축이 일어납니다.

6) 지그재그 스캐닝

양자화를 거친 뒤 데이터에서 DC 계수에 대하여 이전 블록의 DC 계수와 차를 계산하여 그 결과를 저장합니다. 그런 뒤에 계수를 지그재그 형태로 읽어 일차원 형태로 배열합니다. 이러한 형태로 읽어들이면 낮은 주파수의 계수는 앞쪽에, 높은 주파수의 계수는 뒤쪽에 위치하게 됩니다.

7) 엔트로피 코딩

JPEG 알고리즘의 마지막 단계로 무손실 압축을 사용하여 최종 압축을 수행하는 과정입니다. 엔트로피 코딩에는 RLE 방식과 허프만 코딩의 두 가지 방법이 있는데 보통 허프만 코딩(Huffman Coding) 방식을 많이 사용합니다.

728x90

'멀티미디어' 카테고리의 다른 글

사운드(Sound)의 기본 개념 이해하기! (0)	2017.04.21
이미지와 그래픽의 개념을 정리해보자 (0)	2017.04.21
이미지의 입출력 방식 이해하기! (0)	2017.04.21
이미지(Image)에 대해서 알아보자! (1)	2017.04.21
멀티미디어란 무엇일까? (0)	2016.07.09

이미지의 입출력 방식 이해하기!

멀티미디어2017. 4. 21. 18:55

뷰어
댓글로
이전글
다음글

728x90

● 이미지 입출력

이미지는 스캐너, 디지털 카메라, 펜 입력장치, 디스플레이, 프린터 등으로 그 입출력이 가능합니다. 지금부터 하나씩 살펴보도록 하겠습니다.

- 스캐너

문서, 사진, 필름 등의 아날로그 데이터를 디지털 데이터로 변환하는 이미지 입력장치입니다. 스캐닝할 이미지에 반사되어 돌아오는 빛을 CCD(Charge Coupled Device)를 통해서 받아들여 그 빛의 양을 측정합니다. 해상도는 CCD입자의 정밀도에 비례하여 이를 "광학 해상도"라고 부릅니다. 스캐너는 센서부, 제어부, 이미지처리부, 데이터전송부로 구성됩니다. 이러한 CCD는 디지털 카메라와 비디오에 꼭 필요한 기술이며 전하를 유도하여 광하를 붙잡는 방식을 이용합니다. 전하를 가둘 수 있는 전자 우물이 있고 이를 이용해 빛의 세기 또한 추출이 가능합니다.

- 디지털 카메라

사진으로 찍은 화상을 인화과정 없이 컴퓨터에 바로 사용할 수 있도록 하는 카메라입니다. 해상도는 가로 X 세로 화소수인 픽셀의 곱으로 표현합니다. 일반적으로 200만 ~ 1200만 화소의 해상도를 가지고 있으며 전문가용의 경우에는 1500만 화소 이상을 지원하는 경우도 많습니다. 저장은 대부분 JPEG 압축 방식을 채택하며 보다 높은 화질을 위해 비압축모드인 TIFF 등도 지원합니다. 컴퓨터와 USB 포트를 이용해 접속할 수 있게 되어있는 경우가 대부분입니다. 현재는 소형 폰, 카메라 폰, PDA 모델도 대중화되어 디지털 카메라가 거의 필요 없는 시대가 왔습니다.

- 펜 입력장치

그래픽 태블릿과 스타일러스 등이 활용됩니다. 페인터(Painter)와 같은 칠하기 소프트웨어에서 직접 그림을 그릴 때 스타일러스(Stylus)와 같은 펜 입력장치를 사용합니다. 스타일러스의 압력에 의해 태블릿으로 입력된 전기신호를 입력포트를 통해 컴퓨터에 전달합니다. 좌표는 태블릿에서의 절대 좌표를 사용하도록 되어 있으며 마우스보다 섬세한 움직임과 세밀한 작업이 가능합니다.

- 디스플레이

디스플레이는 멀티미디어 영상정보를 출력하기 위해 사용됩니다. TV와 모니터가 가장 흔힌 장치이면서 과거에는 CRT(Cathode-Ray Tube)가 많이 사용되었습니다. 최근에는 LCD나 PDP그리고 차세대 디스플레이로 유기 OLED 방식을 가장 많이 사용하고 있습니다. 여기서 활성화율이라는 단어가 등장합니다. 활성화율이란 '초당 화면이 디스플레이 되는 횟수'를 의미합니다. 단위는 Hz(헤르츠)를 이용하며 활성화율이 낮으면 화면이 심하게 깜빡입니다. 일반적으로 주파수가 75Hz 이상으로 설정되어야 깜빡임 없이 화면을 볼 수 있으며 VESA의 권장 규격은 85Hz입니다.

CRT는 약 1900년 즈음에 독일의 과학자 Ferdinand Braun에 의해서 발명이 되었습니다. 텔레비전에서 1940년부터 사용이 되었고 그 작동 원리는 다음과 같습니다. 먼저 전자총(Electron Gun)에서 발사된 전자빔(Electron Beam)은 편광판 사이를 지납니다. 편광판은 여기서 전자빔의 방향을 정해줍니다. 이렇게 방향이 정해진 전자빔은 섀도우 마스크(Shadow Mask)라는 금속판을 거치게 됩니다. CRT 표면에 빔이 닿으면 빛을 발하는 형광 물질이 발라져 있는데, 섀도우 마스크는 점자빔이 특정 위치의 형광 물질에 정확히 도달하도록 돕는 역할을 합니다. 컬처 CRT는 빛의 삼원색인 적색, 녹색, 청색의 세 가지 색을 사용하여 화면을 표시합니다. 각각의 색에 대응하는 세 종류의 전자총을 가짐으로써 이를 가능하게 합니다.

LCD는 최근에 많이 사용하는 액정 디스플레이입니다. LCD의 기본 원리는 두 개의 편광 유리판 사이에 모니터의 해상도에 따른 격자모양의 셀을 만들어 액체 상태의 결정(액정 크리스탈)을 주입하여 전압의 세기에 따라서 빛을 투과시키는 방식을 사용하고 있습니다. 평상시에는 편광 필터가 빛을 차단하지만 액정에 전압을 걸면 액정이 빛의 위상을 꼬아서 빛이 통과하게 됩니다. LCD 디스플레이는 CRT와는 다르게 두께가 얇기 때문에 데스크탑뿐만 아니라 노트북이나 벽결이 TV에도 널리 사용되고 있습니다.

차세대 디스플레이로서는 OLED와 전자종이 등을 이야기할 수 있습니다. OLED는 유기발광 다이오드 디스플레이로서 반응시간이 빠르고 해상도가 높으며 선명한 색상을 표현합니다. 뿐만 아니라 전력 소모가 적어서 미래의 모니터와 TV를 대체할 것으로 기대되고 있습니다. 또한 아주 얇아서 휘어지는 디스플레이에 속하는 전자잉크, 전자종이, 두루마리 디스플레이 등은 매우 얇고 가벼우며 전력 소모가 적은 장점이 있습니다.

- 프린터

프린터는 충격 방식과 비충격 방식으로 나누어집니다. 충격(Impact) 방식은 도트 매트릭스 방식이 대표적으로서 프린터 리본에 망치가 충격을 가하여 글자나 이미지를 출력하는 방식입니다. 이러한 방식은 유지비가 적게 드는 장점이 있지만 소음이 크고 인쇄 품질이 떨어져 멀티미디어 시스템에는 부적합합니다. 반면에 비충격(Non-impact) 방식은 레이저 방식과 잉크젯 방식이 대표적입니다. 레이저 방식은 드럼에 레이저로 인쇄할 이미지에 따라 전기장을 형성하여 토너를 묻혀 종이에 인쇄하는 방식입니다. 잉크젯 방식은 노즐에서 미세한 잉크 방울을 종이에 분사하는 방식입니다. 레이저 방식 프린터의 경우 인쇄 품질이 매우 뛰어나지만 가격이 비싸고 유지비가 많이 듭니다. 다행히도 많이 사용되고 있는 잉크젯 프린터는 품질은 레이저 프린터보다 조금 떨어지지만 그래도 사용하기에 큰 무리가 없으며 가격이 저렴해서 개인 사용자가 많습니다. 특히 요즘의 컬러 잉크젯 프린터는 기술의 발전으로 인해 고품질의 인화지를 사용할 경우 사진에 가까운 품질의 인쇄를 얻을 수 있습니다. 따라서 멀티미디어에 가장 적합하다고 할 수 있습니다.

728x90

'멀티미디어' 카테고리의 다른 글

사운드(Sound)의 기본 개념 이해하기! (0)	2017.04.21
이미지와 그래픽의 개념을 정리해보자 (0)	2017.04.21
이미지 압축 방식에 대해서 알아보자! (0)	2017.04.21
이미지(Image)에 대해서 알아보자! (1)	2017.04.21
멀티미디어란 무엇일까? (0)	2016.07.09

이미지(Image)에 대해서 알아보자!

멀티미디어2017. 4. 21. 18:46

뷰어
댓글로
이전글
다음글

728x90

● 이미지와 그래픽

지난 시간에는 멀티미디어에 대한 기본적인 개념을 익히는 시간을 가졌습니다. 멀티미디어에서 가장 많이 활용되는 부분이 바로 이미지(Image)라고 할 수 있습니다. 실제로 인간이 받아들이는 정보 중에서 시각적인 정보는 약 80%로서 대부분의 정보의 유입이 눈에서 들어온다고 할 수 있죠. 단순히 글로 쓰여진 정보보다 시각적인 정보를 같이 받아들일 때 기억효과도 더욱 증가합니다. 효과적인 디자인 결과를 얻고 사용자의 요구에 부합하기 위해서는 이미지와 그래픽을 사용하는 것이 바람직합니다. 일반적으로 이미지는 컴퓨터에서 사용되는 모든 그림을 말하지만 엄밀히 말하자면 컴퓨터에 사용되는 그림들은 '이미지'와 '그래픽'으로 나누어진다고 합니다. 이미지란, 스캐너나 디지털 카메라와 같은 입력 장치를 이용하여 생성된 실제적인 그림을 의미하고 컴퓨터 내에 디지털 형태로 저장됩니다. 그래픽은 일러스트레이터(Illustrator)와 같은 컴퓨터 소프트웨어를 통하여 생성된 인위적인 그림을 지칭합니다. 이미지와 그래픽은 컴퓨터 내부에서 모두 디지털 데이터로 받아들이기 때문에 자유로운 합성이 가능합니다.

● 픽셀

픽셀(Pixel)은 Picture Element의 합성어로서 화면을 구성하는 가장 기본 단위입니다. 다른 말로 '화소'라고 하며 하나의 이미지는 픽셀의 집합으로 표현할 수 있습니다. 결과적으로 이미지는 픽셀 단위로 저장하는 비트맵(Bitmap) 방식으로 저장장치에 기록되는 것입니다. 이렇게 저장된 비트맵을 모니터에 나타낼 때 적색(Red), 녹색(Green), 청색(Blue)의 값을 배합시켜 나타낼 수 있습니다. 각 픽셀이 가질 수 있는 색의 종류는 각 픽셀에 몇 비트를 할당하느냐에 따라 달려 있습니다. 이 때 할당된 비트의 수(Depth)를 색상의 깊이(Depth of Color)라고 말하며 비트의 수가 많을 수록 더 많은 색을 표현할 수 있습니다. 예를 들어 8비트의 경우에는 256가지 색상을 가질 수 있습니다. 16비트를 사용하는 경우 65,536가지 색을 표현할 수 있고 이것을 '하이컬러(R:G:B = 5:5:5)'라고 말합니다. 24비트를 사용하는 경우는 16,777,216가지 색을 표현할 수 있고 '트루컬러(R:G:B = 8:8:8)'라고 말합니다. 32비트를 사용하는 경우에 16,777,216 + 8비트 알파 채널을 사용하게 되며 트루컬러 + 알파 채널의 형태로 사용됩니다. 사실 GIF에서 사용하고 있는 8비트 컬러는 적절히 필요한 색을 응용한다면 거의 원본과 흡사한 화질을 보일 수 있습니다.

● 해상도(Resolution)

해상도는 '단위 길이당 표시할 수 있는 픽셀의 수'라고 정의됩니다. 단위 길이로는 인치가 많이 사용되며 이 때의 해상도 단위는 dpi(dot per inch)가 됩니다. 해상도가 높을 수록 흔히 말하는 화질이 좋은 이미지를 얻게 됩니다. 레이저 프린터는 300dpi 이상의 해상도를 가지며 모니터는 85~120dpi 정도의 해상도를 가집니다. 해상도의 종류는 2가지가 있는데 먼저 출력단위가 단위 면적에 표현할 수 있는 픽셀 수를 말하는 '장치 해상도(Device Resolution)'와 장치와는 무관하게 이미지 자체의 해상도인 '이미지 해상도(Image Resolution)'로 나누어집니다. 4인치 길이의 사진의 경우 보통 1000dpi 정도의 해상도를 가지며 이를 스캐너로 입력하면 스캐너 성능에 따라서 약 500dpi 정도의 해상도를 가지는 이미지로 전환되는 것입니다. 또한 프린터로 이미지를 출력할 때 이미지 자체의 해상도보다 같거나 높은 해상도를 선택해서 출력해야 화질의 감소 없이 사진을 얻을 수 있습니다.

● 래스터(Raster)/벡터(Vector) 그래픽

그래픽을 표시하는 방법으로는 픽셀 단위로 표현하는 래스터(Raster) 방식과 기하적인 객체들로 표시하는 벡터(Vector) 방식이 있습니다. 래스터 그래픽은 픽셀 단위로 저장하는 방식이기 때문에 당연히 파일의 크기는 해상도와 비례합니다. 또한 확대할 때 화면이 깨지는 '계단현상'이 존재합니다. 흔히 말하는 이미지 또한 래스터 그래픽과 같이 픽셀 단위입니다. 픽셀 단위로 구성하기 때문에 마찬가지로 래스터 그래픽 방식과 동일하게 '계단현상'이라는 단점이 존재합니다. 참고로 여기서 말하는 래스터의 정의는 '한 줄에서 연속된 픽셀들의 집합'입니다. 래스터 방식의 장치의 경우 모든 픽셀의 위치 정보를 기억 장소에 대응시켜 표현한 다음에 기억 장소에 저장된 정보를 순차적으로 읽어 가면서 지정된 값에 따라 출력 장치의 픽셀 모습을 결정하기 때문입니다. 반면에 벡터 그래픽은 기하적인 객체들을 표현하는 그래픽 함수들로 표현되어집니다. 일반적으로 파일의 크기가 래스터 그래픽 방식에 비해서 작고 기하적 객체로 표현되기 때문에 화면을 확대하더라도 화질의 저하가 발생하지 않습니다. 뿐만 아니라 특성상 일러스트레이션(Illustratoin)에 적합한 방식입니다.

● 색의 3 속성

색의 3 속성으로는 색상, 명도, 채도가 있습니다. 이들을 3차원 공간의 각각의 축으로 형성시킨 것이 바로 색 공간입니다. 컬러 디자인이나 컬러 공학 등의 학문 또는 산업분야에서 컬러를 다루는 데 있어서 기본적인 부분입니다.

- 색상(Hue) : 구분 되는 색

- 명도(Lightness) : 색의 어둡고 밝음

- 채도(Saturation) : 색들의 깨끗한 정도

참고로 휘도(Luminance)는 '특정 방향에 대한 광밀도'를 의미합니다. 일정 면적을 통과하여 일정 입체각으로 들어오는 빛의 양을 의미합니다.

● 컬러 모델

컬러 모델이란 '어떤 특정 상황에서 컬러의 특징을 설명하기 위한 방법'입니다. 컬러 모델은 다양한데 가장 많이 사용되는 것이 RGB 모델, CMY 모델, HSV 모델입니다.

- RGB(Red, Green, Blue) 모델

RGB 모델은 빛의 삼원색으로 불리는 적색(Red), 녹색(Green), 청색(Blue)이 기본이 되는 컬러 모델입니다. 색 공간에서 원점의 색상은 검은색이며, 원점에서 가장 먼 곳의 꼭짓점은 흰색입니다. 검은 색의 경우는 3가지 기본 색상이 전혀 더해지지 않은 경우이고, 흰색의 경우는 3가지 기본 색상이 모두 최대의 값으로 더해진 경우입니다. 흰색부터 검은색까지 연결되는 직선상에 있는 컬러는 회색이 됩니다. 컬러는 기본 색상들을 더하여 혼합하며, 이 모델은 세 가지 색으을 더하여 색을 만들어내기 때문에 '가산 모델(Additive Model)'이라고 불리며, 빛의 성질을 이용한 특성 때문에 CRT 모니터 등 빛으로 컬러를 표현하는 곳에서 많이 사용됩니다.

- CMY(Cyan, Magenta, Yellow) 모델

CMY 모델은 빛의 반사에 의해 발생하는 2차 색상들, 청록색(Cyan), 심홍색(Magenta), 노란색(Yellow)을 기본으로 하는 컬러모델입니다. CMY 모델에서 컬러를 표현하는 방식은 RGB 모델과는 정반대입니다. 예를 들어 백광(White Light Source)이 하늘색 물체에 비칠 때 물체는 하늘색을 반사하고, 이 하늘색이 우리 눈에 들어와서 우리는 하늘색을 인지합니다. 여기서 하늘색은 백광에서 빨간색을 뺀 색이 됩니다. 이렇게 하나의 색에서 다른 색을 제거함으로써 다른 색상을 생성하는 원리가 바로 '감산 모델(Subtractive Model)'입니다. CMY 모델과 RGB 모델의 관계는 아래와 같이 표현이 가능합니다.

[ C ] = [ W ] - [ R ]

[ M ] = [ W ] - [ G ]

[ Y ] = [ W ] - [ B ]

CMY 모델에서 색상을 결정하는 이러한 방법들은 물감이나 잉크 등의 성질을 이용하는 특성이기 때문에 프린터에서 자주 활용됩니다. 하지만 실제로 활용할 때는 CMY 모델보다 CMYK 모델을 더 많이 사용합니다. K는 Kappa의 약자로서 검은색을 의미합니다. 검은 글씨를 쓸 때 항상 CMY를 모두 합쳐서 검은색을 쓰는 것 보다는 따로 검은색 잉크를 사용하는 것이 경제적으로 효율적이기 때문에 검은색 잉크를 따로 사용하고 있습니다.

- HSV(Hue, Saturation, Value) 모델

HSV 모델은 다른 말로 HSB(Hue, Saturation, Brightness) 모델이라고도 말합니다. HSV 모델은 인간의 시각 모델과 흡사한 컬러 모델로서, 인간의 직관적인 시각에 기초를 두고 있습니다. RGB 모델에서 농도 레벨에 의해 규정된 색을 색상(Hue), 명도(Brightness), 채도(Saturation)의 세 가지 속성으로 변화해서 사용하는 방식입니다. 색상 좌표계는 RGB와는 다르게 육각뿔 또는 원뿔 모양의 좌표 시스템을 사용하고 있습니다. 세로축은 명도를 나타내며, 위쪽은 흰색, 아래쪽은 검은색을 나타냅니다. 축에 가까울 수록 흰색에 의해 희석된 색입니다.

여기서 유의할 점은 잉크나 그림 물감같은 물감염료는 색을 차감하는 시스템을 근본으로 한다는 것입니다. 감가 색상은 청록, 보라, 노랑색 주색상을 가지고 있습니다. 부가색상은 색을 겹치면 백색이 되지만, 감가 색사은 흑색이 됩니다. 그리고 부가 색상에 비해 감가 색상은 조합할 수 있는 색의 양이 더 적다는 단점을 가지고 있습니다. 마지막으로 RGB, CMY, HSV 모델은 서로 변환이 가능하다는 것을 이해하시면 됩니다.

● 인덱스 컬러(Indexed Color)

인덱스 컬러는 8비트 컬러로 구성됩니다. 0부터 255까지의 숫자로 인덱스 번호가 붙여지고, 번호마다 각각의 색상들을 가지는 색상 보기표(CLUT : Color Look-Up Table)라는 기억장소에 저장됩니다. 화면상의 한 점은 이에 대응되는 메모리 영역의 주소를 가지고 있으며 이 메모리 영역에는 그 점이 나타낼 색상의 RGB 값이 기억되어 있습니다. 이런 식으로 색상을 표시하는 방식을 인덱스 컬러(Indexed Color)라고 말합니다. 즉, 쉽게 말해 각각의 256개의 기본 색상에 하나씩의 RGB(24비트)를 부과해 그 색상들만을 가지고 이용할 수 있게 해주는 것입니다. 아래를 보시면 쉽게 이해할 수 있습니다.

보통 인덱스 컬러를 사용할 때 화면에 표시할 256가지 색상은 미리 정의되어 있기도 하고 사용자가 임의로 정의할 수도 있습니다. 그리고 가장 많이 이러한 형태가 사용되는 때는 '사용할 수 있는 색상의 수가 제한된 컴퓨터 시스템을 사용할 때'라고 할 수 있습니다. 또한 위 사진에서 왼쪽과 같은 모습을 흔히 볼 수 있는데 이러한 보기표를 '색상 보기표(CLUT)'라고 한다는 것을 기억해놓으면 좋습니다. 다른 말로는 '팔레트'라고 정의합니다.

728x90

'멀티미디어' 카테고리의 다른 글

사운드(Sound)의 기본 개념 이해하기! (0)	2017.04.21
이미지와 그래픽의 개념을 정리해보자 (0)	2017.04.21
이미지 압축 방식에 대해서 알아보자! (0)	2017.04.21
이미지의 입출력 방식 이해하기! (0)	2017.04.21
멀티미디어란 무엇일까? (0)	2016.07.09

멀티미디어란 무엇일까?

멀티미디어2016. 7. 9. 00:10

뷰어
댓글로
이전글
다음글

728x90

멀티미디어란 '두 가지 종류 이상의 정보가 동시에 제공되는 것'을 의미합니다. 즉, 멀티 미디어란 다수(Multiple)와 매체(Media)의 합성어라고 할 수 있습니다. 따라서 멀티미디어란 과거 텍스트 기반의 컴퓨터 데이터를 벗어나 소리, 음악, 동영상과 같은 여러 형태의 정보를 컴퓨터를 이용해서 생성, 처리, 통합, 제어 및 표현하는 개념을 담고 있습니다.

방금 멀티미디어가 '정보가 동시에 제공'되는 형태를 가진다고 하였습니다. 그렇다면 여기서 말하는 정보란 무엇인지 생각해봅시다. 먼저, 자료(Data)는 '지식을 얻는 데 필요한 원재료'로서 '사실 그 자체'를 의미합니다. 흔히 급여 정보, 주문량 등의 사실 자체를 말할 때 사용됩니다. 따라서 자료 그 자체로는 의미가 없습니다. 정보(Information)는 그러한 '자료에 의미를 부여해 개인이나 조직이 의사결정을 할 때 쓸모가 있도록 처리된 데이터'를 의미합니다. 지식(Knowledge)은 '다양한 종류의 정보가 모여 특정 목적에 부합하도록 일반화된 정보'를 의미합니다. 실제로 자료가 정보로 전환되는 과정에서 활용됩니다. 쉽게 말해서 과학적 지식으로 대변되는 것이 바로 이 지식입니다. 이러한 지식에서 한 단계 더 올라가 실제로 삶의 질을 향상시켜주는 것이 지혜(Wisdom)라는 견해도 있습니다.

멀티미디어라는 단어가 쓰이기 시작한 것이 정보화 시대가 도래한 것과 일맥상통합니다. 정보화 초기에는 자료처리, EDP 등의 용어로 컴퓨터 정보기술의 활용을 뜻할 때 '정보화'라는 뜻을 사용했습니다. 현대에는 정보화라는 용어와 함께 디지털시대(Digital Age) 이라는 말 처럼 '지식'이나 '디지털'이라는 용어가 많이 등장하게 되었죠. 따라서 현재에는 '정보화'라는 단어의 뜻은 다양하게 해석이 되고 있으면서 '탈공업화 사회', '제3의 물결', '지구촌', '국경없는 사회' 등과 똑같은 의미로 쓰이고 있다고 봐도 무방합니다.

멀티미디어는 말했듯이 '미디어'가 많이 있다는 뜻입니다. '미디어(Media)'는 다른 말로 매체라고도 하며 인간 상호간에 정보, 지식, 감정, 의사 등을 전달하는 수단을 의미하는 포괄적인 단어입니다. 미디어의 원래 어원에서 알 수 있듯이 상대방에게 지식이나 정보를 알려 줌으로써 서로 나눠 가진다는 뜻을 포함합니다. 전통적인 미디어는 신문이나 방송 등을 의미하며 일방향적입니다. 즉, 사용자간의 소통이 없다는 것이죠. 그러한 올드 미디어를 거쳐 '온라인 미디어'에서는 이메일, 인터넷 배너 등이 해당됩니다. 현재 자주 쓰이고 있는 '소셜 미디어'에는 블로그, SNS 등이 포함됩니다. 인간적인 특성이 많이 반영되고 있다고 할 수 있죠. 지금 제가 블로그에 글을 쓰면 댓글이나 쪽지로 소통이 가능한 것이 그 예시입니다.

미디어(Media, 매체)의 종류로는 지각 매체, 표현 매체, 프레젠테이션 매체, 저장 매체, 전송 매체 등이 있습니다. 이중에서 멀티미디어라고 한다면 주로 '표현 매체(Representation Medium)'을 말하는 경우가 대부분입니다. 문자, 소리, 이미지, 동영상 등이 이 '표현 매체'에 포함되는데 사실상 우리에게 필요한 대부분이 여기에 포함됩니다.

미디어가 하나만 쓰인다면 '멀티미디어'가 아닌 '단일미디어'라고 불립니다. 그렇다면 TV는 '멀티미디어'라고 할 수 있을까요? 왜냐하면 TV는 소리, 영상 및 문자 등의 정보를 복합적으로 시청자에게 보내주기 때문에 멀티미디어라고 생각할 수 있기 때문입니다. 하지만 TV는 일반적인 의미의 멀티미디어가 아닙니다. 왜냐하면 시청자는 TV 프로그램을 일방적으로 받아보기만 하기 때문입니다. 시청자가 원하는 정보를 선택하여 원하는 형태로 받을 수 있어야 '상호대화식'이라고할 수 있으며 그렇게 되었을 때 '멀티미디어'가 될 수 있는 조건 하나가 충족됩니다. 다만 웹TV나 IPTV 및 스마트 TV에서와 같이 이용자가 원하는 프로그램을 선택하거나 추가적인 정보를 검색하여 디스플레이 하는 것과 같은 상호대화식 기능이 존재한다면 멀티미디어라고 당당히 부를 수 있게 되겠습니다. 또한 디지털 데이터를 이용해 송수신이 이루어져야 합니다.

멀티미디어의 조건을 구체적으로 확인해봅시다.

1. 멀티미디어는 '상호대화식'입니다. -> 사용자가 정보의 제어가 가능합니다.

2. 데이터는 디지털 형태로 생성되고, 저장되고, 처리되어 표현됩니다.

3. 다수의 미디어 정보를 동시에 포함합니다. (최소 2개 이상입니다.)

4. 컴퓨터를 이용해서 획득되고, 저장되고 처리되어 표현됩니다.

일반적으로 위의 네 가지 조건을 충족시킬 때 비로소 멀티미디어라고 할 수 있게 됩니다. 그렇다면 멀티미디어의 특성은 어떤지 확인해봅시다. 멀티미디어는 말했듯이 (연속적, 실제적) - 사운드, 동영상 (비연속적, 실제적) - 이미지 (연속적, 가상적) - 애니메이션 (비연속적, 가상적) - 텍스트, 그래픽으로 나누어진다고 했습니다. 이렇게 다양한 구성요소가 있으므로 멀티미디어의 특성도 아주 단순하지만은 않습니다. 기본적으로 멀티미디어를 저장한다는 것은 나중에 다시 이러한 멀티미디어 정보를 꺼내보기 위해서입니다. 따라서 정보를 효과적으로 꺼낼 수 있도록 그래픽 사용자 인터페이스 기법을 제공하도록 되어있습니다. 그래픽 사용자 인터페이스(GUI)는 크롬 등을 예시로 들 수 있습니다. 또한 HCI(인간-컴퓨터 상호작용) 기술을 활용해서 GUI 외에도 효과적인 멀티미디어입력, 처리, 제어 기능을 제공합니다. 사실상 GUI는 멀티미디어 정보 검색 뿐만 아니라 안 쓰이는 곳이 없을 정도로 다양하게 쓰이고 있죠. 또한 데이터의 크기가 방대해지기 때문에 반드시 디지털화해서 컴퓨터에 저장하게 됩니다. 원래 매체가 음악, 사진의 형태로 아날로그 형태라고 할지라도 이들이 멀티미디어 형태로 존재하기 위해서는 내부적으로 디지털 정보로 변환되어야만 합니다. 따라서 변환 기술 자체도 정말 중요합니다. 또한 앞서 말했듯이 상호작용성이 필요하고 그와 더불어 네트워크를 이용해 정보를 공유할 수 있어야 합니다.

정리하면, 멀티미디어의 특징은 아래와 같습니다.

1. 멀티미디어는 정보 검색을 위해 GUI 형태의 인터페이스를 제공합니다.

2. 멀티미디어 정보의 입력, 처리, 제어를 위한 다양한 HCI(인간-컴퓨터 인터페이스) 기술이 활용됩니다.

3. 상호 작용성을 가지고 있습니다.

4. 멀티미디어 데이터의 디지털화가 이루어집니다.

5. 네트워크를 통한 정보의 공유가 가능합니다.

디지털 정보를 사용하는 이점은 아래와 같습니다.

1. 정보의 가공, 편집이 용이합니다.

2. 상호대화 형태의 조작이 가능합니다.

3. 전송이나 출력에 의한 정보의 저질화를 방지합니다.

4. 정보의 검색이 용이합니다.

5. 대용량 정보의 압축/복원이 가능합니다.

6. 패킷 통신 기술로 편리하게 송수신이 가능합니다.

반면에 디지털 정보를 사용할 때 생기는 단점은 아래와 같습니다.

1. 처리할 데이터 양이 방대합니다.

2. 다양한 미디어간의 상호 동기화가 필요합니다.

3. 각 미디어별 다른 QoS 충족이 요구됩니다.

4. 실시간 처리가 요구됩니다.

5. 복잡해진 표준화에 대한 요구가 존재합니다.

지금부터는 멀티미디어의 효과에 대해서 이야기하도록 하겠습니다. 그러니까 왜 굳이 멀티미디어를 적극적으로 활용해야 하는지 그 이유에 대해서 설명하는 시간을 가지겠습니다. 사실 그냥 간단하게 생각해봐도 멀티미디어를 활용했을 때가 더 감각적이고 미학적인 느낌을 받는다는 것을 쉽게 이해할 수 있습니다. 신경 생리학자 폴 매클린은 1970년대 뇌의 3층 모델을 제시했습니다. 인간의 뇌는 심층뇌(생명의 기본 기능을 제어), 중간층 뇌(감정과 감각을 제어), 표층뇌(논리를 제어)로 3층으로 구성되어있다는 것이 '폴 매클린의 뇌 3층 모델'의 핵심 개념입니다. 폴 매클린은 인간이 가장 편안하고 효과적으로 정보를 전달받는 뇌의 부분은 바로 '중간층 뇌'를 통해 정보를 전달받는 방식이라 말했습니다. 이 중간층뇌는 멀티미디어와 관련된 소리, 영상, 그래픽 등을 시청각적으로 흡수하고 제어합니다. 인간은 보고 듣고 실습(상호작용형 멀티미디어와 일맥상통)할 때 80%를 기억할 수 있다고 합니다. 멀티미디어를 통해서 정보를 전달받을 때 같은 시간 내에 더 많은 정보를 즐거운 기분으로 편안하게 흡수할 수 있기 때문에 정보전달 수단으로서 멀티미디어는 매우 효과적인 것입니다. (참고로 보고 듣기만 하면 50%를 기억) 쉽게

말해서 인간의 '감성 정보처리 능력'에 호소해서 '중간층 뇌'를 효과적으로 공략해서 효율성을 높이는 것입니다.

제일 바깥쪽의 표층뇌 - 논리

중간에 위치한 중간층뇌 - 감정

가장 안에 위치한 심층뇌 - 기본기능

또한 '적극적 학습(Active Learning)'의 개념은 인간이 단순히 듣고 보았을 때(50% 미만의 기억률)보다 직접 말하고 쓰고 실행에 옮길 때(50% - 100%의 기억률) 훨씬 효율적으로 공부할 수 있다는 것을 제시합니다. 따라서 이러한 측면에서 봤을 때도 멀티미디어는 적극적 학습에도 유리해서 전체적인 학습의 효율성을 증진시킬 수 있는 것입니다. 결과적으로 50% 미만의 기억률을 가지는 '수동적 학습(Passive Learning)'보다는 50% 이상의 기억률을 가지는 '적극적 학습(Active Learning)'을 멀티미디어를 활용해서 이룰 수 있도록 지향해야 합니다.

728x90

'멀티미디어' 카테고리의 다른 글

사운드(Sound)의 기본 개념 이해하기! (0)	2017.04.21
이미지와 그래픽의 개념을 정리해보자 (0)	2017.04.21
이미지 압축 방식에 대해서 알아보자! (0)	2017.04.21
이미지의 입출력 방식 이해하기! (0)	2017.04.21
이미지(Image)에 대해서 알아보자! (1)	2017.04.21

내 블로그 - 관리자 홈 전환	`Q` `Q`
새 글 쓰기	`W` `W`

글 수정 (권한 있는 경우)	`E` `E`
댓글 영역으로 이동	`C` `C`

이 페이지의 URL 복사	`S` `S`
맨 위로 이동	`T` `T`
티스토리 홈 이동	`H` `H`
단축키 안내	`Shift` + `/` `⇧` + `/`

안경잡이개발자

애니메이션의 개념을 알아보자!

'멀티미디어' 카테고리의 다른 글

압축의 원리에 대해서 알아보자! (허프만 코딩 알고리즘)

'멀티미디어' 카테고리의 다른 글

음악을 만드는 방법, MIDI란 무엇일까?

'멀티미디어' 카테고리의 다른 글

아날로그를 디지털로 바꾸는 방법 (표본화, 양자화, 부호화)

'멀티미디어' 카테고리의 다른 글

사운드(Sound)의 기본 개념 이해하기!

'멀티미디어' 카테고리의 다른 글

이미지와 그래픽의 개념을 정리해보자

'멀티미디어' 카테고리의 다른 글

이미지 압축 방식에 대해서 알아보자!

'멀티미디어' 카테고리의 다른 글

이미지의 입출력 방식 이해하기!

'멀티미디어' 카테고리의 다른 글

이미지(Image)에 대해서 알아보자!

'멀티미디어' 카테고리의 다른 글

멀티미디어란 무엇일까?

'멀티미디어' 카테고리의 다른 글

최근에 올라온 글

최근에 달린 댓글

공지사항

글 보관함

최근에 받은 트랙백

링크

티스토리툴바

단축키

내 블로그

블로그 게시글

모든 영역

« 2025/04 »
일	월	화	수	목	금	토
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30