3.타입과 추상화
추상화를 통한 복잡성 극복
해리 벡의 지하철 노선도는 불필요한 지형 정보를 제거함으로써 단순함을 달성한 추상화의 훌륭한 예이다. 추상화된 노선도는 지형 정보를 제거하고 역 사이의 연결성을 강조함으로써 지하철 노선도를 이용하는 승객들의 목적에 맞게 현실을 단순화 했다. 이 추상화가 유용했던 이유는 노선도가 표시해야하는 정보가 역의 위치가 아닌 역과 역사이의 연결관계라는 점에 있다.
따라서 진정한 의미의 추상화란 현실에서 출발하되 불필요한 부분을 도려내 가면서 사물의 놀라운 본질을 드러나게 하는 과정이라고 할 수 있다.
어떤 추상화라도 의도된 목적이 아닌 다른 목적으로 사용된다면 오도될 수 있다. 추상화의 수준, 이익, 가치는 목적에 의존적이다.
“현상은 복잡하다. 법칙은 단순하다. 버릴 게 무엇인지 알아내라.”
리처드 파인만
이 책에서는 추상화를 다음과 같이 정의한다.
어떤 양상, 세부 사항, 구조를 좀 더 명확하게 이해하기 위해 특정 절차나 물체를 의도적으로 생략하거나 감춤으로써 복잡도를 극복하는 방법
복잡성을 다루기 위해 추상화는 두 차원에서 이루어진다.
- 구체적인 사물들 간의 공통점은 취하고 차이점은 버리는 일반화를 통해 단순하게 만드는 갓
- 중요한 부분을 강조하기 위해 불필요한 세부 사항을 제거함으로써 단순하게 만드는 것
모든 경우에 추상화의 목적은 복잡성을 이해하기 쉬운 수준으로 단순화 하는 것이다.
앨리스 이야기
앨리스는 객체들 중 하얀 토끼를 제외한 모든 객체를 ‘트럼프’라는 하나의 개념으로 단순화해서 바라보고 있다. 각 인물들의 차이점은 과감하게 무시한 채 공통점만을 취해 단순화 해 버렸다.
앨리스의 이야기에서 재미있는 부분은 지금부터다. 왜 우리는 이 다양한 인물들을 “트럼프”라는 한 단어로 줄여 지칭할 수 있을끼? 그 이유는 정원에 있는 인물들이 공통적으로 ‘트럼프’라고 했을 때 떠오르는 일반적인 외형과 행동 방식을 지니고 있기 때문이다. 즉, 그들의 차이점을 무시하면 결국 트럼프가 된다.
앨리스는 인물들을 하나씩 살피면서 ‘트럼프’의미에 적합한 인물은 ‘트럼프’그룹에, 적합하지 않은 인물은 그룹에서 제외했다. 이런 관점에서 하트 왕비는 ‘트럼프’그룹에 속하지만 토끼는 그렇지 않다.
비록 토끼 그룹에 속하는 등장인물이 단 하나뿐이라고 해도 다수의 개별적인 인물이 아니라 ‘트럼프’와 ‘토끼’라는 두 개의 렌즈를 통해 정원을 바라보는 것은 정원에 내재된 복잡성을 효과적으로 감소시킨다.
객체지향 패러다임의 중심에는 구체적이고 실제적인 객체가 존재하지만, 수많은 객체들을 개별적인 단위로 취급하기에는 인간이 지닌 인지능력은 부족하다. 따라서 사람은 본능적으로 공통적인 특성을 기준으로 객체를 여러 그룹으로 묶어 동시에 다뤄야 하는 가짓수를 줄임으로써 단순화한다.
이처럼 공통점을 기반으로 객체들을 묶기 위한 그릇을 개념(concept)이라고 한다. 개념을 이요하면 객체를 여러 그룹으로 분류(classification)할 수 있다. 결과적으로 개념은 공통점을 기반으로 객체를 분류할 수 있는 일종의 체라고 할 수 있다.
결국 각 객체는 특정한 개념을 표현하는 그룹의 일원으로 포함된다. 하트 여왕은 ‘트럼프’라는 개념 그룹의 일원이고 하얀 토끼는 ‘토끼’라는 개념 그룹의 일원이다. 이처럼 객체에 어떤 개념을 적용하는 것이 가능해서 개념 그룹의 일원이 될 때 객체를 그 개념의 인스턴스(instance)라고 한다.
객체를 다음과 같이 정의할 수도 있다.
특정한 개념을 적용할 수 있는 구체적인 사물, 개념이 객체에 적용됐을 때 객체를 개념의 인스턴스라고 한다.
개념의 세 가지 관점
- 심볼(symbol) : 개념을 가리키는 간략한 이름이나 명칭 ('트럼프')
- 내연(intension) : 개념의 완전한 정의를 나타내며 내연의 의미를 이용해 객체가 개념에 속하는지 여부를 확인할 수 있다. ('몸이 납작하고 두손과 두발이 네모난 몸 모서리에 달렸다.)
- 외연(extension) : 개념에 속하는 모든 객체의 집합 (set; ‘정원사, 병사, 신하, 왕자와 공주, 하객’)
객체를 분류하기 위한 틀
분류란 객체에 특정한 개념을 적용하는 직업이다. 객체에 특정한 개념을 적용하기로 결심 했을 때 우리는 그 객체를 특정한 집합의 맴버로 분류하고 있는 것이다.
분류는 객체지향의 가장 중요한 개념 중 하나다. 어떤 객체를 어떤 개념으로 분류할지가 객체지향의 품질을 결정한다. 적절한 개념에 따라 분류한 애플리케이션은 유지보수가 용이하고 변경에 유연하게 대처할 수 있다. 적절한 분류 채계는 애플리케이션을 다루는 개발자의 머릿속에 객체를 쉽게 찾고 조작할 수 있는 정신적인 지도를 제공한다는 것이다.
분류는 추상화를 위한 도구다.
개념은 객체들의 복잡성을 극복하기 위한 추상화 도구다. 우리는 매 순간 세상에 존재하는 무수한 사물들을 개념의 틀로 걸러 세상을 추상화 한다. 추상화를 함으로써 우리는 극도로 복잡한 세상을 제어 가능한 수준으로 단순화할 수 있다.
타입
타입은 개념이다.
컴퓨터 공학자들은 개념을 대체할 수 잇는 세련된 용어를 수학으로 부터 차용했다. 그것은 바로 타입이다.
타입은 개념과 동일하다. 따라서 타입이란 우리가 인식하고 있는 다양한 사물이나 객체에 적용할 수 있는 아이디어나 관념을 의미한다. 어떤 객체에 타입을 적용할 수 있을 때 그 객체를 타입의 인스턴스라고 한다. 타입의 인스턴스는 타입을 구성하는 외연인 객체 집합의 일원이 된다.
데이터 타입
사람이 장기기억을 단기기억으로 전환하여 일을 수행하는 것 처럼 컴퓨터가 작업을 수행하기 위해서는 작업에 필요한 데이터를 메모리 안으로 불러들여야 한다.
타입이 없다(Untyped)는 말은 메모리 안에 데이터를 다룰 수 있는 단 하나의 타입만이 존재한다는 것을 의미한다.
메모리 안에 들어 있는 값이 어떤 의미인지 말할 수 있는 사람은 아무도 없다. 어떤 메모리 조각에 들어있는 값의 의미는 그 값을 가져다 자신의 용도에 맞게 사용하는 해석가에 의해 결정된다. 흔히 우리가 앱이라고 부르는 프로그램이 바로 그런 해석가의 일종이다.
컴퓨터 안에 데이터를 목적에 따라 분류하기 시작하면서, 프로그래밍 언어 안에는 타입 시스템이 자라나기 시작했다. 타입시스템의 목적은 메모리 안의 모든 데이터가 비트열로 보임으로써 야기되는 혼란을 방지하는 것이다.
지금까지 이야기한 내용을 토대로 타입과 관련된 두가지 중요한 사실을 알 수 있다.
- 타입은 데이터가 어떻게 사용되느냐에 관한 것이다. 데이터를 이용해 수행할 수 있는 작업을 연산자라고 하는 데, 타입에서 연산자의 종류가 중요한 것이 아닌 어떤 데이터에 어떤 연산자를 적용할 수 있느냐가 그 데이터의 타입을 결정한다.
- 타입에 속한 데이터를 메모리에 어떻게 표현하는지는 외부로부터 철저하게 감춰진다.(추상화) 데이터 타입의 표현 방식을 몰라도 데이터를 사용하는 데 지장이 없다. 개발자는 해당 데이터 타입을 사용하기 위해 타입에 적용할 수 있는 연산자만 알고 있으면 된다.
이 책에서는 프로그래밍 언어 관점에서 데이터 타입을 다음과 같이 정의한다.
데이터 타입은 메모리 안에 저장된 데이터의 종류를 분석하는 데 사용하는 메모리 집합에 관한 메타데이터다. 데이터에 대한 분류는 암시적으로 어떤 종류의 연산이 해당 데이터에 대해 수행될 수 있는지를 결정한다.
객체와 타입
전통적인 데이터 타입에서 이야기하는 타입과 객체지향의 타입 사이에는 깊은 연관성이 있다.
객체는 데이터인가? 그렇지 않다. 객체에서 중요한 것은 객체의 행동이다. 즉, 객체가 협력을 위해 어떤 책임을 지녀야 하는지를 결정하는 것이 객체지향 설계의 핵심이다.
따라서 앞에서 데이터 타입에 관해 언급했던 두 가지 조언은 객체의 타입을 이야기할 때도 동일하게 적용된다.
- 어떤 객체가 어떤 타입에 속하는지를 결정하는 것은 객체가 수행하는 행동이다. 어떤 객체들이 동일한 행동을 수행할 수 있다면 그 객체들은 동일한 타입으로 분류될 수 있다.
- 객체의 내부적인 표현은 외부로부터 철저하게 감춰진다. 객체의 행동을 가장 효과적으로 수행할 수만 있다면 객체 내부의 상태를 어떤 방식으로 표현하더라도 무방하다.
행동이 우선이다.
동일한 책임을 수행하는 일련의 객체는 동일한 타입에 속한다고 말할 수 있다.
객체가 어떤 데이터를 가지고 있는지는 우리의 관심사가 아니다. 그 객체가 다른 객체와 동일한 데이터를 가지고 있더라도 다른 행동을 한다면 그 객체는 서로 다른 타입으로 분류돼야 한다.
객체의 타입을 결정하는 것은 객체의 행동뿐이다. 객체가 어떤 데이터를 보유하고 있는 지는 타입을 결정하는 데 아무런 영향도 미치지 않는다.
같은 타입에 속한 객체는 행동만 동일하다면 서로 다른 데이터를 가질 수 있다. 여기서 동일한 행동이란 동일한 책임을 의미하며, 동일한 책임이란 동일한 메시지 수신을 의미한다, 따라서 동일한 타입에 속한 객체는 내부의 데이터 표현 방식이 다르더라도 동일한 메시지를 수신하고 처리할 수 있다.
다만 내부의 표현 방식이 다르기 때문에 동일한 메시지를 처리하는 방식은 서로 다를 수밖에 없다. 이것은 다형성에 의미를 부여한다.
데이터 내부 표현 방식과 무관하게 행동만이 고려 대상이라는 사실은 외부에 데이터를 감춰야 한다는 것을 의미한다. 따라서 훌륭한 객체 지향 설계는 외부에 행동만을 제공하고 데이터는 행동 뒤로 감춰야 한다. 이 원칙을 캡슐화라고 한다.
공용 인터페이스를 뒤로 데이터를 캡슐화하라는 오래된 격언은 객체를 행동에 따라 분류하기 위해 지켜야 하는 기본적인 원칙이다. 데이터가 캡슐의 벽을 뚫고 객체의 인터페이스를 오염시키는 순간 객체 분류 체계는 급격히 위험에 노출되고 결과적으로 유연하지 못한 설계를 낳는다.
행동에 따라 객체를 분류하기 위해, 객체가 내부적으로 관리해야 하는 데이터가 아닌 외부에 제공해야 하는 행동을 먼저 생각해야 한다.
데이터를 먼저 결정하고 객체의 책임을 결정하는 방법은 유연하지 못한 설계라는 악몽을 초래한다. 흔히 책임-주도 설계라고 부르는 객체지향 설계 방법은 데이터를 먼저 생각하는 데이터-주도 설계방법의 단점을 개선하기 위해 고안됐다.
타입의 계층
트럼프 계층
흥미로운 질문을 던져 보자, 앨리스는 정말 그들을 우리가 카드 게임을 할 때 사용하는 트럼프 카드와 같다고 생각한 것일까? 물론 그렇지 않다. 앨리스가 그들을 정말 트럼프 카드라고 생각한 적은 단 한 번도 없다. 단지 트럼프와 몇 가지 특징을 공유하기 때문에 트럼프라고 불렀을 뿐이다. 더 정확하게 앨리스는 등장인물들을 트럼프가 아니라 ‘트럼프 인간’으로 봤던 것이다.
왜 트럼프가 아닌 트럼프 인간일 까? 타입의 정의를 다시 한번 떠올려 보자. 객체가 동일한 타입으로 분류되기 위해서는 공통의 행동을 가져야만 한다. 안타깝게도 등장인물들의 외양은 트럼프와 유사하지만 행동 자체는 트럼프와 완벽하게 동일하지 않다.
정리를 해보자면 다음과 같다.
- 트럼프의 행동
- 납작 엎드릴 수 있다.
- 뒤집어질 수 있다.
- 트럼프 인간의 행동
- 납작 엎드릴 수 있다.
- 뒤집어질 수 있다.
- 걸을 때 마다 몸이 종이처럼 좌우로 펄럭일 수 있다.
트럼프 인간 타입의 객체는 트럼프 타입의 객체가 할 수 잇는 모든 행동
뿐 아니라 초가적으로 걸어다니는 행동을 더 할 수 있다. 다시 말해 트럼프 인간은 트럼프의 일종이지만 일반적인 트럼프 카드보다 좀 더 특화된 행동을 하는 트럼프인 것이다.
이 두 개념 사이의 관계를 일반화/특수화 관계라고 한다.
일반화 / 특수화 관계
트럼프는 트럼프 인간보다 더 일반적인 개념이다. 더 일반적이라는 말은 더 포괄적이라는 의미를 내포하기 때문에 트럼프는 트럼프 인간에 속하는 객체를 포함한다. 즉 트럼프 인간은 드럼프의 부분 집합이다.
여기서 중요한 것은 객체지향에서 일반화/특수화 관계를 결정하는 것은 객체의 상태를 표현하는 데이터가 아니라 행동이라는 것이다. 어떤 객체가 다른 객체보다 더 일반적인 상태를 표현하거나 더 특수한 상태를 표현한다고, 두 객체가 속하는 타입 간에 일반화/특수화 관계가 성립하는 것은 아니다.
우리는 두 타입을 다음과 같이 정의할 수 있다.
- 일반적인 타입 : 특수한 타입이 가진 모든 행동들 중에서 일부 행동만을 가지는 타입
- 특수한 타입 : 일반적인 타입이 가진 모든 타입을 포함하지만 거기에 더해 자신만의 행동을 추가하는 타입
정리하자면 일반적인 타입은 특수한 타입에 비해 더 적은 수의 행동을 가지며 특수한 타입은 일반적인 타입에 비해 더 많은 행동을 가진다. 단, 특수한 타입은 일반적인 타입이 할 수 있는 모든 행동을 동일하게 수행할 수 있어야 한다.
주의해야할 점은 타입의 내연을 의미하는 행동의 가짓수와 외연을 의미하는 집합의 크기는 서로 반대라는 사실이다.
슈퍼타입과 서브타입
좀 더 일반적인 타입을 슈퍼타입, 좀 더 특수한 타입을 서브타입이라고 한다.
다시 한번 강조하자면 슈퍼타입과 서브타입에서 중요한 것은 두 타입 간의 관계가 행동에 의해 결정된다는 점이다. 즉, 어떤 타입이 다른 타입의 서브타입이 되기 위해서는 행위적 호환성을 만족시켜야 한다.
따라서 어떤 타입을 다른 타입의 서브타입이라고 말할 수 있으려면 다른 타입을 대체할 수 있어야 한다.
슈퍼타입의 행동은 서브타입에게 자동으로 상속된다.
일반화는 추상화를 위한 도구다.
일반화/특수화 계층은 객체지향 패러다임에서 추상화의 두번째 차원을 적절하게 활용하는 대표적인 예다.
앨리스가 ‘기껏해야 트럼프에 불과해’라고 생각했을 때 앨리스는 머릿속에서 걸을 수 있는 트럼프 인간의 특수한 능력은 제거하고 종이 조각처럼 쉽게 뒤집어지는 트럼프의 특성에 집중한 것이다.
여기서 두가지 추상화 기법이 함께 사용됐다는 점에 주목하라. 하나는 정원에 있던 등장인물들의 차이점은 배제하고 공통점만을 강조함으로써 이들을 공통의 타입인 트럼프 인간으로 분류했다는 것이다. 다른 하나는 트럼프 인간을 좀 더 단순한 관점에서 바라보기 위해 불필요한 특성을 배제하고 좀 더 포괄적인 의미를 지닌 트럼프로 일반화했다는 것이다.
이처럼 객체지향 패러다임을 통해 세상을 바라보는 거의 대부분의 경우에 분류와 일반화/특수화 기법을 동시에 적용하게 된다.
정적 모델
타입의 목적
객체지향은 객체를 지향하는 것이므로 객체만 다루면 되지 않나? 왜 타입을 사용해야 하는가? 타입을 사용하는 이유는 인간의 인지 능력으로는 시간에 따라 동적으로 변하는 객체의 복잡성을 극복하기가 너무 어렵기 때문이다.
이상한 나라의 앨리스에서 앨리스라고 하는 객체의 상태는 변하지만 앨리스를 다른 객체와 구별할 수 있는 식별성은 동일하게 유지된다. 따라서 우리는 머릿속에 앨리스가 가질 수 있는 모든 경우의 키값을 나열하는 대신 앨리스의 키가 임의의 값을 가질 수 있다는 사실만을 생각함으로써 상황을 단순하게 만들 수 있다.
타입은 시간에 따라 동적으로 변하는 앨리스의 상태를 시간과 무관한 정적인 모습으로 다룰 수 있게 해준다. 결국 타입은 그림과 같이 앨리스의 상태에 복잡성을 부과하는 시간이라는 요소를 제거함으로써 시간에 독립적인 정적인 모습으로 앨리스를 생각할 수 있게 해준다.
그래서 결국 타입은 추상화다.
이런 관점에서 타입은 추상화다. 어떤 시점의 앨리스에 관해 생각할 때 불필요한 시간이라는 요소와 상태 변화라는 요소를 제거하고 철저하게 정적인 관점에서 앨리스의 모습을 묘사하는 것을 가능하게 한다.
타입을 이용하면 객체의 동적인 특성을 추상화할 수 있다. 결국 타입은 시간에 따른 객체의 상태 변경이라는 복잡성을 단순화 할 수 있는 효과적인 방법인 것이다.
동적 모델과 정적 모델
지금까지의 논의를 통해 객체를 생각할 때 우리는 두 가지 모델을 동시에 고려한다는 사실을 알 수 있다.
하나는 객체가 특정시점에 구체적으로 어떤 상태를 가지느냐다. 이를 객체의 스냅샷이라고 한다. UML에서 스냅샷은 객체 다이어그램이라고 불린다. 스냅샷처럼 실제로 객체가 살아 움직이는 동안 상태가 어떻게 변하고 행동하는지를 포착하는 것을 동적 모델이라고 한다.
다른 하나는 객체가 가질수 있는 모든 상태와 모든 행동을 시간에 독립적으로 표현하는 것이다. 일반적으로 이런 모델을 타입 모델이라고 한다. 이 모델은 동적으로 변하는 객체의 상태가 아니라 객체가 속한 타입의 정적인 모습을 표현하기 때문에 정적 모델이라고도 한다.
📌 객체의 두 모델을 정리하자면 다음과 같다.
-정적모델 : 객체가 가질 수 있는 상태와 행동을 시간에 독립적으로 표현 -동적모델 : 살아 움직이는 객체가 어떻게 변하고 행동하는지 표현
객체지향 프로그래밍에서 클래스를 작성하는 시점에는 시스템을 정적인 관점에서 접근하는 것이다. 그러나 애플리케이션을 실행해 객체의 상태 변경을 추적하고 디버깅 하는 동안에는 객체의 동적인 모델을 탐험하고 있는 것이다.
훌륭한 객체지향 프로그래머라면 애플리케이션의 동적인 관점과 정적인 관점을 모두 다뤄야 한다는 사실을 쉽게 이해할 수 있다.
클래스
객체지향 프로그래밍 언어에서 정적 모델은 클래스를 이용해 구현된다. 따라서 타입을 구현하는 가장 보편적인 방법은 클래스를 이용하는 것이다. ‘타입을 구현한다’라고 표현했음에 주목하라. 클래스와 타입은 동일한 것이 아니다. 타입은 객체를 분류하기 위해 사용하는 개념이지만, 클래스는 단지 타입을 구현할 수 있는 여러 구현 메커니즘 중 하나일 뿐이다. 실재로 자바스크립트와 같은 프로토타입 기반의 언어에는 클래스가 존재하지 않는다.
객체지향 패러다임을 주도하는 대부분의 프로그래밍 언어는 클래스를 기반으로 하기 대문에 대부분의 사람들은 클래스와 타입을 동일한 개념이라고 생각한다. 클래스와 타입을 구분하는 것은 설계를 유연하게 유지하기 위한 바탕이 된다. 클래스는 타입의 구현 외에도 코드를 재사용하는 용도로도 사용되기 때문에 클래스와 타입을 동일시 하는 것은 수많은 오해와 혼란을 불러일으킨다.
지금은 객체를 분류하는 기준은 타입이며, 타입을 나누는 기준은 객체가 수행하는 행동이라는 사실만을 기억하라. 결국 객체지향에서 중요한 것은 동적으로 변하는 객체의 ‘상태’와 상태를 변경하는 ‘행동’이다. 클래스는 타입을 구현하기 위해 프로그래밍 언어에서 제공하는 구현 메커니즘이라는 사실을 기억하라.
Commets
타입은 추상화다. 타입은 사람이 전부 인지하기 어려운 동적 모델들을 집합의 관점에서 추상화한다.
객체지향 프로그래밍 언어에서 정적 모델은 클래스를 이용해 구현된다. 다만 클래스가 타입인 것은 아니다.
결국 객체지향에서 가장 중요한 것은 분류다. 적절한 분류는 객체의 유지보수를 용이하고 유연하게 사용하게 만든다.