최적화는 신중히 하자
최적화 격언
그 어떤 핑계보다 효율성이라는 이름 아래 행해진 컴퓨팅 죄악이 더 많다.(심지어 효율을 높이지도 못하면서)
윌리엄 울프
전체의 97% 정도인 자그마한 효율성은 모두 잊자. 섣부른 최적화가 만악의 근원이다.
도널드 크누스
최적화를 할 때는 다음 두 규칙을 따르라.
- 하지 마라
- 아직 하지 마라. 다시 말해, 완벽히 명백하고 최적화되지 않은 해법을 찾을 때까지는 하지 마라.
M. A. 잭슨
이 격언들은 자바가 탄생하기 20년 전에 나온 것으로, 최적화의 어두운 진실을 이야기 해준다.
최적화는 좋은 결과보다는 해로운 결과로 이어지기 쉽고, 섣불리 진행하면 특히 더 그렇다.
빠르지도 않고 제대로 동작하지 않으면서 수정하기는 어려운 소프트웨어를 탄생시키는 것이다.
성능 vs 견고한 구조
성능 때문에 견고한 구조를 희생하지 말자.
빠른 프로그램보다는 좋은 프로그램을 작성하자.
좋은 프로그램이지만 원하는 성능이 나오지 않는다면 그 아키텍처 자체가 최적화할 수 있는 길을 안내해줄 것이다.
좋은 프로그램은 정보 은닉 원칙을 따르므로 개별 구성요소의 내부를 독립적으로 설계할 수 있다.
따라서 시스템의 나머지에 영향을 주지 않고도 각 요소를 다시 설계할 수 있다.
프로그램을 완성할 때까지 성능 문제를 무시하라는 뜻이 아니다. 구현상의 문제는 나중에 최적화해 해결할 수 있지만, 아키텍처의 결함이 성능을 제한하는 상황이라면 시스템 전체를 다시 작성하지 않고는 해결하기 불가능할 수 있다.
완성된 설계의 기본 틀을 변경하려다 보면 유지보수하거나 개선하기 어려운 꼬인 구조의 시스템이 만들어지기 쉽기 때문이다.
따라서 설계 단계에서 성능을 반드시 염두에 두어야 한다.
성능을 제한하는 설계를 피하자
완성 후 변경하기 가장 어려운 설계 요소는 바로 컴포넌트끼리, 혹은 외부 시스템과의 소통 방식이다.
API, 네트워크 프로토콜, 영구 저장용 데이터 포맷 등이 대표적이다.
이런 설계 요소들은 완성 후에는 변경하기 어렵거나 불가능할 수 있으며, 동시에 시스템 성능을 심각하게 제한할 수 있다.
API를 설계할 때 성능에 주는 영향을 고려하자
내부 데이터를 변경할 수 있게 만들면 불필요한 방어적 복사를 수없이 유발할 수 있다.
비슷하게, 컴포지션으로 해결할 수 있음에도 상속 방식으로 설계한 public 클래스는 상위 클래스에 영원히 종속되며 그 성능 제약까지도 물려받게 된다.
인터페이스도 있는데 굳이 구현 타입을 사용하는 것 역시 좋지 않다.
특정 구현체에 족송되게 하여, 나중에 더 빠른 구현체가 나오더라도 이용하지 못하게 된다.
최적화 시도 전후로 성능을 측정하자
시도한 최적화 기법이 성능을 눈에 띄게 높이지 못하는 경우가 많고, 심지어 더 나빠지게 할 때도 있다.
주요 원인은 우리가 프로그램에서 시간을 잡아먹는 부분을 추측하기가 어렵기 때문이다.
느릴 거라고 짐작한 부분이 사실은 성능에 별다른 영향을 주지 않는 곳이라면 시간만 허비한 꼴이 된다.
일반적으로 90%의 시간을 단 10%의 코드에서 사용한다는 사실을 기억해두자.
프로파일링 도구를 사용하자
프로파일링 도구는 최적화 노력을 어디에 집중해야 할지 찾는데 도움을 준다.
이런 도구는 개별 메서드의 소비 시간과 호출 횟수 같은 런타임 정보를 제공하여, 집중할 곳은 물론 알고리즘을 변경해야 한다는 사실을 알려주기도 한다.
시스템 규모가 커질수록 프로파일러가 더 중요해진다.
건초더미에 바늘찾기와 비슷하다. 건초더미가 거대해질수록 금속탐지기가 더 절실해 진다.
그 외의 jmh
도 언급해둘 만한 도구다. 프로파일러는 아니지만 자바 코드의 상세한 성능을 알기 쉽게 보여주는 마이크로 벤치마킹 프레임워크다.
자바의 성능 모델의 추상화 격차
최적화 시도 전후의 성능 측정은 C와 C++ 같은 전통적인 언어에서도 중요하지만, 성능 모델이 덜 정교한 자바에서는 중요성이 더욱 크다.
자바는 다양한 기본 연산에 드는 상대적인 비용을 덜 명확하게 정의하고 있다.
다시 말해, 프로그래머가 작성하는 코드와 CPU에서 수행하는 명령 사이의 ‘추상화 격차’가 커서 최적화로 인한 성능 변화를 일정하게 예측하기가 그만큼 더 어렵다.
그래서인지 최적화와 관련해 일부만 맞거나 터무니없는 미신들이 떠돌아다닌다.
자바의 성능모델은 정교하지 않을뿐더러 구현 시스템, 릴리스, 프로세서마다 차이가 있다.
프로그램을 여러 가지 자바 플랫폼이나 여러 하드웨어 플랫폼에서 구동한다면 최적화의 효과를 그 각각에서 측정해야 한다.
그러다 보면 다른 구현 혹은 하드웨어 플랫폼 사이에서 성능을 타협해야 하는 상황도 마주할 것이다.