지연 초기화는 신중히 사용하자

2021-10-22

지연초기화

지연 초기화(lazy initialization)는 필드의 초기화 시점을 그 값이 처음 필요할 때까지 늦추는 기법이다.

그래서 값이 전혀 쓰이지 않으면 초기화도 결코 일어나지 않는다.

이 기법은 정적 필드와 인스턴스 필드 모두에 사용할 수 있다.

지연 초기화는 주로 최적화 용도로 쓰이지만, 클래스와 인스턴스 초기화 때 발생하는 위험한 순환 문제를 해결화는 효과도 있다.

지연초기화 단점

지연 초기화는 필요할 때까지는 하지 않는게 좋다.

지연 초기화는 양날의 검이다.

클래스 혹은 인스턴스 생성 시의 초기화 비용은 줄지만 그 대신 지연 초기화하는 필드에 접근하는 비용은 커진다.

지연 초기화하려는 필드들 중 결국 초기화가 이뤄지는 비율에 따라, 실제 초기화에 드는 비용에 따라,

초기화된 각 필드를 얼마나 빈번히 호출하느냐에 따라 지연 초기화가 실제로는 성능을 느려지게 할 수도 있따.

지연초기화의 필요성

그럼에도 불구하고 지연 초기화가 필요할 때가 있다.

해당 클래스의 인스턴스 중 그 필드를 사용하는 인스턴스의 비율이 낮은 반면,

그 필드를 초기화하는 비용이 크다면 지연 초기화가 제 역할을 해줄 것이다.

하지만 안타깝게도 정말 그런지를 알 수 있는 유일한 방법은 지연 초기화 적용 전후의 성능을 측정해보는 것이다.

멀티스레드 환경에서의 지연 초기화

멀티스레드 환경에서는 지연 초기화를 하기가 까다롭다.

지연 초기화하는 필드를 둘 이상의 스레드가 공유한다면 어떤 형태로든 반드시 동기화해야 한다.

그렇지 않으면 심각한 버그로 이어질 것이다.

대부분의 상황에서 일반적인 초기화가 지연 초기화보다 낫다.

다음은 인스턴스 필드를 선언할 때 수행하는 일반적인 초기화 모습이다.

final을 사용했음에 주목하자.

인스턴스 필드를 초기화하는 일반적인 방법

private final FieldType field = computeFieldValue();

지연 초기화가 초기화 순환성(initialization circularity)을 깨뜨릴 것 같으면 synchronized를 단 접근자를 사용하자.

이 방법이 가장 간단하고 명확한 대안이다.

인스턴스 필드의 지연 초기화 - synchronized 접근자 방식

private FieldType field; 

private synchronized FieldType getField() {
  if (field == null)
    field = computeFieldValue();
  return field;
}

정적 필드 지연 초기화

성능 때문에 정적 필드를 지연 초기화해야 한다면 지연 초기화 홀더 클래스(lazy initialization holder class) 관용구를 사용하자.

클래스는 클래스가 처음 쓰일 때 비로소 초기화된다는 특성을 이용한 관용구다.

public class Main {
    public static void main(String[] args) {
        
        FieldHolder.getField();
        FieldHolder.getField();
        FieldHolder.getField();
    }
    
    private static class FieldHolder {
        static final FieldType field = computeFieldValue();

        private static FieldType computeFieldValue() {
            System.out.println("create FieldType");
            return new FieldType();
        }
        
        private static FieldType getField() {
            return FieldHolder.field;
        }
    }
}

getField가 처음 호출되는 순간 FieldHolder.field 가 처음 읽히면서,

**그 때 FieldHolder 클래스 초기화를 촉발한다.**

이 관용구의 장점은 getField 메서드가 필드에 접근하면서 동기화를 전혀 하지 않으니 성능이 느려질 거리가 전혀 없다.

**일반적인 VM은 오직 클래스를 초기화할 때만 필드 접근을 동기화 할 것이다.**

클래스 초기화가 끝난 후에는 VM이 동기화 코드를 제거하여,

그다음부터는 아무런 검사나 동기화 없이 필드에 접근하게 된다.

더블 체크 락킹

성능 때문에 인스턴스 필드를 지연 초기화해야 한다면 이중검사(double-check)관용구를 사용하자.

이 관용구는 초기화된 필드에 접근할 때의 동기화 비용을 없애준다.

이름에서 알 수 있듯 필드의 값을 두 번 검사하는 방식으로, 한 번은 동기화 없이 검사하고,

필드가 아직 초기화되지 않았다면 두 번째는 동기화하여 검사한다.

두 번째 검사에서도 필드가 초기화되지 않았을 때만 필드를 초기화 한다.

필드가 초기화된 후로는 동기화하지 않으므로 해당 필드는 반드시 volatile 로 선언해야 한다.

인스턴스 필드 지연 초기화용 이중검사 관용구

private volatile FieldType field;

private FieldType getField() {
  FieldType result = field;
  if (result != null) { //첫 번째 검사 (락 사용 안 함)
    return result;
  }
  
  synchronized(this) {
    if (field == null) { //두 번째 검사 (락 사용)
      field = computeFieldValue();
    }
    return field;
  }
}

result라는 지역변수가 필요한 이유가 뭘까?

이 변수는 필드가 이미 초기화된 상황(일반적인 상황)에서는 그 필드를 딱 한 번만 읽도록 보장하는 역할을 한다.

반드시 필요하지는 않지만 성능을 높여주고, 저수준 동시성 프로그래밍에 표준적으로 적용되는 더 우아한 방법이다.

volatile 변수에 접근하는 건 속도가 느리다.

그래서 지역변수를 하나 선언해서 캐싱해서 사용하면 속도가 빨라진다.

이중검사를 정적 필드에도 적용할 수 있지만 굳이 그럴 이유는 없다.

이보다는 지연 초기화 홀더 클래스 방식이 더 낫다.

이중검사에는 언급해둘 만한 변종이 두 가지 있다.

이따금 반복해서 초기화해도 상관없는 인스턴스 필드를 지연 초기화해야 할 때가 있는데,

이런 경우라면 이중검사에서 두 번째 검사를 생략할 수 있다.

이 변종의 이름은 자연스럽게 단일검사(single-check)관용구가 된다.

필드는 여전히 volatile로 선언했음을 확인하자.

단일검사 관용구 - 초기화가 중복해서 일어날 수 있다

private volatile FieldType field;

private FieldType getField() {
  FieldType result field;
  if (result == null)
    field = result = computeFieldValue();
  return result;
}

여기에서 이야기한 모든 초기화 기법은 기본 타입 필드와 객체 참조 필드 모두에 적용할 수 있다.

이중검사와 단일검사 관용구를 수치 기본 타입 필드에 적용한다면 필드의 값을 null 대신 0과 비교 하면 된다.

모든 스레드가 필드의 값을 다시 계산해도 상관없고 필드의 타입이 long과 dobule을 제외한 다른 기본 타입이라면,

단일검사의 필드 선언에서 volatile 한정자를 없애도 된다.

이 변종은 짜릿한 단일검사(racy single-check) 관용구라 불린다.

이 관용구는 어떤 환경에서는 필드 접근 속도를 높여주지만,

초기화가 스레드당 최대 한 번 더 이뤄질 수 있다.

아주 이례적인 기법으로, 보통은 거의 쓰지 않는다.