들어가기 전

회사에서 화면 조회 성능 개선을 위해 어떤 부분을 리팩토링 하면될까 고민하던 중, 몇몇 화면이 호출하는 api에서 수행하는 로직이 각각 독립적인 조회 결과들을 Map에 담아 화면에 리턴해주는 형태로 되어있는 것을 보았다. 따라서, 이런 경우 비동기적으로 처리한다면 성능이 개선되지 않을까 ? 하는 생각이들어 어떤식으로 자바에서 비동기 프로그래밍을 하면되는지 공부해보았다.

Thread

자바에서 비동기 프로그래밍을 위한 첫 번째 방법은 JDK 1.0에 있는 Runnable 인터페이스와 Thread 클래스를 사용하는 것이다.
클래스는 Runnable을 구현하고 run() 메서드를 재정의하거나, Thread를 상속받아 동일한 작업을 수행할 수 있다.
- 차이점은 실행 메서드가 Runnable에서 직접 호출될 때 새 스레드가 생성되지 않고 호출 중인 스레드에서 실행된다.
- thread.start()를 수행하면 새 스레드가 생성된다.
JDK 1.5의 스레드 관리를 개선하기 위해 Executor 프레임워크가 등장했다. 따라서, 여러 스레드 풀을 사용할 수 있으며, 수동으로 스레드를 작성할 필요가 없다.
또한, 스레드 수를 지정할 수 있으며 스레드를 재사용할 수 있다.
이전에 공부했듯이, 멀티 스레딩을 위해서는 스레드 풀을 사용하는 것이 장점이 많기 때문에 일반적으로는 비동기 처리를 위해 굳이 스레드를 직접 생성하고 관리하진 않는 것 같다.

Future

Java 5 부터, Future 인터페이스는 FutureTask를 사용하여 비동기 작업을 수행할 수 있는 방법을 제공한다.
ExecutorService의 sumbit() 메서드를 사용하여 비동기적으로 작업을 수행하고 FutureTask 객체를 반환한다.
- 이 객체는 작업이 끝나면 결과를 얻을 수 있다는 약속(promise)이며, get() 메서드를 사용해 결과를 얻는다.

ExecutorService threadpool = Executors.newCachedThreadPool();
Future<Long> futureTask = threadpool.submit(() -> factorial(number));

while (!futureTask.isDone()) {
    System.out.println("FutureTask is not finished yet...");
}
long result = futureTask.get();

threadpool.shutdown();

Future의 한계

Future API는 몇 가지 중요하고 유용한 기능이 부족하다.

1. 수동으로 완료될 수 없다.

외부 API를 호출하는 등의 과정을 거쳐 결과적으로 Future를 반환하는 메서드가 있다고 가정하자.
만약 API 서비스가 다운된 경우, 캐시된 가장 최근의 값 등을 Future에 세팅하여 수동으로 리턴한다면 에러가 발생하지 않을 것이다. 하지만, Future에 이러한 기능은 없다.

2. 블로킹 없이 추가적인 작업을 수행할 수 없다.

Future에 콜백 함수를 추가하고 Future의 결과를 사용할 수 있을 때, 자동으로 호출하도록 할 수 없다.
- 즉, 결과를 사용할 수 있을 때까지 블로킹하는 get() 메서드만 제공한다.

3. 여러개의 작업을 병합할 수 없다.

병렬로 실행하려는 10개의 작업이 있고 모든 작업이 완료된 후 일부 기능을 실행한다고 가정했을 때, Future에는 10개를 한꺼번에 실행할 수 있는 기능은 없다.

4. 예외 처리를 제공하지 않는다.

Future API에는 예외 처리를 위한 메서드 등이 없다.

CompletableFuture

위에서 살펴봤듯이 Future에는 여러가지 한계점이 있었다. 따라서, 자바8에서는 Future를 업그레이드 시킨 CompletableFuture가 등장했다.

CompletableFuture는 Future 뿐아니라 CompletionStage 인터페이스도 구현한다.

CompletionStage는 다른 스레드에서 계산된 결과를 간단하게 사용할 수 있는 다양한 메서드를 제공한다.
즉, 중첩된 콜백(callback hell) 없이 단일 결과에 여러 비동기 연산을 연결, 결합하는 파이프라인을 지원한다.

CompletableFuture<Integer> priceInEur = CompletableFuture.supplyAsync(this::getPriceInEur);
CompletableFuture<Integer> exchangeRateEurToUsd = CompletableFuture.supplyAsync(this::getExchangeRateEurToUsd);
CompletableFuture<Integer> netAmountInUsd = priceInEur
       .thenCombine(exchangeRateEurToUsd, (price, exchangeRate) -> price * exchangeRate);

logger.info("this task started");

netAmountInUsd
       .thenCompose(amount -> CompletableFuture.supplyAsync(() -> amount * (1 + getTax(amount))))
       .whenComplete((grossAmountInUsd, throwable) -> {
           if (throwable == null) {
               logger.info("this task finished: {}", grossAmountInUsd);
           } else {
               logger.warn("this task failed: {}", throwable.getMessage());
           }
       }); // non-blocking

logger.info("another task started");

내부적으로 ForkJoinPool을 사용하여 작업을 비동기식으로 처리한다.

즉, 전역 ForkJoinPool.commonPool()메서드에서 얻은 스레드에서 작업을 실행한다.
- ForkJoinPool.commonPool() 메서드에 의해 반환된 스레드 풀은 모든 CompletableFutures 및 모든 병렬 스트림에 의해 JVM 전체에서 공유된다.
- 전역적으로 공유되기 때문에 common pool 사용시 주의해야 한다.(실제 장애 사례)
  1 2 private static final Executor ASYNC_POOL = USE_COMMON_POOL ? ForkJoinPool.commonPool() : new ThreadPerTaskExecutor();

사용자가 스레드 풀을 명시적으로 생성하여 해당 스레드 풀에서 가져온 스레드로 작업을 처리할 수도 있다.

즉, CompletableFuture의 여러 메소드에는 두 가지 변형이 있다.

하나는 사용자가 생성한 스레드 풀을 사용하고, 다른 하나는 내부적으로 생성된 스레드 풀을 사용한다.

public static <U> CompletableFuture<U> supplyAsync(Supplier<U> supplier) {
  return asyncSupplyStage(ASYNC_POOL, supplier);
}
public static <U> CompletableFuture<U> supplyAsync(Supplier<U> supplier,
                                                 Executor executor) {
  return asyncSupplyStage(screenExecutor(executor), supplier);
}

CompletableFuture<Long> completableFuture = CompletableFuture.supplyAsync(() -> factorial(number));
long result = completableFuture.get();

CompletableFuture 메서드 살펴보기

CompletableFuture 메서드는 크게 5개 그룹으로 나뉠 수 있다.
1. CompletableFuture 생성
2. 작업 완료 상태 체크
3. 작업 완료 시키기
4. 처리 결과 읽기
5. 여러개의 작업 처리(bulk futures)

출처 : https://www.linkedin.com/pulse/asynchronous-programming-java-completablefuture-aliaksandr-liakh

1. CompletableFuture 생성 메서드

일반적으로 한 스레드에서 완료되지 않은 Future가 생성되고 다른 스레드에서 완료된다. 그러나 경우에 따라 이미 완료된 Future를 만들 수도 있다.
파라미터가 없는 CompletableFuture 생성자는 완료되지 않은 Future를 생성한다.

2. 완료 상태 체크 메서드

CompletableFuture 클래스에는 작업이 완료되지 않았는지, 정상적으로 완료되었는지, 예외적으로 완료되었는지, 취소되었는지 여부를 확인하기 위한 non-blocking 메서드가 있다.
이미 완료된 작업은 취소가 불가능하다.

3. 작업 완료를 위한 메서드

CompletableFuture에는 아직 완료되지 않은 작업을 정상완료, 예외완료, 취소 상태를 갖는 완료된 작업으로 바꾸는 메서드가 있다.
cancel 메서드가 호출되면 CancellationException과 함께 연산이 취소된다. 하지만, 해당 작업을 수행하는 스레드를 중단하기 위한 Thread.interrupt()는 호출되지 않는다.

4. 처리 결과 읽기 메서드

CompletableFuture는 작업에 대한 결과를 읽는(아직 완료되지 않은 경우는 대기) 메서드를 제공한다.
이러한 메서드는 대부분의 경우, 계산 파이프라인의 마지막 단계로 사용해야 한다.
get(), get(timeout, timeUnit) 메서드는 ‘checked exception’을 발생시킬 수 있다.
- ExecutionException : 작업이 예외적으로 완료된 경우
- InterruptedException : 현재 스레드가 중단된 경우
- TimeoutException : get(timeout, timeUnit) 메서드 사용시 타임아웃 발생하는 경우
join(), getNow(valueIfAbsent) 메서드는 ‘unchecked exception’을 발생시킬 수 있다.
- CompletionException : 작업이 예외적으로 완료되는 경우
작업이 취소되는 경우, 모든 메서드가 CancellationException(unchecked exception)을 발생시킬 수 있다.

5. 여러개의 작업 처리를 위한 메서드

CompletableFuture에는 많은 작업이 완료될 때까지 대기하는 두 가지 정적 메서드가 있다.
각각 다른 타입의 CompletableFuture가 메서드 파라미터로 입력될 수 있다.
- 정의된 파라미터 : CompletableFuture<?>... cfs

CompletionStage

CompletionStage 인터페이스는 여러 단계를 거치는 연산에서, fork, chain, join할 수 있는 각 단계를 나타낸다.
또한, future/promise 구현에 대한 파이프라이닝을 명시한다.
파이프라이닝
- 각 단계는 연산을 수행한다. 값을 계산하거나(결과 반환) 작업 수행만 할 수도 있다(결과 반환 안 함).
- 각 단계를 파이프라인으로 연결한다.
  - 하나 또는 두 개의 이전 단계를 완료하여 현재 단계를 시작할 수 있다.
  - 각 단계는 연산이 완료되면 종료된다.
- 각 단계는 동기식 또는 비동기식으로 실행될 수 있다. 처리될 데이터에 따라 적절한 방법을 선택해야 한다.
CompletionStage 인터페이스의 메서드는 크 두 그룹으로 나눌 수 있다.
1. 파이프라이닝 연산을 위한 메서드
2. 예외 처리를 위한 메서드

1. 파이프라이닝 연산을 위한 메서드

CompletionStage 인터페이스에는 43개의 public 메서드가 있으며, 대부분 세 가지의 이름 패턴을 갖는다.

첫째, 새로운 단계가 시작되는 방법을 설명한다.

메서드 이름에 “then”이 있으면, 하나의 이전 단계가 완료된 후 새 단계가 시작된다.
메서드 이름에 “either”가 있으면, 이전 두 단계 중 첫 번째 단계가 완료된 후 새 단계가 시작된다.
메서드 이름에 “both”가 있으면, 이전 두 단계를 모두 완료한 후 새 단계가 시작된다.

둘째, 새로운 단계가 수행하는 연산에 대해 설명한다.

메서드 이름에 “apply”가 있으면, 새로운 단계는 주어진 Function을 기준으로 인수를 변환한다.
메서드 이름에 “accept”가 있으면, 새로운 단계는 주어진 Consumer를 기준으로 인수를 처리한다.
메서드 이름에 “run”이 있으면, 새로운 단계는 주어진 Runnable를 기준으로 작업을 수행한다.

셋째, 어떤 스레드가 새로운 단계를 실행하는지 설명한다.

메서드에 “something(…)”의 형태이면, 새 단계는 기본 스레드 풀에 의해 실행된다.(동기 또는 비동기)
메서드에 “somethingAsync()”의 형태이면, 새 단계는 기본 비동기 스레드 풀(ForkJoinPool)에 의해 실행된다.
메서드에 “somethingAsync(…, Executor))”의 형태이면,새 단계는지정된 Executor(사용자 정의 스레드 풀)에 의해 실행된다.

CompletableFuture<Double> pi = CompletableFuture.supplyAsync(() -> Math.PI);
CompletableFuture<Integer> radius = CompletableFuture.supplyAsync(() -> 1);

// area of a circle = π * r^2
CompletableFuture<Void> area = radius
        .thenApply(r -> r * r)
        .thenCombine(pi, (multiplier1, multiplier2) -> multiplier1 * multiplier2)
        .thenAccept(a -> logger.info("area: {}", a))
        .thenRun(() -> logger.info("operation completed"));

area.join();

2. 예외 처리를 위한 메서드

각 단계별 연산은 정상적으로 또는 예외적으로 완료될 수 있다. 또한, 비동기 연산에서는 예외가 발생한 곳과 예외 처리를 위한 메서드는 서로 다른 스레드에 있을 수 있다. 따라서 이 경우 try-catch-finally 문을 사용하여 예외를 처리할 수 없기 때문에 CompletionStage는 예외를 처리하기 위한 특별한 메서드를 제공한다.

이전 단계가 정상적으로 완료되면, 다음 단계가 정상적으로 실행되기 시작합니다.
이전 단계가 예외적으로 완료되면, 파이프라인에 예외 복구 단계가 없는 한 다음 단계는 예외적으로 완료된다.
whenComplete 메서드를 사용하면 결과(없는 경우 null)와 예외(없는 경우 null)를 모두 읽을 수 있지만 결과를 변경할 수는 없습니다.
예외 발생시 복구해야 하는 경우 handle과 exceptionally 메서드를 사용한다.
- handle 메소드의 BiFunction 인수는 이전 단계가 정상적으로 또는 예외적으로 완료될 때 모두 호출된다.
- exceptionally 메서드의 Function 인수는 이전 단계가 예외적으로 완료될 때 호출된다.
- 두 경우 모두 예외가 다음 단계로 전파되지 않는다.

CompletableFuture.supplyAsync(() -> 0)
       .thenApply(i -> { logger.info("stage 1: {}", i); return 1 / i; }) // executed and failed
       .thenApply(i -> { logger.info("stage 2: {}", i); return 1 / i; }) // skipped
       .whenComplete((value, t) -> {
           if (t == null) {
               logger.info("success: {}", value);
           } else {
               logger.warn("failure: {}", t.getMessage()); // executed
           }
       })
       .thenApply(i -> { logger.info("stage 3: {}", i); return 1 / i; }) // skipped
       .handle((value, t) -> {
           if (t == null) {
               return value + 1;
           } else {
               return -1; // executed and recovered
           }
       })
       .thenApply(i -> { logger.info("stage 4: {}", i); return 1 / i; }) // executed
       .join();

CompletableFuture 사용시 주의사항

어떤 스레드가 어떤 단계를 실행하는지 알고, 되도록이면 우선 순위가 높은 스레드가 오래 실행되는 낮은 우선 순위의 작업을 처리하지 않게 한다.
파이프라인 내에서 블로킹 메서드 사용을 지양한다.
빈번한 context switch로 인해 상당한 오버헤드가 발생할 수 있으므로 짧은(수백 밀리초) 비동기식 계산을 지양한다.
try-catch-finally 문과 다르게 작동하는 새로운 예외 처리 메커니즘에 유의할 것.
작업이 완료되는 것을 너무 오래 기다리지 않도록 타임아웃을 관리한다.

Parallel Stream

Fork-Join Framework를 이용하여 작업들을 분할하고, 병렬적으로 처리한다.
- Fork-Join Framework는 작업 데이터를 worker 스레드 간에 분할하고, 작업 완료 시 콜백 처리를 담당한다.
공통 풀의 스레드 수는 프로세서 코어 수(논리 코어 수, Runtime.getRuntime().availableProcessors())와 동일하다. 그러나 JVM 매개 변수를 전달하여 사용할 스레드 수를 지정할 수도 있다.
- -D java.util.concurrent.ForkJoinPool.common.parallelism=4
- 그러나 이 설정은 전역 설정이므로 모든 병렬 스트림과 공통 풀을 사용하는 fork-join 작업에 영향을 미치기 때문에, 합당한 이유가 아닌 이상 기본 설정을 사용하는 것을 권장한다.
- 전역적으로 공유되기 때문에 common pool 사용시 주의해야 한다.(실제 장애 사례)

병렬 처리의 이점을 완벽히 활용하려면, 다음과 같은 오버헤드를 고려해야한다.

Splitting Costs(분할 비용)

데이터 소스를 고르게 분할하는 데 드는 비용이다. 즉, Parallel Stream은 작업을 분할하기 위해 Spliterator의 trySplit()을 사용하는데, 분할되는 작업의 단위가 균등하게 나누어져야 하며, 나누어지는 작업에 대한 비용이 높지 않아야 순차적 방식보다 효율적으로 이루어질 수 있다.

0 ~ 1,000,000까지 ArrayList와 LinkedList에 할당한 뒤, 일반 스트림과 병렬 스트림 사용하여 성능 비교

ArrayList는 위치 속성을 활용하여 저렴하고 고르게 분할할 수 있는 반면, LinkedList에는 이러한 속성이 없다.

Benchmark                                                     Mode  Cnt        Score        Error     Units
DifferentSourceSplitting.differentSourceArrayListParallel     avgt   25    2004849,711 ±    5289,437  ns/op
DifferentSourceSplitting.differentSourceArrayListSequential   avgt   25    5437923,224 ±   37398,940  ns/op
DifferentSourceSplitting.differentSourceLinkedListParallel    avgt   25   13561609,611 ±  275658,633  ns/op
DifferentSourceSplitting.differentSourceLinkedListSequential  avgt   25   10664918,132 ±  254251,184  ns/op

Merging Costs(병합 비용)

병렬 연산을 위해 분할한 데이터 소스를 처리하고 난 뒤에는 각각의 결과를 병합해야 한다.

다음은 0 ~ 1,000,000까지 ArrayList에 할당한 뒤 reduce()를 통해 병합하는 경우와, collect()를 통해 Set으로 그룹화하는 경우에 대한 성능비교이다.

reduce 같은 연산의 경우 비용이 저렴한 반면, Set이나 Map에 그룹화하는 것과 같은 병합 작업은 상당한 비용이 들 수 있다.

Benchmark                                                     Mode  Cnt        Score        Error     Units
MergingCosts.mergingCostsGroupingParallel                     avgt   25  135093312,675 ± 4195024,803  ns/op
MergingCosts.mergingCostsGroupingSequential                   avgt   25   70631711,489 ± 1517217,320  ns/op
MergingCosts.mergingCostsSumParallel                          avgt   25    2074483,821 ±    7520,402  ns/op
MergingCosts.mergingCostsSumSequential                        avgt   25    5509573,621 ±   60249,942  ns/op

독립적인 작업

distinct(), sorted()와 같은 중간 단계 연산들(intermediate operation) 중 일부 연산자들은 연산자 내부에 상태(State) 정보를 가지고 있다.
따라서, 모든 Worker들은 독립적으로 다른 Thread에 의해 실행되지만 처리 결과를 이런 상태 정보에 저장하고, distinct() 연산자는 이 정보를 이용하여 정해진 기능을 수행한다.
즉, 내부적으로 어떤 공용 변수를 만들어 놓고 각 worker들이 이 변수에 접근할 경우 동기화 작업(synchronized) 등을 통해 변수를 안전하게 유지하면서 처리하고 있다.
따라서, 잘못 사용할 경우 순차적 실행보다 더 느릴 수도 있다.

NQ Model

Oracle에서 제시한 간단한 모델로써, 병렬화가 성능 향상을 제공할 수 있는지 여부를 판단하는 데 도움이 될 수 있다.
N : 소스 데이터 요소의 수
Q : 데이터 요소당 수행되는 계산의 양
N*Q 제품이 클수록 병렬화를 통해 성능이 향상될 가능성이 높다.
숫자 합계와 같이 Q가 아주 작은 문제의 경우, N은 10,000보다 커야 한다.
계산 수가 증가함에 따라 병렬 처리로 성능을 높이는 데 필요한 데이터 크기는 감소한다.
좀 더 상세한 내용은 이 글 을 참조하면 좋을 것 같다.

CompletableFuture vs Parallel Stream

CompletableFuture와 Parallel Stream이 동일한 fork join common pool을 사용하는 동안 성능은 비슷할 수 있다.
CompletableFuture의 성능은 선택한 스레드 수로 사용자 정의 스레드 풀을 구성해야 하는 상황에서 더 좋을 수 있다.
또한, 다른 작업을 수행하는 동안 URL에서 다운로드하려는 경우와 같이 비동기식 방법을 찾고 있다면 CompletableFuture를 선택할 수 있다.
Parallel Stream은 모든 작업이 일부 작업을 수행하기를 원하는 CPU 집약적 작업, 즉 모든 스레드가 다른 데이터로 동일한 작업을 수행하기를 원하는 경우 좋은 선택이 될 수 있다.

Java - 비동기 프로그래밍을 위한 자바 클래스 살펴보기

들어가기 전

Thread

Future

Future의 한계

1. 수동으로 완료될 수 없다.

2. 블로킹 없이 추가적인 작업을 수행할 수 없다.

3. 여러개의 작업을 병합할 수 없다.

4. 예외 처리를 제공하지 않는다.

CompletableFuture

CompletableFuture 메서드 살펴보기

1. CompletableFuture 생성 메서드

2. 완료 상태 체크 메서드

3. 작업 완료를 위한 메서드

4. 처리 결과 읽기 메서드

5. 여러개의 작업 처리를 위한 메서드

CompletionStage

1. 파이프라이닝 연산을 위한 메서드

첫째, 새로운 단계가 시작되는 방법을 설명한다.

둘째, 새로운 단계가 수행하는 연산에 대해 설명한다.

셋째, 어떤 스레드가 새로운 단계를 실행하는지 설명한다.

2. 예외 처리를 위한 메서드

CompletableFuture 사용시 주의사항

Parallel Stream

Splitting Costs(분할 비용)

Merging Costs(병합 비용)

독립적인 작업

NQ Model

CompletableFuture vs Parallel Stream

실제로 적용하기

더 공부해야할 부분

참고자료

Trending Tags

Java - 비동기 프로그래밍을 위한 자바 클래스 살펴보기

들어가기 전

Thread

Future

Future의 한계

1. 수동으로 완료될 수 없다.

2. 블로킹 없이 추가적인 작업을 수행할 수 없다.

3. 여러개의 작업을 병합할 수 없다.

4. 예외 처리를 제공하지 않는다.

CompletableFuture

CompletableFuture 메서드 살펴보기

1. CompletableFuture 생성 메서드

2. 완료 상태 체크 메서드

3. 작업 완료를 위한 메서드

4. 처리 결과 읽기 메서드

5. 여러개의 작업 처리를 위한 메서드

CompletionStage

1. 파이프라이닝 연산을 위한 메서드

첫째, 새로운 단계가 시작되는 방법을 설명한다.

둘째, 새로운 단계가 수행하는 연산에 대해 설명한다.

셋째, 어떤 스레드가 새로운 단계를 실행하는지 설명한다.

2. 예외 처리를 위한 메서드

CompletableFuture 사용시 주의사항

Parallel Stream

Splitting Costs(분할 비용)

Merging Costs(병합 비용)

독립적인 작업

NQ Model

CompletableFuture vs Parallel Stream

실제로 적용하기

더 공부해야할 부분

참고자료

Further Reading

Java - 자바 IO, NIO

Java - 자바에서 파일 읽어오기

Java - 왜 equals()와 hashCode()는 함께 오버라이딩 해야할까 ?

Trending Tags