> For the complete documentation index, see [llms.txt](https://incheol-jung.gitbook.io/docs/llms.txt). Markdown versions of documentation pages are available by appending `.md` to page URLs; this page is available as [Markdown](https://incheol-jung.gitbook.io/docs/q-and-a/java/undefined.md).

# 병렬처리를 이용한 이미지 리사이즈 개선

## 병렬처리를 이용한 이미지 리사이즈 개선

<figure><img src="/files/0ysO08QqAHdi82KInFYI" alt=""><figcaption><p><a href="https://youtu.be/dzrJRLT1RZw">https://youtu.be/dzrJRLT1RZw</a></p></figcaption></figure>

### 원본 이미지 사용

* 현재는 사용자의 원본 이미지를 그대로 S3에 업로드해서 사용해왔다
* 그렇다보니 네트워크 / 디바이스 성능에 따라 페이지 렌더링 되면서 이미지가 늦게 로드 되는 경우가 많았다
* 그리고 아이폰의 사진은 고화질이라 3MB 이상인 경우가 많았다
* 원본 이미지를 그대로 사용하기엔 컨텐츠가 늦게 로드 되다 보니 앱에 대한 퀄리티로 이어졌다
* 이미지 로드 개선은 다른 방법으로 개선할 수도 있다
* 스켈레톤 이미지나 프론트에서 자체 캐시를 사용할수도 있었지만 지금 당장 프론트쪽에 업무를 추가할순 없었다..

### 이미지 업로드 개선이 필요하다!

* 현실적으로 지금 당장 빠르게 해결할 방법은 백엔드쪽에서 원본 이미지를 경량화하는 하는수 밖에 없다..
* 단, 페이지마다 사용하는 이미지 사이즈가 다르기 때문에 4가지 유형으로 리사이즈해서 프론트에서 적절한 유형의 리사이즈 이미지를 사용하도록 한다 (SMALL, MEDIUM, LARGE, XLARGE)
* 추가적으로 이미지 업로드 기능이 원본 이미지 경량화 로직으로 인해 서비스 사용성에 영향이 있으면 안된다

### 이미지 리사이즈 플로우

<figure><img src="/files/0n3TFBMO7gFz90BYqdXt" alt=""><figcaption></figcaption></figure>

* 기존에 사용하던 이미지 업로드 API는 그대로 유지하되 이미지가 업로드 되면 메시지큐에 리사이즈 요청 메시지를 전송한다
* 컨슈머는 업로드된 원본 이미지를 확인하고 4가지 유형으로 리사이즈를 수행한다
* 프론트에서는 규칙에 따라 리사이즈된 이미지를 사용하게 된다

### 이미지 리사이즈 컨슈머 구현 로직

<figure><img src="/files/f2simS8yeT7jUlQg2Hda" alt=""><figcaption></figcaption></figure>

#### 1. 사이즈별 이미지 업로드

* 4 가지 유형으로 리사이즈 하여 S3에 업로드 한다
* 각각의 리사이즈된 이미지는 HashMap에 저장하여 추후에 데이터베이스에 저장할 때 사용된다

#### 2. 리사이즈 이미지 업로드 내역 저장

* 이미지 업로드가 완료되면 S3에 저장한 이미지 경로를 사이즈별로 취합하여 한번에 데이터베이스에 저장한다

## 🤨 성능을 좀 더 개선할 수 없을까?

* 기존 로직은 사이즈 별로 루프문을 순회하면서 순차적으로 원본 이미지를 리사이즈하며 업로드했다
* 사이즈 별로 업로드 하는 로직은 개별 쓰레드로 독립적으로 수행해도 된다
* 사이즈 별로 업로드 하는 로직은 병렬로 수행하고 추후 데이터베이스에 저장할 데이터만 취합하여 저장하면 되겠다

### 그럼 수행시간을 측정해보자

<figure><img src="/files/YLBaTC3b7cwnjzUmsVsv" alt=""><figcaption></figcaption></figure>

> 객관적인 데이터를 측정하기 위해 이미지 업로드 로직을 2초 정도 시간을 소요하도록 로직을 수정하였다

#### stream 사용시 (Total 소요시간 : 8초)

```jsx
Image Resize upload start!!! time : 2022-12-18T20:55:21
Image Resize upload end!!! time : 2022-12-18T20:55:29
```

#### parallelStream 사용시 (Total 소요시간 : 2초)

```jsx
Image Resize upload start!!! time : 2022-12-18T21:31:54
Image Resize upload end!!! time : 2022-12-18T21:31:56
```

##

## 🤯 병렬처리시 주의해야 할 부분은?

###

### 병렬처리가 항상 정답은 아니다!!

* 병렬처리는 목록을 멀티 쓰레드로 병렬처리 하므로 성능적으로 무조건 유용하다고 생각할 수 있다
* 하지만 이는 잘못된 생각이다
* 병렬처리는 잘못 사용할 경우 오히려 독이 될수 있다
* 예를 들어, 병렬처리 하는 로직에서 공유 데이터를 가공하는 경우가 있으면 이는 오히려 성능상 더 느려지는 효과가 나타날 수 있다.
* 쓰레드간 작업한 데이터를 공유 데이터에 병합하면서 동기화해주는 작업이 생각보다 많은 부하를 발생하게 된다
* 그리고 또한 단순하게 parallelStream을 사용하게 되면 애플리케이션의 전체적인 성능을 떨어뜨릴수 있게 된다
* 왜냐하면 자바 애플리케이션은 멀티 쓰레드로 동작하기 때문에 일정량의 쓰레드를 할당하며 사용자 요청을 병렬로 처리한다.
* 그래서 parallelStream을 사용하게 되면 애플리케이션에서 할당해 놓은 쓰레드를 임의로 끌어쓰기 때문에 실제로 사용자 요청에 대한 처리를 수행할 쓰레드가 부족할 수 있다

### parallelStream 을 사용할때는 쓰레드풀을 지정하라!

<figure><img src="/files/CuvsJLBp2Q2e5vWIJ9sY" alt=""><figcaption></figcaption></figure>

* parallelStream을 사용하게 되면 가용 가능한 쓰레드를 임의로 사용하기 때문에 병렬처리에 사용할 쓰레드 갯수는 지정해서 수행하는게 효율적이다
* ForkJoinPool을 사용하여 가용할 쓰레드 갯수를 제한할 수 있다.
* 현재는 이미지 리사이즈 유형만큼만 병렬처리하기 때문에 리사이즈 컬렉션 갯수만큼 쓰레드풀을 지정하였다

<figure><img src="/files/yqTS46oouZ6r8LAYtS9R" alt=""><figcaption></figcaption></figure>

## 커스텀 쓰레드 풀을 지정하면 되지 않을까?

* parallelStream은 기본적으로 글로벌 FolkJoinPool 쓰레드를 사용한다

> For applications that require separate or custom pools, a `ForkJoinPool` may be constructed with a given target parallelism level; by default, equal to the number of available processors.\
> \
> 출처 : <https://docs.oracle.com/javase/8/docs/api/java/util/concurrent/ForkJoinPool.html>

* 그렇기 때문에 커스텀 쓰레드풀을 생성해서 수행해도 동작하지 않는다
* 그래도 눈으로 보는게 좋으니 실제로 확인해보자!
* 우선 커스텀 쓰레드풀을 생성한다

```java
@Configuration
public class ResizeThreadPoolConfigure {
	@Bean(name = "testThreadPoolTaskExecutor")
	public Executor resizeThreadPoolTaskExecutor() {
		ThreadPoolTaskExecutor taskExecutor = new ThreadPoolTaskExecutor();
		taskExecutor.setCorePoolSize(3);
		taskExecutor.setMaxPoolSize(20);
		taskExecutor.setQueueCapacity(15);
		taskExecutor.setThreadNamePrefix("CUSTOM_RESIZE_THREAD-");
		taskExecutor.initialize();
		return taskExecutor;
	}
}
```

* 그럼 커스텀으로 생성한 쓰레드풀로 병렬스트림을 수행해보자
* 1부터 4까지 병렬 스트림으로 요소당 1초 인터벌을 두었다

```java

@Component
public class TestThread {
	@Autowired
	@Qualifier("testThreadPoolTaskExecutor")
	Executor executor;

	public void test() {
		executor.execute(() -> IntStream.rangeClosed(1, 4)
			.parallel()
			.peek(i -> {
				try {
					TimeUnit.SECONDS.sleep(1);
				} catch (InterruptedException e) {
					throw new RuntimeException(e);
				}
			}).forEach(i -> log.info("ParallelStream() -> {}", i)));
	}
}
```

* 결과를 확인해보자

<div align="left"><figure><img src="/files/DthDO3SrkTecaO1QFuJz" alt=""><figcaption></figcaption></figure></div>

* 커스텀 쓰레드풀로 실행된건 하나 뿐이었고 나머지는 commonPool의 ForkJoinPool 쓰레드를 사용한것을 확인할 수 있다

### 그럼 ForkJoinPool을 어디에 선언해야 하는가?

* ForkJoinPool을 지역변수로 설정할 수도 있고 static으로 설정할 수도 있다

```java
public void test() throws ExecutionException, InterruptedException {
	ForkJoinPool forkJoinPool = new ForkJoinPool(2);
	forkJoinPool.submit(() -> IntStream.rangeClosed(1, 4)
		.parallel()
		.peek(i -> {
			try {
				TimeUnit.SECONDS.sleep(1);
			} catch (InterruptedException e) {
				throw new RuntimeException(e);
			}
		}).forEach(i -> log.info("ParallelStream() -> {}", i))).get();
	forkJoinPool.shutdown();
}
```

* 그런데 지역변수로 설정한다는건 결국 ForkJoinPool 쓰레드가 생성되기 때문에 트래픽이 많을 경우 그 만큼 가용할 수 있는 쓰레드는 줄어들게 된다

{% hint style="info" %}
로컬에 생성한 ForkJoinPool은 shutdown을 수행해야 한다!

\
ForkJoinPool의 종료 시점은 쓰레드 당 60초 이후에 반납된다

만약 new ForkJoinPool(4) 으로 생성하였다면 4초 이후에 활성화된 쓰레드가 반납된다

그렇기 때문에 동시에 트래픽이 몰려서 지역변수로 ForkJoinPool을 생성하게 된다면 가용할 수 있는 쓰레드가 없을수도 있다. 그러므로 자동으로 반납되기 전에 shutdown()을 사용해서 쓰레드를 종료시키는게 중요하다<br>

참고 : <https://meetup.nhncloud.com/posts/291>
{% endhint %}

* 그리고 우리가 쓰레드 그룹을 생성하는건, 애플리케이션에서 수행되는 쓰레드 가용성을 보장하기 위해서이다
* 그러므로 static으로 설정하는게 우리가 의도한 목적과 일치할 수 있다
* 그러나 static으로 설정할 때 중요한건 size 설정이다
* 특정 쓰레드만 수행되기 때문에 size를 너무 적게 설정하면 해당 기능의 수행시간이 딜레이 될 수 있다

```java

// size는 트래픽을 고려하여 신중히 결정할것!!
private static ForkJoinPool forkJoinPool = new ForkJoinPool(8);

```

### 실제로 static과 지역변수로 설정했을때 실행시간은 얼마나 차이가 날까?

#### Jmeter를 활용한 테스트

> 테스트 선행 조건
>
> 1초 마다 5번씩 2개의 요청을 호출한다
>
> ForkJoinPool 사이즈는 2개로 고정하였다

#### 지역변수로 수행했을때 결과

<figure><img src="/files/98Zy0WzttfU8gkTGzBlJ" alt=""><figcaption></figcaption></figure>

#### 전역변수로 수행했을때 결과

<figure><img src="/files/rNgKsVAiIzWDip94woen" alt=""><figcaption></figcaption></figure>

#### 차이 비교

<figure><img src="/files/C0kRLyvro83GZTiTpcrt" alt=""><figcaption></figcaption></figure>

* 지역변수로 설정했을땐 평균 2.8초 소요되었고, 전역변수로 설정했을땐 4초 이상이었다
* 사이즈를 적게 잡은것도 있지만 차이를 보여주기 위해 일부로 적게 설정하였다
* 이처럼 사이즈에 따라서 성능에 영향을 줄수 있으니 주의해야 한다!!

{% hint style="info" %}
💡 **모든 기술은 양면성을 가지고 있다.** \
새로운 기술을 도입하기 전에 항상 공식문서를 확인하거나 다양한 사용 사례를 살펴보고 우리 서비스에 적합한지 확인을 해야 한다
{% endhint %}