Tiered Memory Management: Access Latency is the Key! - SOSP'24

재미있는 논문!

CXL 과 같은 두 가지 tier의 메모리가 있을 경우, 그냥 빠른 메모리가 좋으니 hot data를 다 때려박는 것보다 섞어서 쓰는 게 좋다는 논문. Memory hierarchy를 따르면 당연히 hot data를 젤 빠른 cache에 놓고 쓰는 게 맞는데, hot data를 적당히 느린 메모리에도 섞어서 배치하면 성능이 올라간다는 것이다. 참 우리의 직관을 깨는 논문이 아닐까 싶다.

여튼간 그걸 구현한 게 Colloid이고, 그 "적당히" 섞기 위해 Binary search와 비슷한 방식으로 접근한다. 이 적정 포인트는 매번 다를 수 있기 때문에 계속 찾아주어야 한다.

단 이 논문은 진짜 CXL 메모리가 없어서 다른 NUMA Far Memory로 실험했다. 이게 결과에 영향을 미칠 수도..?

여튼간 memory hierarchy를 넘어서 이 메모리 계층 사이서 load balancing 을 하는 느낌의 논문이다.