Cited time in webofscience Cited time in scopus

Analyzing Causes of Metadata Service Overheads in Ceph File System

Title
Analyzing Causes of Metadata Service Overheads in Ceph File System
Alternative Title
Ceph 파일 시스템의 메타데이터 성능 오버헤드의 원인에 대한 분석
Author(s)
Hojun Kim
DGIST Authors
Kim, HojunLee, SungjinKim, Yeseong
Advisor
이성진
Co-Advisor(s)
Yeseong Kim
Issued Date
2021
Awarded Date
2021/08
Type
Thesis
Subject
Distributed File System, Ceph File System
Description
Distributed File System, Ceph File System
Abstract
Distributed File System (DFS) is a popular file system in High-Performance Computing (HPC) due to the demand for a petabyte-scale file system. Among several DFSs, Ceph File System (CephFS) is one of the most widely adopted DFS. It shows advantages in service availability and data reliability. However, CephFS suffers from severe performance degradation when processing requests about a large number of files in HPC environment. The performance degradation is caused by metadata service overheads in CephFS. In this paper, we discovered CephFS metadata service overheads in terms of performance and scalability through metadata performance experiments. Also, we analyzed the causes of overheads by doing additional experiments. The causes of metadata service overheads in CephFS are decoupled metadata service and strict client cache policy in a multi-client environment. We verified the causes of overheads by showing that removing causes of overheads in CephFS improves performance greatly compared to the existing CephFS. Therefore, we expect that this work can help improve the performance degradation of CephFS in the near future.|최근 고성능 컴퓨팅과 같은 분야에서 페타바이트 크기의 파일 시스템을 요구하면서 분산 파일 시스템은 고성능 컴퓨팅 분야에서 널리 쓰이는 파일시스템이 되었다. 그 중에서도 Ceph 파일 시스템은 서비스 가용성과 데이터 안정성 덕분에 가장 널리 쓰이는 분산 파일 시스템 중 하나이다. 하지만 Ceph 파일 시스템은 고성능 컴퓨팅 환경에서의 많은 수의 파일에 대한 요청을 처리함에 있어 심각한 성능 저하가 발생한다는 문제점이 있다. 이는 Ceph 파일 시스템에 존재하는 메타데이터 서비스 오버헤드에 의한 성능 저하이며 이 논문에서는 메타데이터 성능 실험을 통해 Ceph 파일 시스템의 성능 측면과 확장성 측면에서 메타데이터 서비스 오버헤드가 존재함을 발견하였다. 또한 추가적인 실험을 통해 이 오버헤드들의 원인을 분석하였으며 분리된 메타데이터 서비스와 다중 클라이언트 환경에서의 엄격한 클라이언트 캐시 정책이 오버헤드의 원인인 것으로 나타났다. 우리는 Ceph 파일 시스템에서 오버헤드의 원인들을 제거했을 때 성능이 기존의 Ceph 파일 시스템보다 크게 개선됨을 보여줌으로써 오버헤드의 원인을 증명하였으며 이 논문의 결과가 추후에 Ceph 파일 시스템의 성능 저하를 개선하는데 있어 도움이 될 것이라 기대한다.
Table Of Contents
I. Introduction 1
II. Background 4
2.1 Distributed File Systems 4
2.2 RADOS Storage Cluster 5
2.3 Ceph File System 7
III. Motivation 9
3.1 Limited Performance Scalability of CephFS 9
3.2 Low Single MDS Performance 12
IV. Performance Analysis 13
4.1 Experiment Environment 13
4.2 Decoupled Metadata Service 14
4.3 Strict Client Cache Policy 17
V. Discussion 19
5.1 Solutions for Metadata Service Overheads 19
VI. Related Works 21
VII. Conclusions 23
References 24
요약문 26
URI
http://dgist.dcollection.net/common/orgView/200000497155

http://hdl.handle.net/20.500.11750/16603
DOI
10.22677/thesis.200000497155
Degree
Master
Department
Information and Communication Engineering
Publisher
DGIST
Related Researcher
  • 이성진 Lee, Sungjin
  • Research Interests Computer System; System Software; Storage System; Non-volatile Memory; Flash-based SSD; Distributed Storage Systems
Files in This Item:
200000497155.pdf

200000497155.pdf

기타 데이터 / 3.16 MB / Adobe PDF download
Appears in Collections:
Department of Electrical Engineering and Computer Science Theses Master

qrcode

  • twitter
  • facebook
  • mendeley

Items in Repository are protected by copyright, with all rights reserved, unless otherwise indicated.

BROWSE