Cited time in webofscience Cited time in scopus

Full metadata record

DC Field Value Language
dc.contributor.advisor Kim, Min Soo -
dc.contributor.author Kim, Hye Rin -
dc.date.accessioned 2017-05-10T08:52:11Z -
dc.date.available 2016-08-18T00:00:00Z -
dc.date.issued 2016 -
dc.identifier.uri http://dgist.dcollection.net/jsp/common/DcLoOrgPer.jsp?sItemId=000002296559 en_US
dc.identifier.uri http://hdl.handle.net/20.500.11750/1434 -
dc.description.abstract Primer design is a fundamental technique that is widely used for polymerase chain reaction (PCR). Although many methods have been proposed for primer design, they re-quire a great deal of manual effort to generate feasible and valid primers, including homol-ogy tests on off-target sequences using BLAST-like tools. That approach is inconvenient for many target sequences of quantitative PCR (qPCR) due to considering the same strin-gent and allele-invariant constraints. In this dissertation, we propose an entirely new meth-od that overcomes these drawbacks.
In the first part of this dissertation, we propose the method called MRPrimer that can design all feasible and valid primer pairs existing in a DNA database at once, while simultaneously checking a multitude of filtering constraints and validating primer specifici-ty. Furthermore, MRPrimer suggests the best primer pair for each target sequence, based on a ranking method. Through qPCR analysis using 343 primer pairs and the corresponding sequencing and comparative analyses, we showed that the primer pairs designed by MRPrimer are very stable and effective for qPCR. In addition, MRPrimer is computation-ally efficient and scalable, and therefore useful for quickly constructing an entire collection of feasible and valid primers for frequently updated databases like RefSeq. Furthermore, we suggest that MRPrimer can be utilized conveniently for experiments requiring primer design, especially real-time qPCR.
Existing web servers for primer design have major drawbacks, including requiring the use of BLAST-like tools for homology tests, lack of support for ranking of primers, TaqMan probes, and simultaneous design of primers against multiple targets. Due to the large-scale computational overhead, the few web servers supporting homology tests use heuristic approaches or perform homology tests within a limited scope. The primer pairs designed by MRPrimer are very stable and effective in qPCR experiments. However, alt-hough MRPrimer can design very high-quality primers, routine use is inconvenient because it runs on a cluster of computers and requires several hours of runtime when the filtering constraints are adjusted.
In the second part of this dissertation, we propose MRPrimerW, the online version of MRPrimer, allows users to design the best primers quickly in a web interface, without requiring a MapReduce cluster or a long computation, as in Google’s search system. It per-forms complete homology testing, supports batch design of primers for multi-target qPCR experiments, supports design of TaqMan probes, and ranks the resulting primers to return the top-1 best primers to the user. To ensure high accuracy, we adopted the core algorithm of MRPrimer, but completely redesigned it to allow users to receive query results quickly in a web interface, without requiring a MapReduce cluster or a long computation. MRPrimerW provides primer design services and a complete set of 341,963,135 in-silico validated primers covering 99% of human and mouse genes.
In summary, we have proposed a new method for primer design that overcomes most of drawbacks of existing methods. For an entire DNA database, we have proposed MRPrimer that can design all possible feasible and valid primer pairs through simultane-ously checking a multitude of filtering constraints and validating primer specificity. For user query from web interface, we have proposed MRPrimerW that performs complete homology tests, supports batch designing for qPCR, supports TaqMan probe design, and supports ranking of primers. We believe that the proposed methods will be contribute to increasing the efficiency and specificity of experiments involving PCR. ⓒ 2016 DGIST
-
dc.description.tableofcontents Ⅰ. INTRODUCTION 1 --
1.1 Background 1 --
1.2 Motivation and Objectives 7 --
1.3 Structure of thesis 10 --
Ⅱ. REALTED WORK 12 --
2.1 Batch-style primer design method 12 --
2.2 Web-based primer design method 14 --
Ⅲ. MRPRIMER: Batch-style primer design method 17 --
3.1 Overview 17 --
3.2 MRPrimer algorithm 21 --
3.2.1 Step1:.Candidate primer generation round 21 --
3.2.2 Step2: Single filtering round 23 --
3.2.3 Step3: 5’ cross-hybridization filtering round 25 --
3.2.4 Step4:.General cross-hybridization filtering round 27 --
3.2.5 Step5: Duplicate removing round 32 --
3.2.6 Step6: Pair filtering round 33 --
3.2.7 Step7. Ranking round 36 --
3.3 Experiments for biological validation 38 --
3.3.1 Data and methods 38 --
3.3.2 qPCR analysis 42 --
3.3.3 Comparative analysis 44 --
3.4 Experiments for computational performance 46 --
3.4.1Data and setup 46 --
3.4.2 Results of the completeness and effective ranking system 46 --
3.4.3 Results of the coverage and specificity 49 --
3.4.4 Results of the computational efficiency and scalability 52 --
Ⅳ. MRPRIMERW: Web-based primer design method --
4.1 Overview 55 --
4.2 Offline processing part 57 --
4.3 Index building part 62 --
4.4 Online processing part 66 --
4.5 Web interface 70 --
Ⅴ. CONCLUSIONS 76
-
dc.format.extent 102 -
dc.language eng -
dc.publisher DGIST -
dc.subject MapReduce -
dc.subject primer design -
dc.subject qPCR -
dc.subject homology test -
dc.subject 맵리듀스 -
dc.subject 프라이머 디자인 -
dc.subject 중합효소 연쇄반응법 -
dc.subject 상동성 테스트 -
dc.title A MapReduce-based method for the thorough and rapid design of high-quality primers for qPCR experiments -
dc.title.alternative 맵리듀스 기반의 특이성 조건을 만족하는 유효한 모든 프라이머들을 빠르게 디자인하는 방법 -
dc.type Thesis -
dc.identifier.doi 10.22677/thesis.2296559 -
dc.description.alternativeAbstract 프라이머 디자인은 중합효소 연쇄반응법 (PCR)에 있어서 가장 기본이 되는 기술이며 일반적으로 사용되는 기술이다. 많은 방법들이 프라이머 디자인을 위해 제안되었지만, 이들은 유효한 프라이머를 디자인 하기 위해 BLAST와 같은 추가적인 툴을 사용하여 비 표적 서열에 대한 상동성 테스트를 포함하여 많은 노력과 주의를 필요로 한다. 또한, 이 방법들은 같은 엄격한 제약 조건을 만족하는 다수의 표적 서열에 대한 프라이머를 필요로 하는 정량적 중합효소 연쇄반응법 (qPCR)에 적합하지 않다. 이에 본 학위논문에서는 기존 방법들의 단점을 극복한 완전히 새로운 방법을 제안한다.
본 학위논문의 첫 번째 파트에서는 기존 연구들의 문제점들을 모두 해결하기 위해 맵리듀스 기반의 완전한 프라이머 디자인 방법인 MRPrimer를 제안한다. MRPrimer는 주어진 서열 데이터베이스에서 사용자에 의해 주어진 여러 제약조건들을 만족하면서 동시에 상동성 테스트를 통과한 모든 가능한 프라이머들을 찾는 것이다. MRPrimer는 범용 컴퓨터들의 클러스터와 그 클러스터 상에서 작동하는 7단계로 구성된 맵리듀스 알고리즘으로 구성되어 프라이머 디자인 시 특이성 검증을 동시에 수행하는 것은 기존의 방법들이 제공하지 못했던 특징이며, 상기 특이성 검증 조건은 다시 5‘ crosshybridization filtering 조건과 general cross-hybridization filtering 조건으로 구성된다. 또한, 주어진 DNA 서열 데이터베이스 상에 존재하는 모든 적합한 프라이머 쌍들을 빠짐없이 구하며, coverage가 1인 primer들 뿐만 아니라 coverage가 1보다 큰 프라이머들도 모두 구하는 것을 특징으로 한다. 마지막으로, 사용자가 결과 프라이머들 중 생물학적 실험의 성공률이 높은 프라이머들을 쉽게 선택할 수 있도록 랭킹 기능을 지원하는 특징을 가진다. 343개의 프라이머 쌍에 대해 정량적 중합효소 연쇄반응법 분석과 시퀀싱 및 비교 분석을 통해 MRPrimer로 디자인한 프라이머들은 매우 안정적이고 효과적인 것으로 나타났다. 또한, MRPrimer는 효율적이고 확장성이 높아 RefSeq 데이터베이스와 같이 자주 업데이트되는 데이터베이스에 대해 유효한 프라이머를 디자인 하는데 매우 유용하다. 프라이머 디자인에 대한 기존의 웹 사이트들은 상동성 테스트를 위한 BLAST와 같은 추가의 툴 사용, 프라이머 랭킹 미지원, TaqMan probe 미지원, 그리고 다수의 표적에 대해 동시에 디자인 하지 못하는 등 여러 단점을 가지고 있다. 또한, 대규모 계산에 대한 오버헤드 때문에 몇 웹 사이트들은 휴리스틱한 방법을 사용하거나, 제한된 범위 내에서 상동성 테스트를 수행한다. MRPrime는 고품질의 프라이머를 디자인 할 수 있지만, 컴퓨터 클러스터에서 작동되고 제약조건을 조정할 때마다 수 시간의 런타임이 요구되기 때문에 일상적인 사용이 불편하다.
본 학위논문의 두 번째 파트에서는 구글 검색 시스템과 같이 맵리듀스의 클러스터나 긴 계산을 요구하지 않고 웹 인터페이스에서 사용자가 최고의 프라이머를 디자인 할 수 있도록 MRPrimer의 온라인 버전인 MRPrimerW를 제안한다. MRPrimerW는 완전한 상동성 테스트를 지원하고, 정량적 중합효소 연쇄반응법 실험을 위해 다수의 표적에 대해 프라이머 디자인을 제공하며 TaqMan probe 디자인을 지원하고, 결과 프라이머의 순위를 계산하여 가장 순위가 높은 top-1의 프라이머를 제공한다. 높은 정확성을 보장하기 위해 MRPrimer의 핵심 알고리즘을 적용하면서, 사용자가 웹 인터페이스를 통해 빠르게 질의에 대해 결과를 얻을 수 있다. MRPrimerW는 프라이머 디자인 서비스를 제공하며 사람과 쥐 전체 유전자의 99%를 커버하는 341,963,135개의 유효한 프라이머 세트를 갖고있다.
요약하여, 본 학위논문에서는 기존 방법의 단점을 극복한 프라이머 디자인을 위한 새로운 방법들을 제안하였다. 대규모 DNA 데이터베이스의 경우, 동시에 다수의 제약조건을 고려하고 특이성 검증을 통해 가능한 모든 유효한 프라이머 쌍들을 디자인 할 수 있는 MRPrimer를 제안하였다. 또한, 웹 인터페이스에서 주어진 사용자의 질의에 대해 완전한 상동성 테스트를 지원하고, 정량적 중합효소 연쇄반응법 실험을 위해 다수의 표적에 대해 프라이머 디자인을 제공하며 TaqMan probe 디자인을 지원하고 프라이머 랭킹을 지원하는 MRPrimerW를 제안하였다. 제안된 방법들은 중합효소 연쇄반응법을 포함하는 모든 실험에서 그 효율성과 특이성을 높이는데 유용하게 활용 될 수 있는 방법들이라 사료된다. ⓒ 2016 DGIST
-
dc.description.degree Doctor -
dc.contributor.department Information and Communication Engineering -
dc.contributor.coadvisor Koo, Jae Hyung -
dc.date.awarded 2016. 8 -
dc.publisher.location Daegu -
dc.description.database dCollection -
dc.date.accepted 2016-08-18 -
dc.contributor.alternativeDepartment 대학원 정보통신융합공학전공 -
dc.contributor.affiliatedAuthor Kim, Hye Rin -
dc.contributor.affiliatedAuthor Kim, Min Soo -
dc.contributor.affiliatedAuthor Koo, Jae Hyung -
dc.contributor.alternativeName 김혜린 -
dc.contributor.alternativeName 김민수 -
dc.contributor.alternativeName 구재형 -
Files in This Item:
000002296559.pdf

000002296559.pdf

기타 데이터 / 2.14 MB / Adobe PDF download
Appears in Collections:
Department of Electrical Engineering and Computer Science Theses Ph.D.

qrcode

  • twitter
  • facebook
  • mendeley

Items in Repository are protected by copyright, with all rights reserved, unless otherwise indicated.

BROWSE