Detail View

A Machine Learning Framework for Predicting and Generating Complex Fragrances based on Olfactory Receptor Docking Simulations
Citations

WEB OF SCIENCE

Citations

SCOPUS

Metadata Downloads

DC Field Value Language
dc.contributor.advisor 최지웅 -
dc.contributor.author Keonseok Lee -
dc.date.accessioned 2026-01-23T10:57:22Z -
dc.date.available 2026-01-24T06:00:38Z -
dc.date.issued 2026 -
dc.identifier.uri https://scholar.dgist.ac.kr/handle/20.500.11750/59732 -
dc.identifier.uri http://dgist.dcollection.net/common/orgView/200000948863 -
dc.description Bio-inspired AI, Olfactory Receptor, Docking Simulation, Odor Mixture, Fragrance Generation -
dc.description.abstract Olfaction is a fundamental sensory modality that enables humans to navigate and interpret the vast chemical complexity of their environment. However, it remains computationally challenging due to the combinatorial nature of chemical molecules. This complexity is further amplified in odor mixtures, where components interact non-linearly to produce phenomena such as masking and suppression. Existing deep learning approaches, particularly Graph Neural Networks (GNNs), have shown promise in single-molecule tasks but often struggle with complex mixtures. These black-box models require massive datasets and computational resources to approximate interaction rules. Consequently, they often lack both biological interpretability and computational efficiency. To address these limitations, this thesis presents a lightweight, bio-inspired framework that explicitly mimics the peripheral mechanisms of the olfactory system. Instead of relying solely on data-driven embeddings, we utilize large-scale molecular docking simulations to model the binding interactions between odorants and a panel of 407 human olfactory receptors (ORs). The core innovation of our approach lies in incorporating the Competitive Hill–Langmuir equation directly into the neural network architecture to explicitly model competitive binding. This structural constraint allows the model to capture the physics of mixture interactions as specific biochemical events at the receptor level. On the Odor-pair benchmark, the proposed framework achieves an AUROC of 0.7433, demonstrating predictive performance comparable to state-of-the-art GNN baselines. Notably, this accuracy is attained using approximately 80% fewer parameters than the baseline, confirming that incorporating biological inductive biases significantly enhances parameter efficiency. Furthermore, we demonstrate that this latent-label autoencoder supports an inverse generation pipeline, capable of reconstructing molecular combinations that match a target olfactory profile. By unifying structural biology with machine learning, this work provides a scalable and interpretable framework that calibrates effective biophysical states through structural guidance, offering a robust solution for both modeling and designing complex fragrances.

Keywords: Bio-inspired AI, Olfactory Receptor, Docking Simulation, Odor Mixture, Fragrance Generation|후각은 인간이 환경의 복잡한 화학적 신호를 인지하고 상호작용하는 데 필수적인 근본적 감각 체계이다. 하지만 화학 분자의 복잡한 조합 특성으로 인해 이를 계산적으로 모델링하는 데에는 어려움이 따른다. 이러한 복잡성은 단일 분자가 아닌 혼합물에서 더욱 증폭되는데, 이는 구성 성분 간의 비선형적 상호작용이 마스킹이나 억제와 같은 현상을 유발하기 때문이다. 기존의 딥러닝 접근법, 특히 그래프 신경망(GNN)은 단일 분자 작업에서는 유의미한 성과를 보였으나 복잡한 혼합물을 다루는 데에는 한계를 보인다. 이러한 '블랙박스' 모델은 상호작용 규칙을 학습하기 위해 방대한 데이터와 계산 자원을 소모하며, 생물학적 해석 가능성이 낮고 효율성이 부족하다는 한계가 있다.
이러한 한계를 극복하기 위해, 본 논문은 후각 시스템의 말초 기전을 명시적으로 모사한 경량화된 생체 모방형 프레임워크를 제안하였다. 본 연구는 데이터기반 임베딩에 의존하는 기존 방식 대신, 대규모 분자 도킹 시뮬레이션을 활용하여 냄새 분자와 407개의 인간 후각 수용체(OR) 간의 결합 상호작용을 모델링하였다. 제안하는 접근법의 핵심은 Competitive Hill-Langmuir 방정식을 신경망 아키텍처에 직접 통합하여 경쟁적 결합 기전을 명시적으로 구현하였다는 점이다. 이러한 구조적 제약을 도입함으로써, 본 모델은 혼합물 간의 상호작용 물리학을 수용체 수준의 구체적인 생화학적 기전으로 포착할 수 있게 되었다.
Odor-pair 벤치마크 실험 결과, 제안된 프레임워크는 0.7433의 AUROC를 달성하여 최신 GNN 베이스라인 모델과 대등한 예측 성능을 입증하였다. 특히 베이스라인 대비 약 80% 감소된 파라미터만으로 이러한 정확도를 달성하였는데, 이는 생물학적 귀납 편향의 도입이 모델의 효율성을 획기적으로 향상시킴을 시사한다. 더 나아가, 본 연구는 잠재-레이블 오토인코더를 통해 목표 향기 프로필과 일치하는 분자 조합을 재구성하는 역생성 파이프라인을 함께 구현하였다. 구조 생물학을 기계 학습과 통합한 본 연구는 구조적 가이드를 통해 유효 생체물리학적 상태를 교정함으로써, 복잡한 향을 예측하고 설계하기 위한 확장 가능하고 해석 가능한 솔루션을 제시한다.

핵심어: 생체 모방 인공지능, 후각 수용체, 도킹 시뮬레이션, 냄새 혼합물, 향 생성
-
dc.description.tableofcontents List of Contents
ABSTRACT i
List of Contents ii
List of Tables iv
List of Figures v
Ⅰ. Introduction 1
Ⅱ. Related work 3
2.1. Olfactory Perception Prediction 3
2.1.1 Functional-group and physicochemical-feature based models 3
2.1.2 Graph neural networks and the Mixture Bottleneck 4
2.2. Biological and Computational Foundations 4
2.2.1 The Receptor Code as a Computational Basis 5
2.2.2 Receptor-level mechanisms underlying mixture nonlinearity 5
2.2.3 Structural Modeling as a Proxy for Binding Parameters 6
Ⅲ. Method 7
3.1 Overview of the Framework 7
3.2. Constructing the OR-based Representation (Data Preparation) 8
3.2.1 Receptor and Ligand Preparation Human Olfactory Receptor Panel and Structural Modeling 9
3.2.2 Docking Simulation and Feature Extraction High-Throughput Docking Protocol 10
3.3. Bio-inspired Perception Prediction Model 10
3.3.1 Co-prediction of Thermodynamic Parameters 11
3.3.2 Biological Aggregation: Competitive Hill-Langmuir Integration 11
3.3.3 Perceptual Readout Network 12
3.3.4 Training Objective 13
3.4. Fragrance Generation and Recommendation 13
3.4.1 Latent-Label Autoencoder for Manifold Constraints 13
3.4.2 Combinatorial Reconstruction via Greedy Search 14
3.4.3 Application to Recommendation 15
Ⅳ. Results 16
4.1. Validation of Binding Features 16
4.1.1. Predictive Power of Docking Protocols 16
4.1.2. Interpretability via Physical Constraints 17
4.1.3. Alignment with Dose-Response Parameters 18
4.2. Perception Prediction Performance 18
4.2.1 Odor-pair dataset and evaluation protocol 18
4.2.2 Predictive Accuracy and Parameter Efficiency 19
4.2.3 Computational Scaling with Mixture Complexity 19
4.3. Evaluation of Fragrance Generation 20
4.3.1. Target Reconstruction in Receptor Space 20
4.3.2. Discrete Mixture Recovery 21
4.3.3. Forward Consistency and Design Validity 21
4.3.4. Implications for Rational Design 22
Ⅴ. Conclusion 23
References 24
-
dc.format.extent 26 -
dc.language eng -
dc.publisher DGIST -
dc.title A Machine Learning Framework for Predicting and Generating Complex Fragrances based on Olfactory Receptor Docking Simulations -
dc.title.alternative 후각 수용체 도킹 시뮬레이션 기반 복합 향 예측 및 생성 기계 학습 프레임워크 -
dc.type Thesis -
dc.identifier.doi 10.22677/THESIS.200000948863 -
dc.description.degree Master -
dc.contributor.department Artificial Intelligence Major -
dc.contributor.coadvisor Jinhyun So -
dc.date.awarded 2026-02-01 -
dc.publisher.location Daegu -
dc.description.database dCollection -
dc.citation XT.AM 이14 202602 -
dc.date.accepted 2026-01-19 -
dc.contributor.alternativeDepartment 학제학과인공지능전공 -
dc.subject.keyword Bio-inspired AI, Olfactory Receptor, Docking Simulation, Odor Mixture, Fragrance Generation -
dc.contributor.affiliatedAuthor Keonseok Lee -
dc.contributor.affiliatedAuthor Ji-Woong Choi -
dc.contributor.affiliatedAuthor Jinhyun So -
dc.contributor.alternativeName 이건석 -
dc.contributor.alternativeName Ji-Woong Choi -
dc.contributor.alternativeName 소진현 -
Show Simple Item Record

File Downloads

  • There are no files associated with this item.

공유

qrcode
공유하기

Total Views & Downloads