FBA ebook

From CSBLwiki

(Difference between revisions)
Jump to: navigation, search
(Created page with "Media:FBA e-book.docx 유전체수준의 물질대사 네트워크와 제한 기반 플럭스 균형 분석 제작자 : 고려대학교 환경생태공...")
Line 1: Line 1:
-
[[Media:FBA e-book.docx]]
+
[[Media:FBA e-book.doc]]
유전체수준의 물질대사 네트워크와                    제한 기반 플럭스 균형 분석
유전체수준의 물질대사 네트워크와                    제한 기반 플럭스 균형 분석

Revision as of 06:18, 15 February 2012

Media:FBA e-book.doc

유전체수준의 물질대사 네트워크와 제한 기반 플럭스 균형 분석

제작자 : 고려대학교 환경생태공학부 민병남 감수자 : 고려대학교 생명과학대학 최인걸 교수님

목차 1. Flux Balance Analysis는 무엇?

- 화학공학에서의 FBA
- 시스템 생물학에서의 FBA
- FBA로 할 수 있는 것들

2. Flux Balance Analysis : 모델 만들기

- 준비물
- 유전체 해독(석?) 데이터 얻기
- 데이터 가공
- 수학적 모델로 전환
- 모델 평가, 정제

3. Flux Balance Analysis : 모델로 실험하기

- 기존 모델 다운로드
- COBRA toolbox를 이용하여 유전자 넉아웃(knockout)실험
- 탄소원을 달리하며 생장 속도 측정
- 실제 실험 데이터와 비교

4. Flux Balance Analysis : 한걸음 더

- 구조(rescue) 유전자 검색
- 클로닝할 예비 유전자 검색
- 표준 점수(z score) 
- 물질대사 네트워크 그림으로 나타내기

5. 참고문헌

새로운 목차

- 플럭스 균형 분석이란 무엇인가?
 ㅇ 도입 : 물질대사 네트워크 정의
 ㅇ 반응계수행렬(Stoichiometric matix), sv=0
 ㅇ 선형계획법
 ㅇ 바이오매스 식과 교환 반응(exchange reaction)
 ㅇ 두가지 제한
- 대장균의 플럭스 균형 분석(제한 기반 분석 방법)
 ㅇ 경로별 분석(어떤 구성성분들이 있는지?)
 ㅇ 다양한 탄소원에서의 생장 속도 분석(표준점수 구하는 법)
 ㅇ 실험치와의 비교
 ㅇ 가상 유전자 넉아웃 테스트
 ㅇ 구조 유전자 찾기
- 부록 1. 모델 제작 - 대장균 플럭스 균형 분석 실습
- 부록 2. 모델 응용 - 매트랩을 이용하여 플럭스 균형 분석 실행
- 참고문헌

플럭스 균형 분석의 단편적인 지식들을 모아 하나의 이론으로 재편성하고 나아가 응용 방법을 모색하기 위하여 이 책을 서술하였음.

Chapter 1 도입 - 수학으로 물질대사 분석하기

수학으로 물질대사를 분석한다?

플럭스 균형 분석은 대사 네트워크에서 대사물질(metabolite)의 흐름을 분석하기 위한 수학적인 접근방법입니다.

먼저, 네트워크에 대해 알고계신가요? 네트워크란 특정 계 내의 요소들을 노드로, 그리고 이들의 관계를 엣지로 나타낸 그래프를 의미합니다.

위 그림에서는 노드와 엣지가 각각 3개씩 있고 모든 노드는 서로 연결되어 있습니다. 서로 연결되어 있다는 것은 다시말해 서로 관계가 있다는 뜻입니다.

대사 네트워크(metabolic network)는 위에서 설명한 네트워크의 개념을 물질대사에 적용시킨 것이라고 생각하시면 되겠습니다.

대사네트워크에서 노드는 대사물질을, 엣지는 반응을 나타냅니다. A → B의 반응이 있다면 노드는 A, B가 되고 이 두 물질이 한 반응에 의해 연결되어 있으므로 엣지로 두 노드를 연결합니다.

(그림 : A, B 연결한 것)

아래의 예를 보겠습니다. 1. 2H2O2 → 2H2O + O2이라는 반응식을 대사 네트워크로 표현해봅시다.


위 그림에서는 3개의 대사물질(과산화수소, 물, 산소)과 1개의 반응(2H2O2 → 2H2O + O2)이 3개의 노드와 1개의 엣지로 표현되었습니다. 화살표 방향은 반응의 반응을 보여주고 있습니다.

걱정하지 않으셔도 됩니다. 여기에 관해서는 뒤에서 반응계수행렬을 배울 때 알려드리도록 하겠습니다. 지금은 대사 네트워크의 개념에만 충실하면 되겠습니다!

이번에는 반응 2개를 대사 네트워크로 그려보겠습니다.(다른 예 사용하자) Glucose 6-phosphate ↔ fructose 6-phosphate Fructose 6-phosphate + ATP → fructose 1,6-bisphosphate + ADP (아시다시피 이 반응들은 해당과정의 일부입니다.)



지금까지 주어진 반응들을 네트워크로 그려내는 법을 배웠습니다. 반응들만 가지고 있다면 대사 네트워크를 그리는 것은 어렵지 않습니다. 누군가가 여러분에게 반응들을 던져주고 대사 네트워크를 그려라 라고 한다면 간단합니다. 반응들에 있는 대사물질을 점으로 찍고, 같은 반응에 있으면 이 두 물질을 선으로 연결만 해주면 됩니다. 이것들은 손으로도 할 수 있지만 이미 자동화된 프로그램들이 있기 때문에 우리는 단지 조건만 설정해주고 엔터만 누르면 됩니다.

유전체 수준의 대사 네트워크는 생물체 내에 일어나는 모든 화학반응을 노드와 엣지로 표현한 것을 말합니다. 대장균의 네트워크를 한 번 보겠습니다.


정말 끔찍하게 복잡합니다. 이것으로 무슨 놈의 연구를 할 수 있을지 의심마저 드는군요. 하지만 이 네트워크들은 분명 수많은 생화학적인 연구를 위해 이용되고 있습니다. 어떻게 가능할까요?

기억을 더듬어...

플럭스 균형 분석은 대사 네트워크에서 대사물질(metabolite)의 흐름을 분석하기 위한 수학적인 접근방법입니다.

기억나시나요? 그렇습니다. 이것은 이 책의 가장 첫 문장입니다. 다시 한번 곱씹어 읽어보세요.

키워드는 수학적인 접근방법입니다. 위에서 그려보았던 대사 네트워크는 아무리 봐도 수학과는 무관해 보이는군요. 그러니깐 우리가 해야 할 일은(앞으로 배우게 될 일은) 네트워크를 수학적인 모델로 전환하고 계산을 수행하는 것이고 이것이 바로 플럭스 균형 분석입니다.

지난 몇 십년동안은 플러스 균형 분석은 큰 관심을 받지 못했습니다. 왜냐하면 정확한 대사 네트워크를 얻는 것이 거의 불가능했기 때문이죠. 가장 연구가 활발히 진행된 대장균조차도 지속적으로 새 버전의 대사 네트워크가 나온다니 말 다했습니다. 하지만 최근 서열분석 기술의 발달, 데이터의 축적, 높은 정확도의 유전체 주석달기(annotation)로 보다 정확한 대사 네트워크를 만들 수 있게 되었습니다. 또한, 13C 동위원소를 활용한 흐름체(fluxome) 데이터는 플러스 균형 분석을 통해 나온 결과값을 실험을 통해 검증할 수 있게 해주었습니다.

플럭스 균형 분석은 어디서, 누가, 왜 고안했을까요? Early History Some of the earliest work in Flux Balance Analysis dates back to the early 1980s. Papoutsakis[8] demonstrated that is was possible to construct flux balance equations using a metabolic map. It was Watson [9] however who first introduced the idea of using linear programming and an objective function to solve for the fluxes in a pathway. The first significant study was subsequently published by Fell and Small [10] who used flux balance analysis together with more elaborate objective functions to study the constraints in fat synthesis.


Chapter 2 반응계수행렬

말 그대로 입니다. 반응계수를 행렬로 표현한 것입니다. 쉽게 이해하기 위해 우리는 아주아주 작은 네트워크를 그려보았습니다. 이 네트워크는 앞으로 자주 쓰이게 될테니 잘 봐두세요.


(반응 개수를 더 늘려야 함, 물질보다 더 많게) 반응1 : A → 2 B 반응2 : B ↔ C 반응 3 : C → E + 2 F 반응 4 : C → 3 D 반응 5 : D → G

노드는 7개(A, B, C, D, E, F), 엣지는 5개입니다. 즉, 대사물질은 7개, 반응은 5개 입니다.

반응계수행렬에서 각 행은 대사물질을 가리키고, 각 열은 반응을 가리킵니다. 위의 네트워크에서는 (7개의 대사물질) × (5개의 반응) 이므로 7 × 5 의 행렬을 만듭니다. 행렬은 행과 열이 각각 의미를 가지고 있는거 아시죠? 바꿔쓰지 않도록 주의합시다.

( █(0 0 0 0 0@0 0 0 0 0@0 0 0 0 0@0 0 0 0 0@0 0 0 0 0@0 0 0 0 0@0 0 0 0 0@0 0 0 0 0@0 0 0 0 0) )(적었다고 가정)

다음으로 반응식에서 대사물질의 계수를 반응계수행렬에 대입합니다. 예를 들면, 첫번째 반응에서 A는 반응물이고 B는 생성물입니다. 한 번 반응이 일어나면 A는 한 분자 사용되고 B는 한 분자 생산됩니다. 따라서 반응물은 대입할 때 계수 앞에 마이너스를 붙여줍니다. 계수를 적되 반응물은 마이너스로! 첫번째 반응을 행렬에 대입하면 다음과 같습니다.


(그림 : 첫번째 반응을 행렬에 대입)

두번째 반응은 가역반응이므로 B와 C가 반응물인지 생성물인지 헷갈립니다. 하지만 걱정할 필요 없습니다. 가역반응은 임의로 반응물과 생성물을 정해줍니다. 실제 반응의 방향을 결정하는 것은 반응계수행렬이 아니라 각 반응의 속도 범위입니다. 이에 대해서는 ?? 장(장수 표시)에서 자세하게 배워보겠습니다.

(그림 : 두번째 반응을 대입. 두개 다 그리고 어느 것으로 해도 괜찮다고 표시)

이런식으로 반응 5개의 반응계수를 모두 행렬에 대입하면 반응계수 행렬이 완성됩니다. 이 행렬은 반응계수행렬(stoichiometric matrix)의 앞자를 따서 S라고 부르겠습니다.

우리의 소형 대사 네트워크에는 5개의 반응이 있었습니다. 반응1부터 반응 5번까지 총 5개였죠. 이 반응들은 제각기 속도를 가지고 있습니다. 반응속도가 빠르면 반응물을 빨리 사용하고 생성물을 빨리 생산하는 반면, 반응속도가 느리면 반응물을 느리게 사용하고 생성물 또한 느리게 생산합니다. 5개의 반응 모두가 같은 반응속도를 가질 필요는 없겠죠? 다만 우리가 한가지 명심해야 할 것이 있습니다. 대사 네트워크 내의 모든 반응은 같은 속도를 가질 필요는 없지만 모든 대사물질은 일정한 양이 유지되어야 한다는 것입니다. 어떤 물질이라도 너무 적거나 많으면 생명체에 좋을리 없겠죠? 이를 반응속도 측면에서 생각해본다면 특정 대사물질이 사용되는 반응의 속도와 생산되는 반응의 속도는 같아야 합니다.

∑▒〖V사용 = ∑▒V생산〗

아닙니다. '반드시' 그래야만 합니다. 쉽게 생각해 봅시다. 특정 물질의 생산되는 속도가 소비되는 속도보다 빠르다면 어떻게 될까요? 그 물질은 단위시간당 두 반응속도의 차이만큼 쌓일 것입니다. 당장 몇초 몇분은 상관없을지도 모릅니다. 하지만 시간이 지나면 지날수록 B의 양은 계속 늘어나고, 결국 생물은 이러한 불균형을 견뎌내지 못할 겁니다.

음.. 먼저 '반드시'라고 말했던 것은 사과하겠습니다. kinetic model과 비교 설명(공부 필요)

다시 우리의 대사 네트워크로 돌아와, 반응속도 벡터를 제작해봅시다. 우리는 반응속도에 관해서 알고있는 것이 하나도 없습니다. 단지 각 물질은 평형상태를 가정하였기 때문에 소비되는 속도와 생성되는 속도가 같다는 힌트만 가지고 있을 뿐입니다. 따라서 모든 반응속도는 일단 미지수라고 생각하겠습니다. 우리는 반응속도를 v반응1, v반응2, … , v반응5 라고 표현하였습니다. 이제 반응계수행렬과 반응속도 벡터를 곱해보겠습니다.

어떤 결과가 나올지 예상이 되시나요?

(결과 그림 : 일일이 계산한 벡터 나타내기)

위에 보는 것처럼 7x1의 행렬이 만들어졌습니다. 그리고 각 행은 대사물질의 변화속도를 나타내고 있습니다. 우리는 평형상태를 가정하였으므로 이 값들은 모두 0이어야 합니다.

(그림 : 0 표시하기)

결과값이 0벡터이므로 위의 그림을 간단하게 나타낸 것이 Sv=0입니다. 이것은 각 대사물질의 평형상태를 수식으로 표현한 것입니다.

뒤의 장에서 자세히 배우겠지만 Sv=0은 목적함수(지금은 용어만 알아둡시다)를 계산할 때에 사용하는 제한 중 하나입니다. (제한은 크게 두 종류가 있습니다). 이에 대해서는 천천히 살펴보도록 하겠습니다. 지금은 그냥 저런 용어가 있구나 정도만 알아두시면 되겠습니다.

Chapter 3 목적함수와 외부 교환 반응

앞에서 특정 생물체에서 일어나는 대사반응을 모두 포함하는 반응계수행렬을 만들었습니다. 그리고 반응계수행렬과 반응속도벡터의 곱을 0이라고 설정하므로써 평형상태를 수학으로 표현해보았습니다.. Sv=0 기억나시죠?

이 때 만들었던 S에 대해 이야기 해 봅시다. 이것만 가지고 바이오매스 양이나 특정 부산물의 양을 예측할 수 있을까요? 반응계수행렬에는 그러한 정보들이 들어있었나요?

부족합니다. 그러면 어떤 정보들이 들어가야 할까요?

1. 바이오매스 양을 계산할 수 있다고 했는데, 바이오매스에 관한 정보가 없습니다. 2. 물질이 어디로부터 시작하는지에 관한 정보가 없습니다.

이 장에서는 잠깐 딴 소리를 하나 할까 합니다. 하지만 아주 중요한 딴소리죠.

다음 문제를 한번 보겠습니다.

집 앞 빵가게에서는 소보루빵, 단팥빵, 찐빵을 팔고 있다. 소보루빵에서는 200원의 이윤을, 단팥빵에서는 300원의 이윤을, 찐빵에서는 500원의 이윤을 얻을 수 있다. 그리고 각 빵은 20, 17, 14g의 당분을 가지고 있다. 빵가게 주인은 빵들이 평균 18g이하의 당분을 가지기를 원한다. 또한 소보루빵은 1분만에, 단팥빵은 2분만에, 찐빵은 3분만에 만들 수 있다면 8시간동안 최대로 낼 수 있는 이윤은 얼마인가?

이 문제는 고등학교 1학년 수학에 나오는 부등식 문제입니다.. 만약 이 문제를 어떻게 풀어야 하는지 감이 온다면 플럭스 균형 분석도 쉽게 이해할 수 있을 것입니다.

하지만 그렇지 못한 독자들을 위해 위의 문제를 천천히 풀어보도록 하겠습니다.

먼저 우리가 가진 정보들을 정리해보겠습니다. 알아보기 쉽게 말이죠.

1. 당분 : 소보루빵-20g, 단팥빵-17g, 찐빵-14g, 평균 18g 이하이어야 함 2. 시간 : 소보루빵-1분, 단팥빵-2분, 찐빵-3분 (총 주어진 시간 8시간(480분)) 3. 이윤 : 소보루빵-200원, 단팥빵-300원, 찐빵-500원일 때 최대 이윤은?

이러한 문제를 변수와 변량사이에 선형관계가 있다고 하여 선형모형이라고 하고, 이를 푸는 방법을 선형계획법이라고 합니다. 선형계획법은 크게 2가지로 이루어져 있습니다. 1. 목적함수(구해야 할 것) 2. 조건 위 문제에서는 1번 ~ 2번이 조건이 되고, 마지막 3번이 목적함수가 되겠습니다. 각 조건과 목적함수를 수식으로 나타내 볼까요?

소보루빵의 개수를 x, 단팥빵의 개수를 y, 찐빵의 개수를 z라고 한다면 1. 당분 : 20x + 17y + 14z ≤ 18(x + y + z) 2. 시간 : x + 2y + 3z ≤ 480 3. 이윤 : 200x + 300y + 500z 를 최대로

자, 여기까지 조건과 목적함수를 수식으로 나타낸 후에는 조건식을 만족시키면서 목적함수식을 최대로 하는 값을 구합니다. 구하는 방법까지는 알 필요 없습니다. 다만 선형계획법을 풀 때에는 조건을 만족시키면서 목적함수를 최대화하는(최소도 가능합니다) 값을 구한다는 개념만 알아두면 됩니다.

플럭스 균형 분석도 크게 다르지 않습니다.(크게 강조)

두 가지를 주시합니다. 조건, 그리고 목적함수

조건은 두 가지가 있습니다. 1. Sv=0는 각 대사물질의 평형상태를 나타냅니다. 2. 각 반응속도(v)는 고유의 속도범위를 가지고 있습니다.

1번은 앞에서 다루었던 내용입니다. Sv=0를 만족시키는 v 벡터를 S의 영공간(null space)라고 합니다. (내용 보충?) 실제 대사 네트워크에서는 반응수가 물질수보다 많습니다. 즉 미지수 v의 개수가 평형식의 개수보다 많습니다. 이는 Sv=0를 만족시키는 v의 집합이 여러개가 나올 수 있다는 것을 의미합니다.

(그림 : 식 2개, 미지수 2개인 경우 해는 한개 입니다. 식 5개 미지수 7개인 경우에는 해가 한 개 이상입니다. 우리가 space라고 부르는 이유이죠.)

각 v는 고유의 속도범위를 가지고 있습니다. 적어도 실제로는 그렇습니다. 하지만 우리는 이에 대해서 아는게 별로 없죠. 그래서 모든 반응속도는 제한없이 일어날 수 있도록 합니다.(여기서는 무한대의 의미로 1000이라는 숫자를 사용하겠습니다). 다만 반응이 가역반응인지 비가역반응인지에 따라 다른 범위를 부여합니다. 반응계수행렬 S를 만들 때 반응의 방향은 고려하지 않았었죠? 반응의 방향은 바로 각각의 v에 범위를 부여함으로써 결정됩니다. 반응속도가 양수라면 정반응을 나타내고 음수라면 역반응을 나타냅니다. 어떻게 해야할지 감이 오지요? 가역반응이라면 -1000<v<1000, 비가역반응이면 0<v<1000의 속도제한을 둡니다. 이런 제한만으로도 영공간의 크기를 제법 줄일 수 있습니다. 훨씬 더 실제에 가까운 값을 얻게 되는 것이죠.

선형계획법에서는 두가지를 다룹니다. 1. 조건 - Sv=0, 각 v의 범위 2. 목적함수

이번에는 목적함수에 대해 알아보겠습니다. 플럭스 균형 분석을 통해 궁극적으로 우리가 구하고자 한 값이 무엇이었죠? 네, 바이오매스 양입니다.

대상균의 목적함수를 먼저 보겠습니다.

(0.05) 5mthf + (5.0E-5) accoa + (0.488) ala-L + (0.0010) amp + (0.281) arg-L + (0.229) asn-L + (0.229) asp-L + (45.7318) atp + (1.29E-4) clpn_EC + (6.0E-6) coa + (0.126) ctp + (0.087) cys-L + (0.0247) datp + (0.0254) dctp + (0.0254) dgtp + (0.0247) dttp + (1.0E-5) fad + (0.25) gln-L + (0.25) glu-L + (0.582) gly + (0.154) glycogen + (0.203) gtp + (45.5608) h2o + (0.09) his-L + (0.276) ile-L + (0.428) leu-L + (0.0084) lps_EC + (0.326) lys-L + (0.146) met-L + (0.00215) nad + (5.0E-5) nadh + (1.3E-4) nadp + (4.0E-4) nadph + (0.001935) pe_EC + (0.0276) peptido_EC + (4.64E-4) pg_EC + (0.176) phe-L + (0.21) pro-L + (5.2E-5) ps_EC + (0.035) ptrc + (0.205) ser-L + (0.0070) spmd + (3.0E-6) succoa + (0.241) thr-L + (0.054) trp-L + (0.131) tyr-L + (0.0030) udpg + (0.136) utp + (0.402) val-L --> (45.5608) adp + (45.56035) h + (45.5628) pi + (0.7302) ppi

이렇게 긴 식을 제가 직접 만들어야 하나요? 가능한 일입니까? 끔찍하네요. 식은 정~말 길지만 하나하나 살펴보면 일정한 원칙을 가지고 있습니다. 뒷장에서 이 식을 하나하나 분석할 시간을 가질테니 안심하셔도 됩니다. 믿어보세요.

이제 조건과 목적함수를 얻었으니 식을 풀기만 하면 됩니다. 제는 풀지 않을 거고, 여러분도 풀지 않을 겁니다. 이미 마음씨 좋은 사람들이 우리들의 시간절약을 위해 자동화된 프로그램을 만들어 주었습니다. 이런 프로그램들을 선형계획법 해결사(Linear Programming Solver)라고 부릅니다. 선형계획법 해결사는 다음과 같은 프로그램들이 있습니다.

glpk(freeware) : http://www.gnu.org/software/glpk/ LINDO(LINDO Systems) Matlab API(commercial) CPLEX(ILOG) through the Tomlab(Tomlab Optimization) optimization environment(commercial, but best LP solver available) Mosek(MOSEK ApS) (commercial)

이 프로그램들은 조건과 목적함수를 설정해주기만 하면 목적함수의 최대값 혹은 최소값 뿐만 아니라 각각의 v값도 함께 구해줍니다. 정말 편하죠?

구체적인 프로그램 사용법은 부록에서 알아보도록 하겠습니다. 여기서는 플럭스 균형분석은 선형계획법을 이용해 계산한다는 정도만 알아두시면 되겠습니다.

아, 이제 플럭스 균형분석을 할 수 있겠네요. 어렵지 않은걸요. 잠깐, 아직 부족한 것이 있나요? 대사물질들은 바이오매스의 구성성분이 되면서 계를 빠져나가는데, 평형상태를 유지한다니 이상하지 않나요? 우리는 각 대사물질들이 계 밖으로부터 들어오는 것을 고려하지 않았습니다.

그럼 모든 대사물질을 계 밖에서 들어오도록 반응을 만들어서 넣으면 되겠네요? 그러니깐 100개의 대사물질이 있으면 100개의 반응식이 추가되겠군요? 그럴 필요는 없습니다. 실제 생물이 흡수할 수 있는 대사물질의 교환 반응을 추가 하면 됩니다. 흡수할 수 있는 반응이 없으면 계 내에 아무리 대사물질이 많아도 소용 없으니깐요. 어떤 대사물질의 교환반응을 추가할지 결정하기 위해서는 실험적 데이터가 있어야 합니다. 최소한 탄소, 질소, 산소, 수소, 황소원은 있어야 합니다.

이제 끝난거죠? 설마 또 있는 건 아니죠?(ATPM) 미안하게도 딱 한가지가 더 남았습니다. ATP 유지 반응식을 넣어야 합니다. 하지만 이 반응식에 대해서는 5장에서 공부할테니 지금은 ATP 유지 반응식을 넣어야 하는구나 정도로만 기억해두세요.

ATP 유지 반응식 : ATP + H2O → ADP + Pi + H+

자, 이제 계산을 위한 반응계수행렬을 만들었습니다. 대사 네트워크에 목적함수인 바이오매스 식과 교환 반응을 추가하였습니다. 기존의 반응계수행렬과 구분짓기 위해 우리는 이것을 확장된 반응계수행렬이라고 부르겠습니다.(Extended Stoichiometric Matrix)

(그림 : 확장된 반응계수행렬)

새로 추가시킨 반응들 말이죠, 속도 범위는 어떻게 결정하죠? 우리는 기존 대사 네트워크에 3종류의 반응을 추가 시켰습니다.

1. 바이오매스 식 2. 외부교환 반응 3. ATP 유지 반응식

1. 바이오매스 식은 비가역 반응으로 설정합니다. 바이오매스가 생성되는 반응만 일어나도록 하는 것이죠. 0≤v≤1000 2. 외부교환 반응은 가역반응으로 설정합니다. 외부에서 물질이 들어오는 경우도 있지만, 내부에서 외부로 물질이 빠져나가는 경우도 있기 때문입니다. 예를 들면 호흡과정에서 나온 이산화탄소는 계 밖으로 배출됩니다. -1000≤v≤1000 3. ATP 유지 반응식은 5장에서 알아본다고 했었죠? 이 문제에 관해서도 다루게 될 것입니다.

Chapter 4 나무집 네트워크의 플럭스 균형 분석 이번 장은 복습을 위한 장입니다. 급하게 플럭스 균형 분석을 공부하고 있다면, 내일까지 당장 결과를 내야한다면, 5장으로 바로 넘어가셔도 됩니다.(나중에 작성-네트워크 다 그리고 나서)

1. 네트워크와 관련된 반응을 수집합니다.

(그림 : 반응이 5개밖에 없는 작은 네트워크였습니다.)

2. 반응계수행렬을 만듭니다.

(그림)

3. 확장된 반응계수행렬을 만듭니다. (바이오매스 식과 외부교환반응을 추가합니다.)

(그림)

4. 각 반응속도의 하한값, 상한값을 정해줍니다.

(그림)

5. 조건, 목적함수를 이용하여 식을 풉니다.

(쉽죠?)

Chapter 5 바이오매스 식 작성 이번 장에서는 3장에서 봤던 바이오매스 식을 어떻게 만드는지에 대해서 살펴보겠습니다. 식은 길지만 어렵지 않으니 잘 따라오세요.

1. 바이오매스는 크게 DNA, RNA, 단백질, 지질, 기타 보조인자들로 구성되어 있습니다.

(세포 그림)

그리고 밑의 대장균의 예처럼 구성요소들의 분율을 구합니다. 실험으로 구해도 되고 기존 문헌에서 찾아도 됩니다.

세포 구성성분 질량 백분율(wt/wt) 단백질 55 RNA 20.5 DNA 3.1 지질 9.1 지질다당류 3.4 펩티도글라이칸 2.5 글리코겐 2.5 폴리아민 0.4 기 타 3.5 Total 100

이런 분율을 기존 문헌에서 찾을 수 없고, 실험할 여건도 되지 않는다면, 유전체 데이터로부터 상대적인 분율을 구할 수 있습니다. 여기서는 다루지 않겠습니다.

2. 좀 더 세분화 할 수 있습니다. 기본 구성물질

- DNA : dATP, dGTP, dTTP, dCTP
- RNA : ATP, CTP, GTP, UTP
- 단백질 : 20종류의 아미노산
- 지질 : 지방산과 인지질(지질의 경우는 좀 복잡합니다)

기타 바이오매스 구성성분이 되는 것들(대장균)

- 수용성 인자 : Putrescine, Spermidine, Acetyl-CoA, Coenzyme A, Succinyl-CoA, Malonyl-CoA,
 NAD, NADH, NADP, NADPH, Undecaprenyl diphosphate, 10-Formyltetrahydrofolate,
 5,6,7,8-Tetrahydrofolate,  5,10-Methylenetetrahydrofolate, 5-Methyltetrahydrofolate, Chorismate, 
 Enterochelin, Reduced glutathione, Pyridoxal 5'-phosphte(vitamin B6), S-Adenosyl-L-methionine, 
 Thiamine diphosphate,  Adenosylcobalamin, Ubiquinol-8, 2-Demethylmenaquinol-8, 
 Menaquinol-8, Heme O, Protoheme,  Siroheme, Riboflavin, FAD
- 이온 성분 : Fe, Mg, Cl, Ca, Na, PO4, Cu, Mn, Mo, Zn, Co, NH4, 

다시 바이오매스 다시 살펴보겠습니다.

(0.05) 5mthf + (5.0E-5) accoa + (0.488) ala-L + (0.0010) amp + (0.281) arg-L + (0.229) asn-L + (0.229) asp-L + (45.7318) atp + (1.29E-4) clpn_EC + (6.0E-6) coa + (0.126) ctp + (0.087) cys-L + (0.0247) datp + (0.0254) dctp + (0.0254) dgtp + (0.0247) dttp + (1.0E-5) fad + (0.25) gln-L + (0.25) glu-L + (0.582) gly + (0.154) glycogen + (0.203) gtp + (45.5608) h2o + (0.09) his-L + (0.276) ile-L + (0.428) leu-L + (0.0084) lps_EC + (0.326) lys-L + (0.146) met-L + (0.00215) nad + (5.0E-5) nadh + (1.3E-4) nadp + (4.0E-4) nadph + (0.001935) pe_EC + (0.0276) peptido_EC + (4.64E-4) pg_EC + (0.176) phe-L + (0.21) pro-L + (5.2E-5) ps_EC + (0.035) ptrc + (0.205) ser-L + (0.0070) spmd + (3.0E-6) succoa + (0.241) thr-L + (0.054) trp-L + (0.131) tyr-L + (0.0030) udpg + (0.136) utp + (0.402) val-L --> (45.5608) adp + (45.56035) h + (45.5628) pi + (0.7302) ppi

아직도 식이 복잡해만 보이나요? 조금 보기 쉽게 고쳐보겠습니다.

- 반응물

앞의 숫자(뭔지는 모르겠지만 숫자가 있습니다) 대사물질 이름(약어로 표기되어 있습니다) 0.0247 datp 0.0254 dctp 0.0254 dgtp 0.0247 dttp 0.136 utp 0.203 gtp 0.126 ctp 0.488 ala-L 0.281 arg-L 0.229 asn-L 0.229 asp-L 0.087 cys-L 0.25 gln-L 0.25 glu-L 0.09 his-L 0.276 ile-L 0.428 leu-L 0.326 lys-L 0.146 met-L 0.176 phe-L 0.21 pro-L 0.241 thr-L 0.205 ser-L 0.054 trp-L 0.131 tyr-L 0.582 gly 0.402 val-L 0.00215 nad 5.0E-5 nadh 1.3E-4 nadp 4.0E-4 nadph 1.0E-5 fad 0.05 5mthf 5.0E-5 accoa 6.0E-6 coa 0.0010 amp 0.035 ptrc 0.0070 spmd 3.0E-6 succoa 0.0030 udpg 0.154 glycogen 45.7318 atp 45.5608 h2o 0.0084 lps_EC 0.001935 pe_EC 0.0276 peptido_EC 4.64E-4 pg_EC 5.2E-5 ps_EC 1.29E-4 clpn_EC

- 생성물

45.5608 adp 45.56035 h 45.5628 pi 0.7302 ppi

이제야 좀 감이 옵니다. 바이오매스를 이루는 요소들과 무엇인지는 모르겠지만 앞의 숫자들을 구하면 되겠습니다. 반응식에는 위에서 다루었던 것들도 있고, 처음보는 것들도 있습니다. 이제 조금 더 자세히 들여다 보도록 하겠습니다. 저 숫자들을 구하는 방법을 알아야겠죠?

숫자의 의미와 관련하여 한 가지 짚고 넘어가야 할 내용이 있습니다.

바로 단위에 관한 내용입니다.

플럭스 균형 분석에서 모든 반응속도의 단위는 mmol gDW-1 h-1입니다. 바이오매스 생성 반응속도의 단위는 h-1입니다. 따라서 바이오매스의 모든 구성성분들의 분율의 단위는 mmol gDW-1가 됩니다. 즉 건조중량 1g의 세포에서 각 구성성분의 몰수가 바이오매스 식에서의 숫자들이 되는 것이죠.


참고문헌 1. Nature primer 'What it flux balance analysis' 2. Linear Algebra and its applications (Brook) 3. A protocol for generating a high-quality genome-scale metabolic reconstruction(Nature) 4. Flux balance analysis from wikipedia

Personal tools
Namespaces
Variants
Actions
Site
Choi lab
Resources
Toolbox