Phrap사용법

From CSBLwiki

Jump to: navigation, search

phrap fastafilename [옵션]

.qual 파일은 fastafilename.qual 로 같은 폴더에 있어야 한다.

한개의 fasta만 넣는다. 여러개의 fasta는 들어 갈 수 없다.

mate pair 정보는 어떻게 넣나? read 이름에 forward or reverse로 넣는다. 양쪽에서 시퀀싱을 할 하나의 subclone이란 용어로 부른다. 옵션중에 subclone 길이를 넣는 것이 있다.

St. Louis read naming convention을 사용해서 위의 정보를 넣는다.

1) subclone 이름, 2) forward or reverse, 3) the chemistry used to generate the read


1) read 이름(subclone 이름)은 처음 나오는 '.' 까지 이다. -n_delim으로 '.' 대신 다른 것을 사용할 수 있다.

2) orientation과 chemistry는 처음 나오는 '.' 바로 뒤에 붙인다. 옵션은 다음과 같다.

"s" forward direction read on single stranded (SS) template, dye primer chemistry
"f" forward read on double stranded (DS) template, dye primer chemistry
"r" DS reverse read, dye primer chemistry
"x" SS forward read, standard dye terminator chemistry
"z" DS forward read, standard dye terminator chemistry
"y" DS reverse read, standard dye terminator chemistry
"i" SS forward read, big dye terminator chemistry
"b" DS forward read, big dye terminator chemistry
"g" DS reverse read, big dye terminator chemistry
"t" for T7  (cDNAs)
"p" for SP6 (cDNAs)
"e" for T3  (cDNAs)
"d" for special
"c" consensus pieces
"a" assembly pieces

이중 454에 해당하는 chemistry는 없다. chemistry 선택에 따라 퀄리티 파일의 사용이 달라진다고 한다.

DNA link에서 보내준 GE6FA8204.PE.fna 는 DS forward, DS reverse 이다.

sff에서 바로 뽑은, 즉 linker가 포함된 파일은 nnnnnnlllllllnnnnnn 이런 모양. 오른쪽 n은 5' 부분으로 forward에 해당, 왼쪽 n은 3'부분으로 reverse complement를 했을 때 reverse에 해당함

Personal tools
Namespaces
Variants
Actions
Site
Choi lab
Resources
Toolbox