Coauthorship

From CSBLwiki

(Difference between revisions)
Jump to: navigation, search
 
Line 1: Line 1:
-
=방법=
+
=데이터=
-
#Korea,China,Japan,USA 자료 수집 (기간: 2001.01.01~2011.05.22)
+
[http://compbio.korea.ac.kr/~gnusnah/Coauthor/ data_download]
-
#PMID,Title,year,FAU(Full author name),AU(abbreviated name),MeSH 를 추출(자체 제작 python 스크립트,biopython 사용 안함)
+
 
-
#저자가 없는 데이터 삭제
+
*FAU: full author name
-
#AU와 FAU를 비교하여 같은 (각종 기호 제거후 알파벳만 비교) 데이터 삭제
+
*AU: 축약된 저자 이름
-
#PMID \t FAUs \t #ofFAU 파일 생성: ext_*_6.txt
+
*PMID: pubmed ID
-
#FAU \t PMIDs \t #ofPMID 파일 생성: FP_*_3.txt
+
*raw 데이터를 제외한 모든 데이터는 tab으로 구분
-
#author per paper 관련 수치 계산 (5번 데이터 이용)
+
 
-
#paper per author 관련 수치 계산 (6번 데이터 이용)
+
 
 +
:논문-저자 데이터
 +
:(PMID) (FAUs) (# of FAUs)
 +
ext_china_6.txt
 +
ext_japan_6.txt
 +
ext_korea_6.txt
 +
ext_USA_6.txt
 +
 
 +
:저자-논문 데이터  
 +
:(FAU) (PMIDs) (# of FAUs)
 +
FP_china_3.txt
 +
FP_japan_3.txt
 +
FP_korea_3.txt
 +
FP_USA_3.txt
 +
 
 +
:Raw data
 +
pubmed_result_china.txt
 +
pubmed_result_japan.txt
 +
pubmed_result_korea.txt
 +
pubmed_result_USA.txt
 +
 
 +
:Raw data로부터 저자명, 날짜 필터링하고 여러 데이터를 추려낸 파일 (FAU, Mesh term, AU는 "|"로 구분되어 있음)
 +
:(PMID) (FAU) (Year) (Title) (MeSH term) (Affiliation) (AU)
 +
ext_china_4.txt
 +
ext_japan_4.txt
 +
ext_korea_4.txt
 +
ext_USA_4.txt
 +
 
=결과=
=결과=
Line 54: Line 81:
|}
|}
-
=데이터=
 
-
[http://compbio.korea.ac.kr/~gnusnah/Coauthor/ data_download]
 
-
*FAU: full author name
+
=방법=
-
*AU: 축약된 저자 이름
+
#Korea,China,Japan,USA 자료 수집 (기간: 2001.01.01~2011.05.22)
-
*PMID: pubmed ID
+
#PMID,Title,year,FAU(Full author name),AU(abbreviated name),MeSH 를 추출(자체 제작 python 스크립트,biopython 사용 안함)
-
*raw 데이터를 제외한 모든 데이터는 tab으로 구분
+
#저자가 없는 데이터 삭제
-
 
+
#AU와 FAU를 비교하여 같은 (각종 기호 제거후 알파벳만 비교) 데이터 삭제
-
 
+
#PMID \t FAUs \t #ofFAU 파일 생성: ext_*_6.txt
-
:논문-저자 데이터
+
#FAU \t PMIDs \t #ofPMID 파일 생성: FP_*_3.txt
-
:(PMID) (FAUs) (# of FAUs)
+
#author per paper 관련 수치 계산 (5번 데이터 이용)
-
ext_china_6.txt
+
#paper per author 관련 수치 계산 (6번 데이터 이용)
-
ext_japan_6.txt
+
-
ext_korea_6.txt
+
-
ext_USA_6.txt
+
-
 
+
-
:저자-논문 데이터
+
-
:(FAU) (PMIDs) (# of FAUs)
+
-
FP_china_3.txt
+
-
FP_japan_3.txt
+
-
FP_korea_3.txt
+
-
FP_USA_3.txt
+
-
 
+
-
:Raw data
+
-
pubmed_result_china.txt
+
-
pubmed_result_japan.txt
+
-
pubmed_result_korea.txt
+
-
pubmed_result_USA.txt
+
-
 
+
-
:Raw data로부터 저자명, 날짜 필터링하고 여러 데이터를 추려낸 파일 (FAU, Mesh term, AU는 "|"로 구분되어 있음)
+
-
:(PMID) (FAU) (Year) (Title) (MeSH term) (Affiliation) (AU)
+
-
ext_china_4.txt
+
-
ext_japan_4.txt
+
-
ext_korea_4.txt
+
-
ext_USA_4.txt
+

Latest revision as of 12:37, 26 May 2011

데이터

data_download


논문-저자 데이터
(PMID) (FAUs) (# of FAUs)
ext_china_6.txt
ext_japan_6.txt
ext_korea_6.txt
ext_USA_6.txt
저자-논문 데이터
(FAU) (PMIDs) (# of FAUs)
FP_china_3.txt
FP_japan_3.txt
FP_korea_3.txt
FP_USA_3.txt
Raw data
pubmed_result_china.txt
pubmed_result_japan.txt
pubmed_result_korea.txt
pubmed_result_USA.txt
Raw data로부터 저자명, 날짜 필터링하고 여러 데이터를 추려낸 파일 (FAU, Mesh term, AU는 "|"로 구분되어 있음)
(PMID) (FAU) (Year) (Title) (MeSH term) (Affiliation) (AU)
ext_china_4.txt
ext_japan_4.txt
ext_korea_4.txt
ext_USA_4.txt


결과

PaperAuthor
Korea91,190114,826
China296,626413,579
Japan317,310311,214
USA1,536,6101,589,125
Paper per author
MinQ1MedianQ3MaxMean
Korea11242584.7
China111320203.9
Japan11255046.1
USA11246594.1
Author per paper
MinQ1MedianQ3MaxMean
Korea14685.9
China14571285.4
Japan14681606.0
USA12363754.3


방법

  1. Korea,China,Japan,USA 자료 수집 (기간: 2001.01.01~2011.05.22)
  2. PMID,Title,year,FAU(Full author name),AU(abbreviated name),MeSH 를 추출(자체 제작 python 스크립트,biopython 사용 안함)
  3. 저자가 없는 데이터 삭제
  4. AU와 FAU를 비교하여 같은 (각종 기호 제거후 알파벳만 비교) 데이터 삭제
  5. PMID \t FAUs \t #ofFAU 파일 생성: ext_*_6.txt
  6. FAU \t PMIDs \t #ofPMID 파일 생성: FP_*_3.txt
  7. author per paper 관련 수치 계산 (5번 데이터 이용)
  8. paper per author 관련 수치 계산 (6번 데이터 이용)
Personal tools
Namespaces
Variants
Actions
Site
Choi lab
Resources
Toolbox