Coauthorship

From CSBLwiki

(Difference between revisions)
Jump to: navigation, search
Line 1: Line 1:
-
*방법
+
=방법=
#Korea,China,Japan,USA 자료 수집 (기간: 2001.01.01~2011.05.22)
#Korea,China,Japan,USA 자료 수집 (기간: 2001.01.01~2011.05.22)
#PMID,Title,year,FAU(Full author name),AU(abbreviated name),MeSH 를 추출(자체 제작 python 스크립트,biopython 사용 안함)
#PMID,Title,year,FAU(Full author name),AU(abbreviated name),MeSH 를 추출(자체 제작 python 스크립트,biopython 사용 안함)
Line 9: Line 9:
#paper per author 관련 수치 계산 (6번 데이터 이용)
#paper per author 관련 수치 계산 (6번 데이터 이용)
-
*결과
+
=결과=
{| class="wikitable" style="text-align:center" border="1"
{| class="wikitable" style="text-align:center" border="1"
|+
|+
Line 54: Line 54:
|}
|}
-
Raw data
+
=데이터=
-
pubmed_result_china.txt
+
[http://compbio.korea.ac.kr/~gnusnah/Coauthor/ data_download]
-
pubmed_result_japan.txt
+
 
-
pubmed_result_korea.txt
+
*FAU: full author name
-
pubmed_result_USA.txt
+
*AU: 축약된 저자 이름
 +
*PMID: pubmed ID
 +
*raw 데이터를 제외한 모든 데이터는 tab으로 구분
 +
 
-
PMID FAUs #
+
*논문-저자 데이터
 +
*(PMID) (FAUs) (# of FAUs)
  ext_china_6.txt
  ext_china_6.txt
  ext_japan_6.txt
  ext_japan_6.txt
Line 66: Line 70:
  ext_USA_6.txt
  ext_USA_6.txt
-
FAU PMIDs #
+
*저자-논문 데이터
 +
*(FAU) (PMIDs) (# of FAUs)
  FP_china_3.txt
  FP_china_3.txt
  FP_japan_3.txt
  FP_japan_3.txt
Line 72: Line 77:
  FP_USA_3.txt
  FP_USA_3.txt
-
[http://compbio.korea.ac.kr/~gnusnah/Coauthor/ data_download]
+
*Raw data
 +
pubmed_result_china.txt
 +
pubmed_result_japan.txt
 +
pubmed_result_korea.txt
 +
pubmed_result_USA.txt
 +
 
 +
*Raw data로부터 저자명, 날짜 필터링하고 여러 데이터를 추려낸 파일 (FAU, Mesh term, AU는 "|"로 구분되어 있음)
 +
*(PMID) (FAU) (Year) (Title) (MeSH term) (Affiliation) (AU)
 +
ext_china_4.txt
 +
ext_japan_4.txt
 +
ext_korea_4.txt
 +
ext_USA_4.txt

Revision as of 12:24, 26 May 2011

방법

  1. Korea,China,Japan,USA 자료 수집 (기간: 2001.01.01~2011.05.22)
  2. PMID,Title,year,FAU(Full author name),AU(abbreviated name),MeSH 를 추출(자체 제작 python 스크립트,biopython 사용 안함)
  3. 저자가 없는 데이터 삭제
  4. AU와 FAU를 비교하여 같은 (각종 기호 제거후 알파벳만 비교) 데이터 삭제
  5. PMID \t FAUs \t #ofFAU 파일 생성: ext_*_6.txt
  6. FAU \t PMIDs \t #ofPMID 파일 생성: FP_*_3.txt
  7. author per paper 관련 수치 계산 (5번 데이터 이용)
  8. paper per author 관련 수치 계산 (6번 데이터 이용)

결과

PaperAuthor
Korea91,190114,826
China296,626413,579
Japan317,310311,214
USA1,536,6101,589,125
Paper per author
MinQ1MedianQ3MaxMean
Korea11242584.7
China111320203.9
Japan11255046.1
USA11246594.1
Author per paper
MinQ1MedianQ3MaxMean
Korea14685.9
China14571285.4
Japan14681606.0
USA12363754.3

데이터

data_download


ext_china_6.txt
ext_japan_6.txt
ext_korea_6.txt
ext_USA_6.txt
FP_china_3.txt
FP_japan_3.txt
FP_korea_3.txt
FP_USA_3.txt
pubmed_result_china.txt
pubmed_result_japan.txt
pubmed_result_korea.txt
pubmed_result_USA.txt
ext_china_4.txt
ext_japan_4.txt
ext_korea_4.txt
ext_USA_4.txt
Personal tools
Namespaces
Variants
Actions
Site
Choi lab
Resources
Toolbox