Progress fordenny12

From CSBLwiki

(Difference between revisions)
Jump to: navigation, search
 
(18 intermediate revisions not shown)
Line 1: Line 1:
 +
----
 +
:Hanseong Roh
 +
:last edited: 2011.5.24
 +
*방법
 +
#Korea,China,Japan,USA 자료 수집 (기간: 2001.01.01~2011.05.22)
 +
#PMID,Title,year,FAU(Full author name),AU(abbreviated name),MeSH 를 추출(자체 제작 python 스크립트,biopython 사용 안함)
 +
#저자가 없는 데이터 삭제, AU와 FAU를 비교하여 같은 (각종 기호 제거후 알파벳만 비교) 데이터 삭제
 +
#PMID \t FAUs \t (# of FAU) 파일 생성: ext_*_6.txt
 +
#FAU \t PMIDs \t (# of PMID) 파일 생성: FP_*_3.txt
 +
#author per paper 관련 수치 계산 (4번 데이터 이용)
 +
#paper per author 관련 수치 계산 (5번 데이터 이용)
 +
 +
*결과
 +
{| class="wikitable" style="text-align:center" border="1"
 +
|+
 +
|-
 +
|||Paper||Author
 +
|-
 +
|Korea||91,190||114,826
 +
|-
 +
|China||296,626||413,579
 +
|-
 +
|Japan||317,310||311,214
 +
|-
 +
|USA||1,536,610||1,589,125
 +
|}
 +
 +
:Paper per author
 +
{| class="wikitable" style="text-align:center" border="1"
 +
|+
 +
|-
 +
|||Min||Q1||Median||Q3||Max||Mean
 +
|-
 +
|Korea||1||1||2||4||258||4.7
 +
|-
 +
|China||1||1||1||3||2020||3.9
 +
|-
 +
|Japan||1||1||2||5||504||6.1
 +
|-
 +
|USA||1||1||2||4||659||4.1
 +
|}
 +
 +
:Author per paper
 +
{| class="wikitable" style="text-align:center" border="1"
 +
|+
 +
|-
 +
|||Min||Q1||Median||Q3||Max||Mean
 +
|-
 +
|Korea||1||4||6||8||45|5.9
 +
|-
 +
|China||1||4||5||7||128||5.4
 +
|-
 +
|Japan||1||4||6||8||160||6.0
 +
|-
 +
|USA||1||2||3||6||375||4.3
 +
|}
 +
 +
-----------------------------------------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------------------------------------------
-
*'''네트워크 생물학 관련 용어'''*
+
 
 +
[[file:paper.jpg]]
 +
[[file:author.jpg]]
 +
 
 +
== '''네트워크 생물학 관련 용어''' ==
 +
[[File:네트워크 생물학 관련 용어.pdf]]
:''' 1. agent(행위자-에이전트):'''  
:''' 1. agent(행위자-에이전트):'''  
::복잡적응계에서 다양한 형태와 능력을 가지고 능동적으로 활동하는 구성요소로서의 개체를 행위자라고 한다
::복잡적응계에서 다양한 형태와 능력을 가지고 능동적으로 활동하는 구성요소로서의 개체를 행위자라고 한다

Latest revision as of 08:28, 24 May 2011


Hanseong Roh
last edited: 2011.5.24
  1. Korea,China,Japan,USA 자료 수집 (기간: 2001.01.01~2011.05.22)
  2. PMID,Title,year,FAU(Full author name),AU(abbreviated name),MeSH 를 추출(자체 제작 python 스크립트,biopython 사용 안함)
  3. 저자가 없는 데이터 삭제, AU와 FAU를 비교하여 같은 (각종 기호 제거후 알파벳만 비교) 데이터 삭제
  4. PMID \t FAUs \t (# of FAU) 파일 생성: ext_*_6.txt
  5. FAU \t PMIDs \t (# of PMID) 파일 생성: FP_*_3.txt
  6. author per paper 관련 수치 계산 (4번 데이터 이용)
  7. paper per author 관련 수치 계산 (5번 데이터 이용)
PaperAuthor
Korea91,190114,826
China296,626413,579
Japan317,310311,214
USA1,536,6101,589,125
Paper per author
MinQ1MedianQ3MaxMean
Korea11242584.7
China111320203.9
Japan11255046.1
USA11246594.1
Author per paper
MinQ1MedianQ3MaxMean
Korea14685.9
China14571285.4
Japan14681606.0
USA12363754.3



Paper.jpg Author.jpg

네트워크 생물학 관련 용어

File:네트워크 생물학 관련 용어.pdf

1. agent(행위자-에이전트):
복잡적응계에서 다양한 형태와 능력을 가지고 능동적으로 활동하는 구성요소로서의 개체를 행위자라고 한다
2. attractor(끌개):
동역학계의 운동을 위상공간에 시간에 따라 변하는 궤도로 나타낼 수 있따. 이 궤도는 시간이 흐름에 따라 일정한 모양을 갖는데 그것을 끌개라고 한다.
3. betweenness(연결도):
네트위크의 한 노드를 정하고, 그노드를 제외한 나머지 노드들의 가능한 모든 쌍의 최단 경로의 수를 센다.이 경로들 중 에 그정해진 노드를 지나는 경로 수만의 비율을 그 노드의 연결도라고 한다.
4. bifurcation(분기):
갈림은 제어 변수를 변화시킴에 따라 특정 시스템의 끌개구조가 질적으로 달라지는 것을 의미한다.
5. closed system(닫힌 시스템):
열역학에서는 외부와 에너지만 교환하고 물질은 교환하지 않는 시스템을 의미한다. 복잡계와 관련해서는 외부와 에너지까지 완전히 차단된 고립계의 의미와 섞여 쓰일 때도 많다.
6. clustering coefficient(결집계수):
결집계수는 네트위크의 결집 정도를 정량화한 값이다. 네트워크에서 한 꼭지점과 직접 연결되어 있는 노드들 사이의 모든 가능한 링크와 실제 링크 비율의 평균으로 정의한다.
7. coevolution(공진화):
공진화는 다른 종의 유전적 변화에 맞대응하면서 일어나는 어떤 종의 유전적 변화라 정의될 수있다. 복잡적응계에서는 상위 시스템(super-system)과 하위 시스템(subsystem)이 같은 방향으로 진화할때 이를 공진화라고 정의한다.
8. complex adaptive system(CAS)(복잡적응계):
복잡계 중 구성요소들이 환경의 변화에 능동적으로 자신을 재조직하며 적응하는 시스템을 의미한다. 지적인 존재 또는 그집단이 구성요소가 되는 다양한 사회경제계들이 대표적인 예이다.
9. complex system(복잡계):
다양한 구성요소가 상호작용하는 시스템을 의미한다.
10. complexity(복잡성):
시스템의 복잡한 성질을 의미하며(복잡성), 때로는 그 양적인 정도를 의미하기도 한다(복잡도).
11. complexity measure(복잡도):
시스템의 복잡한 정도를 측정하는 양을 의미한다.
12. critical exponent(임계지수):
임계상태에서는 그 시스템의 다양하나 물리량들이 거듣제곱 법칙을 보인다. 이 거듭제곱번칙의 지수를 임계지수라 한다.
13. critical point(임계점):
통계물리학에서 2차 상전이가 일어나는 지점을 의미하며, 수학에서는 미분값이 무한대 또는 0 이거나 정해지지 않은 점을 의미한다. 통상적으로는 급격한 변화가 일어나는 고비가 되는 지점을 이야기한다. 그래서 때로는 티핑 포인트(tipping point),분기점(bifurcation point),변곡점 등의 의미로 쓰이기도한다.
14. criticality(임계성):
임계상태에서 보여지는 시스템의 특징을 의미한다. 시스템의 다양한 물리량들이 거듭제곱법칙을 보인다. 매개 변수가 임계점에 매우 가까울때 이 거듭제곱의 지수는 서로 다른 시스템에서 모두 같은 값을 갖는 보편성(universality)을 갖는다.
15. degree(연결수):
네트워크 이론에서 한 노드와 직접 연결된 다른 노드의 수를 의미한다.
16. dynamics(다이내믹스):
힘에 의한 물체의 운동변화를 다루는 물리학의 한 분야이다. 다른 학문분야에서도 힘에 대응되는 영향에 대해 요소들이 운동상태가 어떻게 변화하는가를 다루는 이론을 다이내믹스라 한다.
17. edge(링크):
네트워크에서 두노드의 연결상태를 표현하고자 이들 사이에 그은 선을 의미한다.
18. embedding(매립/내재):
커다란 차원의 다이내믹스를 그보다 작은 차원의 상태공간에 올려 놓고 그 본래의 특성을 밝혀내려는 기법을 매립이라고 한다. embedding은 차원과 함께 쓰일 때는 매립차원이 더 자연스러운데 반하여 독립적인 의미로써 쓰일때는 내재되어있다는 표현이 더 자연스러우므로 쓰임새에 따라 혼용한다.
19. emergence(창발):
환원된 부분들로부터는 유츄하기 어려운 특성이 거시적으로 나타나느 현상이 창발이다. 단순한 개미들이 모여 놀라운 체계를 보여주는 개미집이 대표적인 예이다.
20. emergenct behavior(창발현상):
전체는 부분의 합보다 크다. 즉, 미시적인 부분의 각각의 특성만으로는 설명 할수 없는 전체로써 나타나는 복잡한 현상이 있다. 이를 창발현상이라고 한다.
21. evolutionary game theory(진화적 게임이론):
게임이론을 생물학에 적용하며 발전된 이론이다. 개별개체에 대한 정적인 게임이 아닌 개체군에 대한 게임이론이다. 이 게임에서는 개체군의 전략의 적합도는 개체군의 수에 따라 달라 질 수 있다.
22. feedback(되먹임):
동역학의 비선형적인 특징 중 하나이다. 어떤 입력으로부터 나온 출력이 다시 입력으로 들어가는 것을 의미한다. 양의 되먹임과 음의 되먹임이 있다.
23. feedback loop(되먹임 고리):
계의 되먹임의 흐름을 나타내는 것이다. 시스켐의 입력과 축력의 고리를 화살표로 도식화 하기도 한다.
24. fractal(프랙탈):'
확대된 부분과 전체가 똑같은 모양을 하고 있는 자기 유사성을 갖는 기하학적 구조를 일컫는다. 리아스식 해안선, 동물의 혈관 분포형태, 나뭇가지 모양, 창움에 성에가 자라는 모습, 산맥의 모습 등이 프랙탈 구조를 갖고 있다.
25. game theory(게임이론):
득과 실이 명확히 정해진 게임에 참가하는 행위자들이 모두 똑같은 합리성을 가지고 행동한다는 가정하에 전략을 구사하며 게임을 진행한다는 것이 게임 이론의 근본 가정이다. 게임 이론은 경제학, 경영학, 정치학, 사회학 등 사회과학 뿐만 아니라 생물학과 같은 자연과학에서도 활발히 연구되어 응용되고 있다.
26. herd behavior(군집행동):
어떤 집단의 개인들이 동시에 비슷한 방향의 행동을 하는 현상을 말한다. 이들은 한데 결속되어 커다란 행동단위(군집)을 형성하며, 그 이후에는 관성에 의해 개인이 일탈하지 못하고 그대로 진행하게 된다.
27. homeostasis(항상성):
생명체 등이 외부의 환경이 변하더라도 내부의 환경을 일정하게 유지하려는 성질은 의미한다. 항상성은 주로 음의 되먹임에 의해서 유지된다.
28. hub(허브):
허브는 연결된 노드가 가장 많은 노드이다. 따라서 전체 네트워크에서 지배적인 역할을 한다.
29. irreversibility(비가역성):'
물에 넓게 퍼진 잉크방울을 다시 모을 수 없듯이 시간을 되돌려 보면 운동이 자연스럽지 못한것을 의미한다. 시간을 되돌려 보아도 운동의 자연스러움을 잃지 않는 가역성과 상반되는 개념이다.
30. isolated system(고립계):
열역학에서는 에너지와 물질 모두 외부와 어떤 교환도 불가능한 시스템을 의미한다. 일반적으로는 외부와 완전히 차단된 시스템을 말한다.
31. link(링크):
네트워크를 구성하는 객체인 노드들의 상호관계를 선으로 표현한 것이 링크이다. 단순이 노드간의 상호관계의 유무로 그 사이에 선이 있고 없음을 결정한다.
32. negative feedback(음의 되먹임):
어떤 시스템의 변화에 반대 방향으로 되먹임이 작용되는 것이 음의 되먹임이다. 따라서 이 되먹임은 수렴하는 운동, 즉 안정상태를 유도한다. 온도조절기가 좋은 예이다. 적정 온도보다 뜨거워 지면 온도를 내리는 방향으로 그결과 온도가 적정 온도보다 내려가면 다시 온도를 올리는 방향으로 조절하여 적정 온도를 유지한다.
33. network(네트워크):
여러 요소들의 집합과 그관계를 노드와 링크를 이용하여 추상적인 그림으로 표현한 것을 의미한다.
34. node(노드):
네트워크에서 링크에 의해 연결되는 객체를 말한다.
35. open system(열린시스템):
열역학에서 외부와 에너지 및 물질을 모두 교환할 수 있는 시스템을 의미한다.
36. positive feedback(양의 되먹임):
어떤 시스템의 변화오 같은 방향으로 되먹임이 작용되는 것이 양의 되먹임이다. 이 되먹임은 발산하는 운동을 유도한다. 원자폭탄의 연쇄반응이 그 예이다.
37. power law(거듭제곱법칙):
x,y의 두 양이 y= ax-k 의 관계로 주어지면 거듭제곱법칙의 관계라고 한다. 이때 k를 거듭제곱지수라고 한다. 거듭제곱법칙의 관계를 작는 변수의 그래ㅊ프를 로그-로그 좌표에서 그리면 직선으로 나타난다.
38. random network(무작위 네트워크):
네트워크 이론에서의 가장 간단한 구조의 하나이다. 특정한 확률로 두 노드를 무작위로 선택해 링크를 만든 것이다.
39. reversibility(가역성):
어떤 변화를 시간을 거긋러 올라가며 되돌려 보아도 자연스러움을 잃지 않는 성질을 의미한다.
40. scale(척도):
어떤 시스켐을 특징짓는 크기의 정도를 의미한다.
41. scale-free network(척도없는 네트워크):
연결망에서 각각의 노드들은 다른 노드들과 연결되어 있는 고유의 링크 수를 갖고 있다. 이 연결선 수가 많은 노드들은 드물고, 적은 노드는 빈번하여 거듭제곱분포를 이루고 있을 때, 이것을 척도 없는 네트워크라 한다.
42. self-similarity(자기 유사성):
자신의 일부를 확대해 보아도 원래의 자신의 모습을 그대로 닮아 있는 것을 의미한다. 프랙탈이 자기 유사성을 가진 기하학적 구조이다.
43. small-world network(좁은 세상 네트워크):
소수의 이수을 거쳐 모든 노드들이 연결되어 있는 네트워크를 의미한다. 와츠(D.J.Watts)으와 스트로가츠(S.H.Strogatz)가 만든 네트워크 모형이 가장 기초적이고 유명하다.
44. strange attractor(기이한 끌개):
끌개 중 프랙탈 구조를 갖는 것을 의미한다. 이것은 비선형동역학계에서 나타난다.
45. system(시스템/계/체계):
상호작용하는 요소들이 일반적인 집합을 의미한다. 자연과학에서는 계, 사회화학에서는 체게라는 번역어를 많이 사용한다.
45. system dynamics(시스템 다이내믹스):
사회와 경제꼐같은 되먹임 과정이 복잡하게 얽힌 시스템을 연구하는 이해하는 방법론이다.전체 시스템의 행동에 영향을 미치는 요소간의 되먹임 고리들을 착고 그들의 역할을 이해한다.
46. self- organization(자기조직화):
외부의 의도적인 간섭이 없이 시스템이 스스로 구조를 작추고 새로운 질서를 만들어내는 것을 의미한다. 자기조직화는 양의 되먹임과 음의 되먹임이 적절한 균형을 이루면서 발생한다.
47. universal constant(보편상수):
파이겐바움이 발견한 것으로 모든 주기배가를 일으키는 함수에서 발견되는 척도사이의 비율을 의미한다. 세부적인 다이내믹스의 차이에 상관없이 다양한 시스템에서 동일하게 나타나며 우주의 어느 곳에서나 변하지 않는 값을 말하기도 한다.
48. universality(보편성):
세부적인 다이내믹스의 차이에 상관없이 다양한 시스템에서 동일하게 일어나는 성질을 일컫는다. 통계물리학에서는 임계점 주변에서 일어나는 질서매개 변수의 거듭제곱법칙 성질을 말한다.
49. vertex(노드):
네트워크에서 연결되는 객체를 말한다.
50. volatility clustering(변동성 뭉침):
변동성이 대체적으로 낮은 수준으로 유지되다 특정 시기에 집중적으로 커지는 현상을 의미한다.


  • data관련 상황
총논문 갯수: 105598
총저자수: 128149
저자중 fullname이 없어서 제외한 저자수:16839
TOP5- 저자에따른 논문갯수
Kim, Dong-Hyun 253
Jang, Yang-Soo 228
Yoo, Jung-Hoon 226
Kim, Cheorl-Ho 214
Kim, Hyung-Min 211
  • 진행상황
cmb에서 데이터가 많은지라 출력하기 위해 하루전날 돌려 놓고 갔지만 이상하게 출력도 되지 않았고 계속 진행 중이었으며 오류도 감지되지 않은 상황이었음
그래서 다시 출력시도하였고 오류를 찾을려고 다시 진행중입니다.
  • 어려운점
python을 공부하고 익히고 있는지 벌써 두달이 되어가고 있는데 제자리 걸음만 하고 있는것같음
그래서 다시 가지고 있는 python책을 이용해서 기초부터 확실히 익혀가며 공부라 요구되어지고있는 상황
근데 지금 가지고 있는 책으로는 기초적인 부분은 익힐수 있지만 그책만으로는 어려움이 있는것같아서 책만 보고 해야하는것인지 아님 인터넷을 이용해 검색을해가며 해야하는것인지 그부분에 대해 다소 어려움이 있음
  • 진행상황
아직도 두번째단계인데 계속해서 변수적인 문제를 가지고 어려움을 겪고있다 저번에 비해 조금더 실마리를 풀어나가고있음
3월부터 다시 Python 책을 보면서 다시 처음부터의 개념가 필요를 할것같음
  • 진행상황
첫단계까지 한상태에서 두번째단계를 하고 있는데 첫번째단계와 다르게 저자를 중심으로 해서 리스트를 뽑아내기는 했지만 생각하는것과 다르게 변수가 있다고 생각이듬
저자를 중심으로 해서 작업을 하고 있지만 쉽게 되지가 않음. discussion이 필요할것같음.
  • 진행상황
이제는 세단계로 나누어서 작업을 하고 있는데, 그중 첫단계인 ID를 기준으로 그에 따른 mesh term, year, author별로 항목을 나누는것까지했음
그리고 '링크'라는 책을 읽고 있음.
  • 어려운점
지금까지도 항상 같은 어려움을 겪고있지만, 파이선에 대한 프로그래밍하는 거에대한 이해가 부족하고 계속적인 공부가 필요함.
  • 진행상황
ID와 mesh 부분의 자료를 뽑아서 파일화 했음
계속적으로 python책을 보면서 공부중.
  • 진행상황
현재 project부분에 관해서는 그전과같이 계속 진행중이며 계속적으로 python에 관해 책을보면 익히고 있음.
그리고 교수님이 추천해주신 책중 '21세기를 지배하는 네트워크과학'이라는 책을 읽고있음.
  • 진행상황
1월 19일 부터 '개념을 잡아주는 프로그래밍 정석이라는' 이라는 책을 가지고 좀더 개념적이고 상세한 부분에 대해서 공부하고 있으며
project에관해서는 지금현재 pubmed에서 필요한 자료를 뽑아내기 위한 스크립트를 작성중에 있음
  • 어려운점
스크립트를 작성함에 있어서 좀더 개념적이고 실전적인 부분에 대해서 공부가 필요함.
  • 진행상황
1월 11일부터 python책을 이용하여 처음부터 외우면서 익히는것 보다는 책에 나와있는 예시문을 연습해가면서 조금씩 적응해 나가는것에 중점을 두고 책을 보고있음
  • 어려운점
  1. 파이션에 적응하려고 공부를 하고 있지만 명령어에 따른 결과값을 볼때면 '이런거구나 하고' 생각이 들기도 하지만
    이것을 이용해서 어떻게 무엇을 만들어 내는건지 대해서 의문이들기도함.
Project: Construction of Korean Life Scientist Network (Node: Authors, Edge: Co-authorship)
  1. 어느 정도의 수준과 내용을 익혀야 하는지에 대해서도 잘모르겠음.
주어진 과제와 필요에 맞춰나가면 됨
Personal tools
Namespaces
Variants
Actions
Site
Choi lab
Resources
Toolbox