연구방법👨‍🔬

[연구방법] 논문, 효과적으로 읽는 법 — 초급자편

Vanilla ice cream ii 2021. 6. 12. 09:49

"과학/공학 분야의 논문들, ‘안’ 읽을 부분들을 잘 정해야 ‘잘’ 읽을 수 있습니다!"

Photo by Patrick Tomasso on  Unsplash

앞 포스팅 [논문, 효과적으로 읽는 법 — 입문자편] 에서 새로운 분야에 입문하는 독자를 기준으로 논문 읽기를 어떻게 접근하면 좋을지에 대해 살펴봤습니다. 특히, 수많은 새로운 논문들이 매일 쏟아지고 있는 현시대에 한 분야의 최신 기술들을 잘 따라가기 위해서는 논문 하나를 읽더라도 효과적으로 읽는 것이 중요한데, 이것을 위해서는 아이러니하게도 무엇을 ‘안’읽을지를 잘 결정해야 한다고 말씀 드렸습니다.

 

[연구방법] 논문, 효과적으로 읽는 법 — 입문자편

[누구나 이해하는 AI — 성공의 배경]에서도 다뤘듯이 현재 AI/머신러닝 기술과 관련한 새로운 제품과 다양한 연구가 매일 같이 쏟아지고 있습니다. 사실, 이런 활발한 연구활동은 꼭 컴퓨터 관련

aistory4u.tistory.com

 

그렇다면 입문자 다음으로 “초급자”를 위해 추천되는 논문 읽기 방법은 무엇이 있을까요? 오늘의 포스팅에서는 이것에 대해 제 경험을 바탕으로 이야기를 드려보려 합니다. 본격적으로 들어가기에 앞서 먼저 앞 포스팅에서의 몇몇 개념들을 다시 한번 짚어보겠습니다.


(이전에도 말씀 드렸다시피, 여기서 소개하는 방법들은 순수 제 개인적인 경험을 기반으로 공유하는 것으로, 다른 여러 방법들도 알아보시고 시도해 보신 후에 개인적으로 가장 잘 맞는 방법을 활용하시길 추천 드립니다. 구글에서 “논문 읽는 법”이나 “How to read academic papers” 정도로만 검색하셔도 유익한 다른 의견들을 접해보실 수 있습니다.)

 


 

논문의 기본구성과 “입문자”의 목표

먼저, 과학/공학계열의 논문을 기준으로, 논문의 구성은 Title, Abstract, Related Work, Methodology, Experiments, Conclusion 섹션들로 이루어집니다. 출판되는 저널이나 학회의 기본 형식에 따라 순서에 있어 약간의 차이는 있을 수 있지만, 구성하는 섹션들은 서로 대동소이합니다.

그리고 “입문자”와 입문자의 “논문읽기의 목표”에 대한 정의를 다음과 같이 했었습니다.

  • 입문자: 읽으려는 논문의 분야를 잘 모르는 상태의 독자
  • 논문읽기의 목표: ‘읽자마자 모든 것을 100% 체득하기 ’가 아닌, ‘해당 분야에 대해, 그리고 논문에서 무엇을 했다는 건지 대략적으로나마 알고 싶다’

그렇다면 이 포스팅에서 다루고자 하는 “초급자”와 초급자의 “논문읽기의 목표”는 어떻게 정의할 수 있을까요?


 

“초급자”의 정의와 논문읽기의 목표

사실, 입문자와 초급자라는 말의 어감에서부터 느껴지듯이, 사실 두 분류의 독자 간에 큰 지적차이는 존재하지 않습니다. 다만, 여기서 설명하는 “초급자를 위한 읽기 전략”은 이전 포스팅의 “입문자를 위한 전략”의 일종의 확장 버전으로, 입문자로서의 읽기를 이미 마친 후에 관련한 분야의 다른 논문을 ‘더’ 찾아 보고 싶은 독자를 “초급자”로 분류하겠습니다.

  • 초급자: “입문자”로서 한 논문을 이미 선택적으로 읽었으며, 해당 분야에 흥미를 느껴 다른 논문들을 더 찾아보고 싶은 독자
  • 논문읽기의 목표: 비슷한 연구 논문들을 통해 해당 분야의 전반적인 이해를 넓혀가고 싶다

그럼, 지난 포스팅에서 활용했던 딥마인드의 2013년 논문, “Playing Atari with Deep Reinforcement Learning”을 예시로 들어 설명하도록 하겠습니다. 즉, “초급자”인 독자는 이 논문을 가지고 ‘머리와 꼬리를 위주로 보라’는 ‘선택적 읽기’를 진행한 상태이며, 논문의 내용에 만족한 나머지 유사한 형태의 연구들을 더 찾아보고 싶어하는 상태라고 가정하겠습니다. 참고로 해당 논문은 arXiv에서 무료로 다운로드가 가능합니다.

 


 

방법1) Related Work 섹션을 활용하라!

섹션의 제목에서부터 알 수 있듯이, 이 섹션에서는 소개된 연구와 비슷한 연구를 진행했던 논문들을 소개합니다. 여기서 비슷하다는 것은 ‘해결한 문제’가 비슷할 수도 있고, ‘해결한 방법’ 혹은 ‘실험 방법’ 등이 비슷할 수 있습니다. 그러나 이 섹션이 있는 이유는 단순히 ‘유사품’들을 소개하는 것에 그치는 것이 아니라 그 연구들과 이 논문이 소개하는 연구의 차이점이 무엇인지 또한 강조해서 설명합니다. 예를들어 ‘과거 A와 B라는 연구는 이런 저런 한계점이 있었지만, 이번 연구에서는 그것을 개선했다’가 될 수 있습니다. 따라서 독자는 유사한 연구의 논문들을 찾아볼 수 있을 뿐만 아니라, 해당 분야 (예를들어 Reinforcement Learning) 의 현재까지의 발전사항도 대략적으로 배울 수 있게 됩니다.

예로 든 논문의 “3. Related Work” 섹션을 가지고 살펴보겠습니다.

Perhaps the best-known success story of reinforcement learning is TD-gammon … achieved a super-human level of play [24] ….

라고 문단을 시작하면서 TD-Gammon이라는 강화학습 프로그램이 가장 잘 알려져 있다고 소개합니다. 그리고 이 연구가 맨 마지막 섹션인 Conclusion 의 뒤에 있는 Reference 리스트 중에 24번, Gerald Tesauro의 논문에 해당한다고 알려주고 있습니다.

그 다음 문단을 보면,

However, early attempts to follow up on TD-gammon, including applications of the same method to chess, Go and checkers were less successful …

TD-gammon이후에 다른 응용 사례들에서는 그다지 성공적이지 않았다고 현재기준 강화학습의 수준한계를 설명합니다.

더 아래 문단들을 보면,

Perhaps the most similar prior work to our own approach is neural fitted Q-learning (NFQ) [20] … However, it uses a batch update that has a computational cost per iteration that is proportional to the size of the data set, whereas we consider stochastic gradient updates that have a low constant cost per iteration and scale to large data-sets …

자신들의 연구와 가장 비슷한 논문이 Martin Riedmiller의 20번 논문이며, 그러나 (However) 자신들이 사용한 (whereas 이후) stochastic gradient updates에 비해 batch update가 더 연산을 위한 비용이 더 비싸다는 것을 부각시키며 연구 간에 차이점이 있음을 설명합니다.

그리고 따라오는 마지막 본문에는,

The use of the Atari 2600 emulator as a reinforcement learning platform was introduced by [3] …

Atari 2600 게임을 강화학습 연구를 위해 사용한 연구들이 이미 존재 했음을 밝히고 있습니다. 따라서 독자가 이에 특별히 관심이 있다면 이 문단에 소개되고 있는 논문을을 찾아 읽으면 도움이 될 것입니다.


 

방법2) Google Scholar 활용하라!

위처럼 Related Work 섹션만 잘 골라보더라도 관심 있는 분야에 최소한으로 훑어봐야할 논문들의 리스트가 쉽게 가득차게 됩니다. 찾은 논문의 Related Work에 또 다른 논문이 있을 것이고 그곳에도 또 다른 다수의 논문들이 인용되어 있을테니까요.

그러나, 눈치가 빠르신 분들이라면 이런 방법의 한계를 알게 되실 겁니다. 바로, 논문 출판을 기점으로 ‘과거의 연구’들만 찾아볼 수 있다는 것입니다. 위의 논문이 2013년에 쓰여진 논문이니 최소한 2014년부터의 논문들은 저 논문의 어디를 찾아봐도 설명을 찾을 수 없을 겁니다. 그렇다면 최근까지 나온 논문들 중에 비슷한 연구를 진행한 논문은 어떻게 찾아볼 수 있을까요?

Google Scholar 메인 검색창에 예시 논문의 제목을 입력한 상태

바로 Google Scholar (https://scholar.google.com)가 이 문제를 해결해 줄 수 있습니다. 먼저, 위 캡처에서처럼 Google Scholar의 메인 검색 창에 읽은 논문의 Title을 적고 검색을 합니다.

검색된 예시논문의 엔트리

검색된 논문의 엔트리의 아래 “Cited by 6241”은 이 딥마인드의 논문이 ‘출판 이후’ 현재까지 6241개의 논문들에 인용이 되어 있다는 것을 의미 합니다. 그럼 이 “Cited by 6241”을 클릭해 보겠습니다.

예시논문을 인용한 2021년 이래 출판물들

위 예시는 왼쪽 필터를 ‘2021년부터의 출판물’로 지정했을 때의 결과를 보여주고 있습니다. 739개라는 수많은 결과가 검색되었습니다. 즉, 검색된 각 (2021년 이래) 출판물의 저자들이 우리가 예시로 든 딥마인드의 강화학습 논문을 자신들의 연구와 관련성이 있는 연구로서 인용을 했다는 뜻입니다. (필요에 따라서는 위에 “Search within citing articles”를 체크하신 후에 더 상세한 기준으로 검색하셔서 검색결과를 더 줄여볼 수도 있을 것입니다.)

이런 방식을 통해 더 근래 출판된 논문들 중에서도 관련 있는 연구의 결과들을 찾아볼 수 있습니다.

 


 

정리

지난 포스팅에 이어 효과적인 논문읽기 방법을 다뤄봤습니다. 특별히, “초급자”로서, 선택적 읽기로 읽어본 논문의 분야가 마음에 들었을 때, 관련있는 다른 논문들을 찾아볼 수 있는 방법으로 두가지 방법을 추천해 드렸습니다. 먼저, 읽은 논문의 이전 연구들을 찾기 위해 “Related Work” 섹션을 읽어볼 것, 그리고 반대로 그 논문을 인용한 최근 논문을 찾아보기 위해서는 “Google Scholar”를 활용할 것을 알려드렸습니다.

그럼 이어지는 포스팅들에서도 다양한 독자들을 위한 효과적인 논문 읽기의 방법을 공유하도록 하겠습니다. 읽어주셔서 감사합니다.

 

[연구방법] 논문, 효과적으로 읽는 법 — 입문자편

[누구나 이해하는 AI — 성공의 배경]에서도 다뤘듯이 현재 AI/머신러닝 기술과 관련한 새로운 제품과 다양한 연구가 매일 같이 쏟아지고 있습니다. 사실, 이런 활발한 연구활동은 꼭 컴퓨터 관련

aistory4u.tistory.com