Skip Navigation
Skip to contents

대한견·주관절학회 E-NEWSLETTER Vol.02 Decomber 2020 대한견·주관절학회 E-NEWSLETTER Vol.02 Decomber 2020

대한견주관절학회

  • 학회 홈페이지
  • 원문보기 pdf
  • 메뉴보기
발행인: 오주환 / 편집인: 조남수, 김정연 / 발행처: 사단법인 대한견·주관절의학회 홍보위원회 / 후원 : 사단법인 대한견·주관절의학회 발행인: 오주환 / 편집인: 조남수, 김정연 / 발행처: 사단법인 대한견·주관절의학회 홍보위원회 / 후원 : 사단법인 대한견·주관절의학회

내 의학의 동반자: 데이터 사이언스

가천대 길병원 정 규 학


안녕하십니까. 정말 대단하신 많은 선후배 선생님들께서 계신데 저에게 이런 글을 쓸 수 있는 영광스러운 기회를 주셔서 정말 감사드립니다. 저는 제 관심사인 데이터 사이언스에 대해 말씀을 드릴까 합니다. 요즘 많은 분야에서 각광받고 있는 데이터 사이언스라는 말은 개별 데이터에 대한 통계적 분석이외에도 빅데이터 분석을 통한 산업적 적용, 최근에는 인공지능 알고리즘까지 광범위하게 쓰이고 있습니다. 하버드 비즈니스 리뷰에서는 21세기의 가장 섹시한 직업으로 데이터 사이언티스트를 꼽기도 했으니 전세계적으로 이미 이에 대한 관심은 대단하다 하겠습니다.

사실 많은 분들처럼 저에게도 통계학은 예과때 의학통계를 ‘정말로 잠시’ 접하고 넘어갔다가 본4때 예방의학에서 ‘잠시’ 스쳐가는 과목이었습니다. 전혀 개념이 없다 보니 레지던트 때 메타분석 논문을 리뷰하는 과정에서 용어들을 이해하지 못해 밤을 새며 머리를 쥐어뜯었던 기억도 있습니다. 벌써 10년전인 군의관 때 우연한 기회에 헬스케어 MBA 라는 스터디 모임을 하며 데이터 사이언스에 대해 처음 관심을 갖게 되었습니다. 당시 군의관이셨던 배정민 선생님(현 가톨릭대 피부과 교수)께서 군의관들을 대상으로 일동병원에서 통계 강좌를 하셨는데 4개월 코스로 들으며 기초 지식을 쌓을 수 있었습니다. 그로부터 1~2년뒤 ‘닥터배의 술술 보건의학통계’라는 현재 의사들 사이에서는 꽤 유명한 통계학 책이 발간되었으니 그야말로 저는 저자 직강을 듣는 영광을 얻었던 셈입니다.(그림1) 그래도 군의관 때 4개월간 수강했던 서울대병원 주최의 의학통계 심화과정이 가장 유익했습니다.(그림2) 의학에서 많이 쓰는 통계적 지식을 전반적으로 다루며, 시험도 봤던 나름 힘들었지만, 이때의 통계학적 지식은 펠로우 시절 논문 작성시 큰 도움을 주었습니다.

<그림1. 닥터배의 술술 보건의학통계. 배정민 저> <그림2. 의학통계 심화과정. 서울대병원 MRCC 주최>

그러나 저에게 가장 큰 영향을 준 것은 펠로우 시절부터 다녔던 서울대 보건대학원에서의 보건통계학의 경험이었습니다. 대학원에서 다루는 대부분의 사회과학의 데이터는 매우 크고, 변수가 매우 많고 소위 ‘지저분한’ 데이터가 많습니다. 병원 업무와 병행하며 여러 과제와 시험, 마지막 석사 논문까지 저 혼자 해결하는 과정에서 SAS, R, STATA 및 여러 통계 이론들을 ‘생존을 위해’ 배울 수 밖에 없었습니다. 특히 학위 논문에서 복잡한 입체적 데이터인 패널데이터를 사용하여 수십만 건의 데이터를 마이닝하고 분석하는 과정에서 수업 외의 다른 통계 강좌도 듣고, 전문가의 조언도 받으며 그 과정에서 매우 힘들었지만 많은 발전이 있었습니다. 그 덕분에 현재 논문 작성과 관련된 모든 통계적 분석은 대부분 제가 혼자 해결하고 있습니다. 최근엔 COVID19 건보데이터를 분석 중인데 이 또한 쉽지 않은 부분이 많네요.

하지만 데이터 분석에 관심을 갖는 분이라면 어쩔 수 없이 빅데이터에 관심을 갖게 되고 최근 가장 핫한 주제인 머신러닝과 딥러닝을 바라볼 수밖에 없습니다. 저 또한 좀더 체계적이고 깊은 통계학적 지식을 쌓고 인공지능 알고리즘을 배우기 위해 현재는 방송통신대학교 바이오정보통계학 석사과정중에 있습니다. 물론 병원 업무에 치여 수업도 제대로 못 듣고 시험 공부도 못해서 학교를 좀 오래 다니게 될 것 같기는 합니다만. 어떤 학문이든 마찬가지겠지만 통계학 또한 상당히 많은 시간과 노력이 요구됩니다. 다만 여러 통계 프로그램들을 다룰 줄 아는 것만이 중요한 것은 아닙니다. 예를 들면 SPSS 방법을 아는 것이 중요한 것이 아니라, 데이터의 구조가 어떨 때 어떤 통계방법이 적용되어야 하는지 늘 생각하는 것이 훨씬 중요합니다. Deep learning 을 보더라도 Python을 다루는 방법도 물론 중요하지만, 이론의 바탕이 되는 퍼셉트론의 개념이나, 경사하강법의 원리 등을 이해하는 것이 더 중요합니다. 또한, 기본적인 데이터의 구조와 특성을 분석하는 연습을 많이 해보는 것이 중요합니다. 당연히 실제 데이터에 이론을 적용하고 직접 분석프로그램을 짜보는 연습을 많이 해보는 것이 가장 중요하겠지만요. 저는 데이터 분석시에 예전의 여러 수업자료들을 확인하고 자주 쓰는 syntax 코드는 따로 정리해서 필요할 때 복사해서 사용합니다. 데이터 분석에 관심이 있으신 분이라면 틈틈히 시간만 낼 수 있다면 정말 많은 강좌들이 많습니다. 저는 서울대 한국사회과학자료원(KOSSDA)의 오프라인 특강을 여럿 참석했었고 많은 도움을 받았습니다.(그림3) 온라인 강좌를 원하시는 분은 K-MOOC 같은 무료 강좌(그림4) 또는 Udemy 같은 유료 강좌(그림5) 등을 이용하셔도 됩니다. 서울성심병원 정형외과 김지형 원장님의 강의 동영상, 블로그, 책자는 예전부터 유명했으니 많은 도움을 받으실 수 있을 것입니다.(그림6) 인공지능이론에 관심이 많으신 분은 홍콩과기대 김성훈 교수님의 유투브를 통해 입문하는 것을 추천합니다.(그림7)

영상의학을 필두로 데이터, 영상을 분석한 인공지능 기술에 대한 연구와 소프트웨어의 개발이 활발해지고 있습니다. 시간이 지날수록 의료 전반적으로 이러한 경향이 보편화 되는 것은 시대적 흐름입니다. 이러한 상황에서 데이터에 접근하고 이를 분석하는 방법론을 배우고 익히는 것은 이제는 정형외과 의사에게도 선택이 아닌 필수가 되고 있다고 생각합니다. 감사합니다.

<그림3. 한국사회과학자료원(KOSSDA) 방법론 교육 프로그램>


<그림4. K-MOOC 강좌 사이트> <그림5. Udemy 온라인강좌>


<그림6. 김지형 원장님의 YouTube> <그림7. 김성훈 교수님의 YouTube>


COPYRIGHT 사단법인 대한견·주관절의학회. ALL RIGHTS RESERVED.

사단법인 대한견·주관절의학회 서울특별시 동대문구 무학로 193-1, 지하 1호 (Tel. 02-2072-3930)