마스터 알고리즘: 기계학습의 원리와 미래

페드로 도밍고스 교수의 『마스터 알고리즘』(원제: The Master Algorithm: How the Quest for the Ultimate Learning Machine Will Remake Our World)을 재미있게 읽었다. 저자는 자신이 “마스터 알고리즘”이라고 부르는 궁극의 기계학습 알고리즘을 만들기 위해 현존하는 접근 방식을 통합할 수 있는 방향을 제시하고, 그것이 실제로 구현되었을 때 펼쳐질 미래의 모습을 다소 낙관적인 관점에서 그려놓았다. 이 책을 읽고 얻을 수 있는 세 가지를 정리해 보았다.

본문 보기

함수형 사고

최근에 나온 번역서를 읽었는데, 찾아보니 원서는 2년 전인 2014년에 출간되었다.

명령형 방식으로 구현하던 로직, 디자인 패턴을 활용하던 설계를 함수형 프로그래밍에서는 어떻게 접근할 수 있는지 보여준다. 책의 제목이 함수형 언어가 아니라 함수형 사고라는 데서 짐작하겠지만, 언어 자체보다는 생각하는 방식의 전환과 확장에 중점을 둔다. 그래서 예제도 스칼라/그루비/클로저(Clojure)같은 함수형 프로그래밍 언어 뿐 아니라 자바8이나 함수형 자바로 구현한 코드가 나온다.

본문 보기

이나모리 가즈오의 회계경영을 읽고

회계에 대한 책이라서 지루할 줄 알았는데, 저자가 경영자로서 회계를 바라보는 관점이 인상적이고, 그가 세운 회계 원칙을 나의 분야에 대입해서 생각할 거리가 있었다.

A. 모르긴 몰라도 회계학의 내부를 들여보면 기술적인 복잡함이 상당할 것 같다. 하지만 저자는 그런 디테일에 압도되지 않고 경영에 필요한 도구로서의 회계라는 관점으로 중심을 잡고 있다.

본문 보기

Due: 마감시한을 필수로 요구하는 할일 관리 앱

요즘 알림 겸 할일 관리 프로그램으로 Due를 쓰고 있다. 이 앱의 특징은 할일을 추가할 때 반드시 마감 시한(Due)을 입력하도록 강제한다는 점이다. 그리고 시한 내에 처리하지 않으면 1분마다 계속 울리면서 일을 마치도록 재촉한다.

이 기능을 일종의 알람처럼 쓸 수 있는데, 가령 퇴근할 때 가져가야 할 물건이 있으면 퇴근 30분 전을 마감으로 등록해놓으면 웬만해선 잊어먹지 않는다.

본문 보기

개인주의자 선언: 어느 법률가의 따뜻한 시선

제목에서 느껴지는 어떤 차가운 거리감은 책 초반 몇 장을 지나면서부터 사라진다. 이후에는 마음이 따뜻할 것 같은 법률가가 들려주는 자기 경험담, 크고작은 사회 이슈에 대한 생각들이 남아 있다. 판사가 조용히 운영하는 블로그를 들여다보는 느낌이랄까. 중간에 나오는 에피소드들을 읽으면서는 가슴이 아팠다가, 코끝이 찡해지는가 하면, 희망의 이유를 발견하기도 했다. 세상에는 유명세를 타지 않아서 그렇지 여전히 좋은 사람들이 많고, 각자의 자리에서 나름의 노력을 하고 있다. 그것만으로도 위로와 격려가 된다.

본문 보기

모델 예측값 보정하기

데이터 분석을 하다 보면, 내가 모델을 만들기도 하지만, 다른 곳에서 만든 모델의 결과값을 사용해야 할 때도 있다. 남이 만든 모델을 잘 활용하기 위해서는 그 모델이 내놓은 예측값 (점수일 수도 있고 확률일 수도 있고) 의 의미를 파악하고, 필요하면 보정을 해야 한다. 이 보정하는 작업을 캘리브레이션이라고 한다.

쉽게 말해서, 어떤 분류기가 1점 만점의 점수를 내놓는다고 했을 때, 0.8점 받은 케이스를 100개 뜯어보면 실제로 80개가 맞아야 한다. 그래야 믿고 쓸 수 있다. 당연한 것 같지만 Probability calibration에서 Logistic Regression, Naive Bayes, Support Vector Machine의 Reliability Diagram을 보면, 모델의 성격에 따라서 예측값의 분포나 점수대 별 정확도가 차이남을 알 수 있다. 또, 경우에 따라서는 모델 예측값이 만점일 때에도 정확도가 100%에 못 미칠 수 있다. 이런 다양한 상황에서 믿을 만하게 캘리브레이션하는 방법이 필요하다.

본문 보기

blog built using the cayman-theme by Jason Long. LICENSE