글또 6기 다짐글
글또를 하게 된 이유
글또는 글쓰는 개발자 모임이다.
글또를 운영하시는 성윤님 블로그나 링크드인을 자주 보는 편이라 글또라는 모임이 있다는건 알고 있었지만 막상 직접 참여해볼 생각은 별로 없었던 것 같다. 글또 6기 지원은 아주 우연한 계기로 하게 되었다. 연합동아리 활동을 같이 했던 친구를 만나 얘기를 하다가 요즘 블로그에 글을 가끔 쓰는데 꾸준히 쓰는게 쉽지 않다고 하니 글또 활동을 추천 받았다. 5기 활동을 했던 친구였는데 본인이 썼던 글들을 보여주면서 어떤 방식으로 활동을 하는지 설명해주었다. 그리고나서 지원서 링크를 카톡에 보내주었는데, 버스타고 집에 오면서 슉슉 작성해서 제출해버렸다.
일단 제출을 하고 나니 글또를 해야하는 이유를 찾기가 더 쉬워졌다.
- 일단 글또 활동을 하게 되면 2주에 한번을 글을 써야 하는데 난 어차피 블로그에 카카오 애드핏을 붙이려고 했으니까 2주에 하나는 무조건 써야함. 겸사겸사 하는거지 뭐(카카오 애드핏을 붙이려면 3개월 동안 글 20개를 써야한다.)
- 내가 쓴 글을 피드백 받을 수 있음. 석사논문을 쓰면서, 취업하고 일을 하면서 난 글을 쓸 때 피드백 받고 안받고 차이가 큰 사람이라는 걸 깨달았음. 혼자 글쓰면 나만 알아볼 수 있게 쓰고 끝내는데 피드백 받으면 훨씬 나아지겠지.
- 그동안 생각만 해놓고 안썼던 글들을 쓰게 되지 않을까? 예를 들면, 석사논문 주제(interpretable ML) 관련된 내용들, 일할때 자주 사용하는 XGBoost, LightGBM 하이퍼파라미터 완벽하게 이해하기(논문을 너무 띄엄띄엄 읽어서 왜 그렇게 되는지 모르고 일단 쓰는중임. 일단 논문 읽으면 알 수 있는 건지도 잘 모름) 같은거?
글또 활동하면서 쓰고 싶은 글 목록
위에도 조금 쓰긴 했지만 다른 분들 다짐글을 보니 리스트를 쭉 작성하시는 것 같아서 왠지 나도 해야만 할 것 같아졌다.
- 석사논문 관련 토픽 탐구: 언젠가는 한번 해봐야겠다고 생각만 하고 있었다. 석사논문은 처음 생각했던 방향과는 전혀 다르게 끝나버려서 망한 논문이라고 생각하고 있긴 하지만 어쨌든 그래도 내가 쓴거니까 다시 한 번 보고 싶긴 했다. 그래도 1장에 기존 방법들 정리한 부분은 나쁘지 않게 쓴 것 같기도 하고. 그때는 interpretable ml 관련된 논문은 거의 다 읽어봤던거 같은데 안읽어본 논문도 있고, 그 사이에 논문들이 왕왕 나와서 팔로우업을 한번 해보긴 해야할 것 같기도 해서. 어떤 방식으로 쓰게 될지는 아직 잘 모르겠다.
- XGBoost, LightGBM 하이퍼파라미터 완벽가이드: '파이썬 머신러닝 완벽가이드'라는 책이 있다. 내가 본 파이썬 ML 책 중엔 가장 실용적이었는데, 비슷한 컨셉으로 XGBoost와 LightGBM 하이퍼파라미터에 대한 글을 써보고 싶다. 일하면서 가장 많이 사용하는 모형들인데 파라미터는 항상 대충 때려넣고 써가지고 아직도 뭐가 뭔지 잘 모르고 있다. 전처리에 치여서 살다보니 모형쪽은 신경을 별로 못쓰게 되는 것 같아서 이번 기회에 정리를 좀 해봐야겠다는 생각이 든다.
- 싱글코어에서 대용량 데이터 최대한 빠르게 처리하기: 살기위해 꼭 공부해야하는 부분이다. 병렬처리? 스파크? 나도 이런거 써보고 싶다. 놀랍게도 대용량 데이터(테라바이트 단위)를 싱글코어로 처리하는게 강제되는 환경에서 일하고 있다. 이제 일한지 2년이 다되가는데 일하면서 해본 대부분이 싱글코어에서 최대한 효율적으로 작동하는 전처리 코드를 만드는 일이다. 사실 정말 효율적인지도 잘 모르겠다. 부서에서 모두 파이썬을 사용해서 나도 지금은 파이썬을 사용하고 있는데(원래는 거의 R만 사용했었음. 석사논문도 R로 씀), 일을 더 빨리 끝낼 수 있는 다른 방법이 있지는 않을까??(야근을 줄이고 싶다) 일단 생각하고 있는건,
- 파이썬에서는 판다스 데이터프레임 -> 넘파이 어레이로 구조 바꾸기
- 줄리아가 언어 자체는 더 빠르다니까 줄리아 써보기
- 쉘 스크립트로도 간단한 처리는 가능하다는 것 같고, 속도가 엄청 빠르다는데 이것도 해보기
- Skope-Rules 리뷰: 작년에 본사에서 기능 개발 하면서 참고했던 패키지인데, 코어 코드 보다가 구현이 잘못되어 있는게 있어서 난생처음으로 pull request를 해봤는데 contributor로 넣어줬다. 아는 사람이 별로 없는 패키지 일 것 같긴 하지만 그래도 나름 scikit-learn-contrib이긴 해서 리뷰를 한 번 해보는 것도 좋을 듯.
- 주식 벡테스팅 환경 구축: 사실 지금 최대 관심사는 이거다. 최근에 작성하고 있는 블로그 글들 다 주식 관련된 것 밖에 없음. 지금은 파이썬 증권데이터 분석 이라는 위대한 책을 주로 참고하면서 기술적 분석 위주로 정리해보고 있는데 재무제표 데이터 모으는 작업만 좀 어떻게 정리가 되면 퀀트 쪽을 제대로 파보고 싶은 생각이 있다. 두물머리 이현열님의 R을 이용한 퀀트 투자 포트폴리오 만들기라는 책도 요즘 보기 시작했는데, 이제는 파이썬이 R보다 더 익숙해져서 이 책에서 컨셉을 공부해서 파이썬으로 구현해보는 걸 해보게 되지 않을까 하는 생각이든다.
이거 말고도 생각나는게 더 있긴한데 위에 쓴 걸 6개월 안에 다 할 수 있을지 감이 오지 않는다.
글또 활동을 위한 준비
드디어 리얼포스 키보드를 샀다. 지금 리더스키 용산점에 가면 리얼포스 민트그린(텐키리스, 30g/45g 균등), 민트블루(풀사이즈, 30g/45g 균등)을 구매할 수 있다(맥용을 아직 들여올 계획은 없으시다고 함). 최근에 미장이 폭락(건강한 조정)하면서 한달치 월급이 없어졌는데 이런 경험을 몇번 하다보니 그냥 실물을 사서 행복도를 높이는게 정신건강에는 훨씬 좋은 것 같다는 생각이든다.
지금 컨설팅 프로젝트 오픈(10월 예상)이 슬금슬금 다가오면서 정신적으로 신체적으로 피폐해져가는 중이라 글쓰기에 집중할 수 있을지 잘 모르겠다. 그래도 일단 하기로 했으니까 해야겠지.