이번 학기에는 수업을 두 개 듣는다. 하나는 Computational Biology이고, 다른 하나는 Information Retrieval 이다. 앞의 것은 나도 연구실 사람들이 하는 대화를 이해해 보고 싶어서 듣는 것이고 (참 에피소드도 많이 만들었다. 예전에는 'transcription' 이 뭐에요? 라고 했었고, 얼마전엔 'promoter'가 뭐냐고 물었었으니...) 뒤의 것은 개인적인 관심사때문에 수강한다. (심지어 양자역학 3도 포기하고 듣는다 ㅠ_ㅠ)
연구실의 NYSE 데이터를 바라보고 있을 때 마다 '저걸 어째야 써먹을까' 같은 생각을 종종 했다. 일반적인 지금의 방법으로는 테라바이트급 단위에서 커피 타러 나가는 시간보다 빠르게 원하는 부분의 데이터를 뽑아낼 수가 없다. (갑진형이 꾸준하게 삽질하는 이유이기도 하다.) 또 다른 관심으로, 이올린정도의 서비스를 운영하는 과정에서 query 설계가 어떻게 되어야 하는지 그것도 본격적으로 배워보고 싶었다.
두 수업 모두에서 많은 것을 배우고 있다. CB의 경우는 별별 이야기가 나올 수 있을듯. IR의 경우에는 정말 잘 듣고 있다. 시간마다 내가 얼마나 DB나 middleware에 대해서 주먹구구식으로 알고 있었는지 느끼고 있다. 컴퓨터공학과 수업이라기 보다는 수학 수업 같지만 그 안에서 배우고 있는 것은 기대했던 정도를 훨씬 넘어가고 있다. Top-k query에서 '정성적인 부분'을 어떻게 처리할 수 있는가에 대한 논문과, query 자체를 phase space로 매핑하고 상관성을 본다거나 자동으로 최적의 쿼리 알고리즘을 선택하도록 하는 논문이 기억에 가장 남는다.
대신 로드는 상당하다. 일주일에 거의 100 페이지씩의 논문을 읽어가야 한다. 게다가 영어 강의인데 강의가 논문 리뷰 후 학생의 프리젠테이션, 교수님의 코멘트 식으로 이어진다. 되든 않든 모르거나 궁금하면 일단 질문부터 하는 성격이라 영어 질문은 참 힘겹다. (내가 아니라 듣는 사람들이 괴롭다. D.O.G. 동민들은 공감할 듯.)
기록하다보니 무슨 수업 소개가 되어버렸다는...
'IR'에 해당되는 글 1건 ATOM
- 2007/03/24 inureyes information retrieval 8