Friday, July 25, 2008

Randy Pausch 사망

Randy Pausch 교수가 사망했다는 소식이 오늘 cmu 메일을 통해 전해졌다. 개인적으로 아는 사이도 아니고 사실 일면식도 없지만, 조금 슬픈 기분이 들었다.

Randy는 췌장암으로 투병하다가 학교의 일을 그만두기 전 "Last Lecture"를 했었는데, 그것이 많은 사람들에게 감동과 화제를 주어 그 후에 방송 출연도 하고 전 미국에, 아니 전 세계에 매우 유명해지게 되었다. "Last Lecture"는 퇴임하는 노교수들이 공식적으로 마지막 강의를 하는 CMU의 프로그램인데, 주로 자신이 했던 학문적인 내용을 다루지만, Randy는 '어린 시절의 꿈을 이루다'는 주제로 강연했다. 당연히 영어로 강의했고 한 시간에 달하는 시간이지만, 영어도 쉽게 하고 죽음을 앞둔 사람이라고 생각하기 어려울 정도로 밝고 유머러스하게 강연했으니 한 번 보는 것도 좋지 싶다.

Randy Pausch's Last Lecture - Sep. 18, 2007

비록 일면식도 없는 사람의 죽음이지만, 강연 영상을 다시 들으며 조금 슬퍼졌다. 저렇게 밝고 긍정적이고 세상에 많은 도움을 줄 수 있는 사람의 죽음이라니... 나에겐 오늘 하루도 그저 지나가는 시간이었을 뿐인데 그가 갖지 못한 오늘 하루의 시간이었으리라 생각하니 그저 안타깝고 미안하다.

Randy Pausch 교수의 명복을 빈다. 이젠 더 이상 고통스럽지 않겠지.

Good bye, Randy...

Thursday, July 24, 2008

미국대통령도서관

최근 노무현전대통령의 기록에 관련해 국가기록원과의 마찰이 있는 것을 보면서, 대통령기록을 관리하는 법의 모델이었음이 분명해보이는 미국의 사례는 어떤가 조금 찾아보았다. 여러가지 재미있는 사실을 확인할 수 있다.


William J. Clinton Presidential Center from WIkipedia


미국에서는 대통령이 퇴임하게 되면 대통령도서관을 건립해서 전임대통령관련자료를 관리하고 있다. 전임대통령이 생존한 경우에는 대부분 공식 주소지가 대통령 도서관 주소로 되어있고, 전임대통령이 사망한 경우에는 대부분 대통령 도서관에 안장한다고 하니, 묘자리를 미리 봐두는 격이다. 보통은 대통령들이 고향 근처에 자리를 정하는데 이때는 NARA라는 우리나라로 치면 국가기록원과 군의 협조를 얻어 자료 운송을 최대한 안전하게 보장한다.

처음으로 대통령기록이 보존된 것은 프랭클린 루즈벨트 대통령때부터인데, 루즈벨트는 대통령의 통치기록이 퇴임과 동시에 흩어지거나 없어지는 것이 국가적으로 손실이라 판단하고 자신의 자료를 사재를 털어 기증한다. 뒤이은 트루먼 대통령도 같은 방식으로 기증하면서 일종의 선례가 되었고 1955년에 대통령도서관법이 제정되어 국가가 관리하도록 했다. 이같은 선례는 아직도 남아있어 자료수집이나 운송등에는 NARA가 관여하지만, 실제 도서관건립은 사재를 터는 듯이 대통령 관련 민간재단이 맡으며 이를 국가에 헌납하는 방식이다. 헌납이 되면 관리는 NARA에서 맡지만, 여전히 일부 관리비용은 민간 재단이 맡는 경우가 있는 것 같다.

대통령 도서관은 일종의 공공기관으로 추후에 자료를 공개하고자 하는 목적이 있다. 일단 퇴임을 하게 되면 대통령과 부통령에게 5년의 시간을 주어 자료를 분류하도록 한다. 이때 우리로 치면 지정기록물이 분류되어 퇴임후 최대 12년의 비공개기간을 설정할 수 있다. 지정기록으로 분류되지 않으면 퇴임후 5년 시점에 모두 공개된다. 기록은 서류, 사진, 비디오, 오디오, 심지어는 전화로그까지 모두 포함되며 대통령 도서관은 이 기록들을 열람하고자 하는 사람들에게 쉽게 열람하도록 하는 서비스를 제공하는 기관이다.

물론 종이서류들을 분류하는데 5년이란 기간이 길게 느껴지지는 않지만, 생산기간이 5년에서 10년임을 감안하면 그리 짧지도 않은 것 같다. 나름대로 분류도 되어있을거고. 어쨌든, 최장 5년의 필요비공개기간을 전임대통령에게 부여하고 있는 것과 같다. 물론 분류가 빨리 끝난다면 더 빨리 공개해도 되지만, 공개할 수 없는 자료는 12년짜리 딱지를 붙이면 되므로 질질 끌 이유는 없어 보인다.

이지원이라는 소프트웨어의 도움을 받았으리라 생각하지만, 퇴임과 동시에 '진본'이 국가기록원에 들어가있고 (이건 기정사실인 것 같고.) 비공개설정된 5%미만의 지정기록물이 이미 공개되어 현 청와대에서 이미 볼 수 있다는 봉하마을의 주장이 사실이라면 시스템적인 면에서 미국보다 훨씬 나은 시스템이라 생각한다. 물론, 운영하는 사람의 수준은 그와 별개지만.

(전산화된 기록물에 대해서도 좀 찾아 보았는데, 미국의 경우 아직 실시간으로 전산화하고 있지는 않은 것 같다. Presidential Electronic Record Library라는 프로젝트가 NARA주관으로 진행중이고 레이건, 부시, 클린턴의 자료를 전산화하고 있는 것 같으니 사후 전산화인 듯.)

군부대를 동원하여 (클린턴의 경우, 625톤 분량의 자료를 8대의 C-5기를 가득채워 아칸소로 옮겼다고 함.) 최대한 안전하게 전임대통령이 정한 위치로 옮겨주는 미국과, 전임대통령을 고발하겠다고 말해서 24개의 하드디스크를 들고 오자 (하드 용량이 얼마길래 12개밖에 안되는지는 모르겠지만, 워낙 하드가 싸니 뭐...) 서버 껍데기가 없다고 고발을 하는 이상한 모습이 너무도 비교된다.

레이건 대통령은 대통령도서관을 'Classroom of the democracy'로 표현했다고 한다. 정말 합리적인 민주주의의 교실로 국가기록원이 기능할 수 있을지, 치졸한 정치 모략의 도구로 사용될 지는 두고봐야 할 일이다.

References
미국 대통령도서관 :http://www.archives.gov/presidential-libraries/
클린턴도서관: http://www.clintonlibrary.gov/
위키피디아 대통령도서관: http://en.wikipedia.org/wiki/Presidential_library
NARA: http://www.archives.gov/
PERPOS Project: http://perpos.gtri.gatech.edu/

수학 표현 쓰기

이공계에게 수학은 언어와 같다. 명쾌한 수학적 표현을 통해 말로 풀어쓰는 것보다 내용을 훨씬 이해하기 편하고 다른 부가 설명없이 효과적으로 전달 하기 쉽다. 특히 영어의 한계에 부딪힐 수 밖에 없는 non-native에게는 수학적 표현을 통해 내용을 전달하는 것이 하나의 무기가 된다.

논문에서 수학은 언어와 같으므로 본문 작성을 하는 것처럼 매우 신중하게 표현하여 독자가 불편함을 느끼지 않도록 도와야 한다. 몇 가지 원칙이 있겠지만, 대원칙 하나는 일관성(Consistency)을 지키는 것이다.

논문을 쓸 때 때로는 수없이 많은 수학기호가 사용되므로 일관성을 지키면서 표현하기 위해서는 어느 정도의 훈련이 필요하다. 추천하고 싶은 방법은 논문을 Latex으로 작성하는 것이다. Latex에서의 수식 표현이 익숙해지면 수식을 작성하면서 해당 기호가 벡터인지 행렬인지 스칼라인지 등을 끊임없이 체크하게 된다. 때로는 수식 오류를 찾아내기도 하니 꽤 강력한 툴이 될 수 있다.

이해를 돕는 수식 표현을 위한 몇 가지 원칙을 생각해보자.
1) Convention을 따르자. 관련 연구가 전혀 없는 연구 주제가 있을런지 모르겠지만, 보통은 오랜 시간 쌓인 이전 연구 논문들이나 교과서가 있다. 이들을 잘 살펴보면, 같은 것을 표시하기 위해서는 보통 동일한 기호를 사용한다. 쓰고자 하는 논문을 읽는 사람들 역시 그 논문들을 주로 읽는 사람들이므로 이전에 계속 사용되어온 기호가 있다면 그 기호를 그대로 사용해야 이해하기 쉽다. 물론 논문 내에서 기호가 처음 도입될때는 뭔지 확정해 줄 필요는 여전히 있지만, 익숙한 기호를 사용한다면 독자들은 크게 신경쓰지 않고 내용을 이해하게 될 것이다.
정작 문제는, 새로 도입되는 변수나 표현의 기호를 정하는 것이다. 이미 수 많은 기호가 여러 논문에서 사용되었기 때문에 완전히 새로운 기호를 부여하는 것은 불가능하다. 이 때는 최대한 기존에 익숙하게 사용되던 기호를 피하면서도 새로 도입한 기호의 물리적 의미를 표현할 수 있는 기호를 정하도록 노력해야 한다. 만일 이것이 어렵다고 판단되면 최대한 가깝게 하면서 물리적 의미에 대한 그림을 넣어서 기호를 표시해 주는 방법으로 이해를 돕는다. 관건은 독자가 다른 의미의 양을 나타내는 것으로 오해하는 것을 막는 것이다.

2) 기호 표현의 원칙을 정한다. 예를 들어, 벡터와 행렬, 스칼라를 기호를 통해 구분하는 것이 읽는 입장에서는 매우 편하므로 확실히 눈에 들어올 수 있게 구분해 주는 것이 여기 속한다. 나의 경우에는 잘 알려진 교과서의 표현 방식을 따라, 스칼라는 이탤릭으로, 벡터는 볼드, 행렬은 타이프라이터 폰트를 사용하고 있다. 또 많이 사용되는 방법으로는 벡터를 소문자 볼드, 행렬을 대문자 볼드로 표시하는 방법이다. 이런 것도 역시 관련 연구의 Convention이 거의 정해진 경우가 많으므로 그를 따르는 것이 최선이다. 역시 독자의 편의를 최우선으로 하자.

3) 기호 변형은 하나씩. 제목을 달려니 조금 모호한 것 같다. 어떤 기호가 사용되면 해당 기호는 당연히 동일한 물리적 의미를 가져야 한다. 그러나 때로는 그 기호가 매우 추상적으로 사용되며, 어떤 경우에는 특정한 물리량을 나타내기도 한다. 예를 들어, 어떤 bilinear relation을 표현하기 위해 \mathbf{x}^\top \mathbf{T} \mathbf{x}라는 식을 쓴다고 하면, 이는 벡터 x와 행렬 T의 bilinear relation을 나타내는 것이다. 이는 관계만을 표현하는 것으로 추상적으로 사용된 것이다. 그러나 특정한 x에 대해서의 관계를 나타낸다면,
\mathbf{x}_i^\top \mathbf{T} \mathbf{x}_i와 같이 표현함으로써 x중 특정한 x_i의 식임을 나타내고 이는 특정한 물리량을 표현한다. 이와 같이 추상적인 표현과 그의 특정을 나타내는 경우, 앞에서와 같이 하나씩만 변형한다.
다른 예는 subset을 나타내는 기호인데, 예를 들어 어떤 잘 알려진 기호 T가 있다 하고, 이를 일반화하거나 또는 특정한 경우에 한정된, 그러나 동일한 물리량을 나타내는 기호를 쓰고자 하면, 보통 superscript나 subscript를 사용하여 T_g와 같이 표시한다. 여기서도 기호 T를 계속 사용하고 있음에 주의해야 한다. 만일 새로 제안한 것이라 생각해서 W나 Q와 같이 관계 없는 기호를 사용하면 독자는 T와 관련시키기 어렵기 때문에 이해하기 점점 어려워진다.
이 부분에서 또 하나 주의할 점은 \bar나 \hat, \prime등을 사용해서 변화시키는 표현을 사용하는 것이다. 보통 이와 같은 보조 기호들은 true, estimate, differentiation을 표현하는데 사용되는 경우가 많으므로 혼동시키지 않도록 주의해야 한다. 이것 또한 학계의 convention을 따르도록 노력하자.

4) 유도 과정은 어디까지? 수식들끼리 나열되어 있을때는 이전의 수식으로부터 다음의 수식이 직접 유도되도록 표시하는 것이 일반적인 방법이다. 즉, 굳이 연필을 들고 유도해보려 하지 않아도 눈으로 관계가 파악되도록 하면 최선이다. 독자들은 수식 유도 과정을 따라가지 못할때 상당히 스트레스를 받게 되므로 이를 잘 지켜주면 좋다.
이렇게 자세히 유도할때 문제는 크게 두 가지이다. 한 가지는 제한된 분량의 논문에 세세한 유도를 다 할 수 없다는 것, 또 한 가지는 너무 자세히 유도하다보면 동어반복이 일어난다는 것이다. 분량이 문제가 되는 경우에는 부록으로 빼는 방법도 고려할 필요가 있으나 어떤 경우에는 유도과정 중간결과가 유용하게 사용되는 경우가 있으므로 그러한 경우가 있는지 생각해 보아야 한다.
동어반복이 되는 경우는, 표현이 서로 다르지만 같은 말인 경우 문제가 된다. 독자들은 뭐가 다른지 생각하려하며 이 과정에서 오해할 여지가 생긴다. 그러므로, 수식유도는 적당한 선에서 진행해야 하는데, 이 선을 찾기가 그리 쉽지 않다. 한 가지 방법은 유도 과정을 최대한 자세히 쓰고, 반드시 필요한 부분을 남긴 후, 전후의 수식이 어렵지 않게 유도되도록 연결하는 것이다.
조금 어려운 경우는 매우 사소한 계산이 반복되는데 증명과정이 꽤 긴 경우이다. 이 경우 부록을 활용할 수 있으면 하고, 없으면 유도과정을 말로 간단히 설명하고 결과를 제시한다. 물론 위험부담이 있지만, 논문의 space도 중요한 자원이므로, 그럴만한 가치가 있는지 고민해 봐야 한다.

수식은 논문에서 매우 중요한 표현 방법이므로 본문 만큼이나 중요하게 여러 번 퇴고해야 한다. 수식도 문장의 일부이므로 구두점등의 사용을 신중히 고려하여 사용하고, 전체 문장을 언어로 읽으면서 자연스러운지 확인해야 한다. (Equation이나 inequality는 문장이다. 그렇지 않으면 phrase인데 언어의 단어가 없이 수식 phrase가 단독으로 나오면 매우 어색하니 주의.)