星期五, 10月 26, 2007

20071026 雜記

想到兩件事,記下來以供日後參考。
  • 即使已經早上 10:10,中山高重慶交流道的北上車道依然排長龍,高速公路北上車流緩慢,一直要到過了康寧路的出口才見好轉。大車子很多,到處都是聯結車、貨櫃車、大卡車、油灌車、以及高高的箱型車。有一度我的前後四方通通都是這些大車子,視線極差,壓迫感又大,感覺起來好像快窒息了。
  • 我對項老師「資訊與歷史研究」所開出的參考書籍:The Text Mining Handbook: Advanced Approaches in Analyzing Unstructured Data 有著極端的兩種評價。一方面,認為這本書的抽象符號運用極差,許多概念都莫名其妙地被複雜化了(還是說,就是要用複雜的數學符號,讓讀者心生敬畏?)。另一方面,覺得它在 Link Analysis(連結分析:這應該是 Text Mining 相較於 Data Mining 比較特殊的一塊領域)與 Visualization(結果呈現)的部分相當不錯;如果用心去閱讀思考,似乎總能得到一些想法或靈感。

星期四, 10月 25, 2007

推椅子達人

小寶寶很喜歡推著 IKEA 的椅子四處遊走。


雖然也擔心(哎,做父母的就是會擔心東、掛念西)她已經一歲兩個月,卻還不怎麼會走路;但看著她推著椅子到處跑(在平滑的地板上行動速度頗快,真的頗有跑的感覺),還是覺得很可愛。

「推椅子達人」當之無愧。

代課:之二

昨天代完課以後,感覺頗為疲憊。

按理說,我既然自認為昨天的課堂內容是「這些時日整理後的精華部分」,講完以後應該覺得很輕鬆。但是,或許因為這一陣子準備投影片內容的壓力太大,還是讓我在實驗室發了一頓牢騷。

咦,不是得經高人指點,準備了一些作業、還把下個星期的課程轉變為「大家上台報告 term project 準備做些什麼」了嗎?

哎,怎麼還是這麼看不開啊?(說來容易,做來難啊。)

星期一, 10月 22, 2007

讀經:之二

一個月前,曾提到薇閣幼稚園的「讀經」課程,並讚嘆了一番。

今天幼稚園的老師說,班上已經有兩位小男生準備要「闖關」了,她問我小傢伙是不是也打算過一陣子去試試看。所謂的闖關,就是要能背誦半本「中國文化導讀 1」的內容。這兩位小男生的進度,其實已經超過學校安排的時程了。

幼稚園老師還問我,小傢伙在家裡的讀經狀況,每天大概花多少時間。

我說,先前每天大概 10-15 分鐘吧。小傢伙頗沒有耐性,超過 10 分鐘就會找各式各樣的理由與藉口,不肯再跟著我讀經了。不過,最近情況比較好,她通常可以乖乖地讀經 15-20 分鐘。

幼稚園老師少不了又是稱讚小朋友幾句(有時我會懷疑,幼稚園的老師是不是把小朋友說得太好了)。她說,那兩位小男生,可是每天花上一個多小時來背誦呢。

跟隨學校的進度,小傢伙目前已經背完「大學」的內容了。那些什麼「康誥曰」、「詩云」,什麼「所謂誠其意者,毋自欺也」、「君子賢其賢而親其親,小人樂其樂而利其利」文謅謅的句子,竟然也真的都能夠記住。

小朋友的記性,真的不能小看。

星期四, 10月 18, 2007

原來代課可以這樣進行

與朋友聊了一陣,大吐代課的苦水。

他倒是建議了許多很實際的解決方式。原來啊,是我自己太執著在課程與教學的內容了。既然是一門新學問,很多議題都還沒有好的解決方案,那麼,或許可以準備問題,讓學生們回答他們的看法啊。

這樣,不需如此可憐地準備投影片內容(對啊,這麼辛苦所為何來?),就可以撐過數個小時。

而且,歷史系背景與資訊科系背景的學生,所看的角度一定不同,就有機會可以討論整合的問題,那又可以拖過數個小時。

此外,還可以將一些問題準備好,然後請學生們「做作業」,下回就可以拿學生的回應來討論。這叫作「教學相長」,屬於 collaborate study,是很先進、很流行的研究方式。

哎,真是茅塞頓開。自己太執著於「想把投影片準備好」,所以也困在「如何在 THDL 中進行 text mining」的胡同裡,轉不出來。

不需用蠻力去解決。只要換個角度,輕鬆一些去面對,也就可以了。

星期三, 10月 17, 2007

「資訊與歷史研究」代課記

呼~好不容易代了一堂項老師的「資訊與歷史研究」的課,不自覺地重重吐了口氣。

這一陣子,除了家裡的事情外,心裡掛念的就是關於代課的事情。本來自己跟這堂課是沒有什麼牽扯的,但項老師公務繁忙,他不想親自上課,開了課又不好把學生趕走,所以就找我來代他上幾堂課。

哎,又不是我專長的主題,怎麼能代課呢?怨嘆也不是辦法,日子還是得過啊(而且,最好還是認真努力地去過)。於是,這幾個星期,都忙著惡補資料採礦 (data mining) 的相關技術,並且「可能的話,還必須把它們與 THDL 的資料串接起來」。

今天好不容易結束了第一堂課。由於我認為 text mining 基本上是沿襲自 document retrieval 與 data mining 的想法與技術,因此這一堂課,就是「從文件檢索、資料採礦,到文字採礦」。介紹文件檢索的基本問題與傳統模型,以及資料採礦中,「分類 (categorization or classification)」、「分群 (clustering)」、「關聯式規則 (association rules)」這幾個與 text mining 比較有關的主題。

雖然總是希望表現不要太糟,但聽眾的感覺、認為內容準備得是否充分、講得到底好不好,我其實也管不到。只能安慰自己說,無論如何總算是盡力了吧。

只是,想到接下來還要代四堂課,心裡就不禁發愁。唉,我該怎麼生出足夠的內容來填滿課程所需啊?真是令人傷腦筋!

星期日, 10月 14, 2007

還是太難

連續幾個星期在晚上熬夜,身體已經不堪負荷了。

熬夜的主要目的,竟然是「準備代課所需的投影片內容」。

說到頭來,還是因為自己生產力太差。一張投影片的內容,經常就需要花上數個小時的準備。

Text mining 所使用的許多技術,都是由 data mining 沿遞而來。自己對於資料採礦的理論與實務懂得本來就不多,要在 THDL 中妥善應用 text mining 來「發掘對歷史研究可能有幫助的 patterns」,當然更不是一件容易事。

許多時候,無法確定某種技術的應用效果,自己得構思可能的應用、寫程式去跑跑看、甚至「用手動的方式把結果畫出來」。

例如,下圖就是一個「淡新檔案中,常出現的文官,與其在戴炎輝分類的關係圖」。我的想法是,或許可以用這樣的圖表,來表示出「那些人可能關心什麼」。


例如,從這張圖裡,可以看到「劉銘傳」(當時臺灣最高行政首長)可能比較關心「鹽務、驛站、軍政、隘務」;而地方官員像是「方祖蔭」,則似乎關心相當多事情,從「吏務、鄉保」一直管到「抗租、霸佔」(以現在的觀點來看,若不是在任的時間長,方祖蔭操心這麼多不同事務,應該很容易過勞死,哈)。

光是這張圖,就花了我數天的力氣才弄出來。必須先構思可能有趣的關聯(想到「文官」與「分類」或許有關),想到如何呈現(例如,在此用 circle graph),寫程式分析這些文官出現在每個分類的案數(上圖中,每一條線表示該文官出現在該分類至少有四個案件),最後還得用 Visio 一個圈一條線地、慢慢繪出這張圖。

雖然仍不確定這樣的圖表「是不是真有什麼用途」(從前的歷史學家應該不怎麼關心這類問題;就算有興趣,缺乏電腦這樣的資訊工具,要畫出這樣的圖恐怕更要困難許多),但 circle graph 看起來頗有些美感,總還是能給自己一些安慰與成就感。

只是,即使已經竭盡所能,但已大致明瞭:預計要代的五堂課中,自己應只來得及準備好「三堂到三堂半」的內容。其他的部分怎麼辦?看來只好隨便抄些書本內容,「紙上畫畫、牆上掛掛」了。

總而言之,要準備 text mining 的代課內容,對我還是... 太難。

星期三, 10月 10, 2007

旁聽了一堂淡新檔案的課

星期一旁聽了一堂「淡新檔案」的課,覺得「實在太有趣了」。

怎麼會想去聽這種東西?顯然與實驗室所研究的 THDL(臺灣歷史數位圖書館)主題脫不了關係。

一直以來,我對 THDL Prototype 系統的定位就是僅在於「從前博士論文某些想法的實現」。雖然認為「一個好的檢索系統」應該「與資料庫文件的型態與內容」有關,但後者既難以定義、又與 domain knowledge 有關,因此多少讓自己以「專業知識不足」來加以推託。

這學期歷史系的吳密察教授開了「淡新檔案」的課程,並且要求學生使用 THDL Prorotype System 中的全文與影像內容,算是結合歷史研究與資訊工程領域的一種嘗試。

這一陣子為了代項老師上幾堂課,卻不知道該準備那些內容而煩惱。自己不懂的東西,實在太多;但要挑選自己還算了解的部分,卻總在內容的前後連貫上有著窒礙。更重要的是,Text Mining 到底有那些潛力,又應該如何在 THDL 上加以實驗、應用?

星期一旁聽後,發現若真要對歷史學者有幫助,應做、可做、該嘗試去做的事情,實在是太多了。

這令人既興奮又困擾。高興的是,在這麼短的時間內就發現如許多有趣的東西;煩惱的是,自己的體質欠佳,短時間狼吞虎嚥,那可是會噎到、會消化不良的...

星期六, 10月 06, 2007

抗生素的使用

小傢伙的生活習慣不好,常在東碰西觸後,用手挖鼻孔、甚至拿東西來咬。

衛生習慣不好,上幼稚園後就容易被傳染。前一陣子支氣管炎還沒有完全治癒,這兩天又得了感冒,流鼻水又不願意擤鼻涕,結果弄得鼻竇有輕微發炎,只好再帶去看醫生。

醫師用儀器幫她把鼻涕吸出來後,開了四天的藥。由於鼻竇發炎有細菌感染的現象,因此開了抗生素 AMOXIL(一種青黴素,通常用作第一線治療),一天四次劑量共 1000mg。

由於過量使用抗生素對身體並不好,且國人長期以來習慣大量施用,太太一直對小朋友服用抗生素抱持戒心。昨晚她查了藥典,發現 20kg 以下的小朋友,每天的劑量是 20~40 mg/kg。

小傢伙體重才 16 kg,因此每天合適的劑量應該在 320~640 mg,1000 mg 顯然太多。

早上打電話去詢問。這位醫師(就是先前小寶寶尿道感染的主治醫師,他現在自己開了一間「劉建宏診所」。我們認為他極有耐心,是個當代難得的好醫師。)在颱風天竟還有看門診。他解釋說,因為有發炎現象,第一線用藥有時甚至可以開到兩倍的劑量。每天 1000 mg 是沒有問題的。

在醫生保證絕無問題後,太太才放心地讓小傢伙繼續服藥治療。

颱風日的自由與寧靜

這兩個星期,幾乎每天都晚睡。

從兩年前回鍋做 post doctor 工作以來,幾乎就沒有熬夜的經驗了。但這幾個星期顯然不同。

颱風天放假,太太把小朋友帶去岳母家照顧,特意讓我有幾個小時的「自由時間」準備投影片的內容,相當感謝。

窗外風雨交加,屋內卻感到難得的平靜。寫了一些投影片內容後,匆匆記下這篇 Blog(即使有些草率敷衍的味道),以免網誌的記錄就此斷炊。