星期四, 2月 26, 2009

THDL-Pub 終於上線了

忙碌了一個多月,今天總算是把 THDL 的公開版放到網路上,提供學者專家申請使用。

這個版本包含了明清檔案」與「古契書」的全文與 metadata,另外也加上「故宮人名權威檔」與「國家圖書館明清人物小傳」的資料。而功能上,除了一般的全文檢索、檢索後分類、自訂文件集、詞頻分析等老面孔之外,另也多出一份「文件年代分佈圖」。

仍然不曉得這些東西是否可以對歷史研究者產生多大的幫助。尤其是,使用者很可能因不熟悉系統功能,而只會進行傳統形式的檢索。如此一來,「希望這些新工具能提供不同視野或角度」的初衷也將大打折扣。

不管怎樣,總是告了個段落,到達一個新的里程碑。

那麼,接下來是不是可以好好地休息一陣子?

人算不如天算。繼兩個小朋友感冒之後,自己也發燒喉嚨痛、四肢酸軟。醫生說,我沒有注射流感疫苗,這症狀應該是得了流感。吃過藥,喉嚨是舒服了許多,但仍然覺得昏昏沈沈,全身無力。

星期六, 2月 21, 2009

休兵時刻

燃燒了一整天的小宇宙,賣力測試的人都喊累了。鳴金收兵,先小憩一陣子再說。

不巧兩個小朋友都感冒了。雖然不是很嚴重的病毒感染(聽醫生說這一陣子有很多小朋友上吐下瀉),但聽到她們的咳嗽聲,心裡總不免擔憂難過。

心頭掛念著幾個「應該與統計相關的應用問題」,但因為對些問題的本質感覺頗為模糊,不知道該從哪裡下手。攤開統計學的教科書,亂看了幾個章節,感覺起來問題似乎屬於「多變量分析」,但卻又隱隱與「無母數分析」或「假設檢定」有關。

雖然太太是學統計的,但她說她的「多變量分析」並沒有學好,且專心照顧家庭這麼多年,除了重要的基本概念,有很多東西她都忘了。

自己並沒有懂多少統計的東西。趁著休兵時刻,就稍稍讀些統計書,看看能不能多學到「一丁點」重要基本概念...

星期五, 2月 20, 2009

馬不停蹄修程式

項老師希望下週即將公開的 THDL-Pub (給歷史學者使用的特殊版本)不要出太大的紕漏。

要加上一堆說明網頁,建構使用者意見回饋(尤其是更正資料錯誤)的機制,還要有一個簡單的帳號申請流程。光是這些拉拉雜雜的東西,就足以讓人忙上一陣。

此外,由於我一直把 THDL 系統定位在 prototype(實驗雛型)階段,因此在錯誤的處理上一直沒有花夠多的力氣。項老師前天強力要求實驗室成員幫忙測試,因此光是昨天,就收到許多大大小小的錯誤回報(包含系統錯誤、連結不對、描述不當等)。

從早上忙到夜半,並不時把修正的程式放上系統請大家再繼續測試。算了算,應該也修正了十來處地方呢。

很久沒有這樣與許多人密切地合作開發了。不斷地有人提出建議、回報錯誤,自己則不停地修正更新。頗有在兵荒馬亂戰場上作戰的感覺,雖身體實在疲累,但心頭卻火熱熱地,鬥志昂揚。

燃燒吧!小宇宙。

星期六, 2月 14, 2009

在地下書街買童書

小傢伙開學一週,日常作息又逐漸規律且忙碌起來。

理想上,載小傢伙上學後,自己就應有一個上午的空閒時光,可以吃頓咖啡早餐,聽聽音樂看看書。但或許是因為睡眠不甚足夠,自己總覺得不怎麼對勁,煩煩躁躁地。

於是,無法好好地靜下心來,會想四處亂逛,「在不怎麼算浪費的程度下,買些應該可以派上用場的東西」。

於是,搭捷運到地下書街買童書。

挑了十幾本童書,打個七五折後的價錢,算算竟比我買兩本原文書還要便宜。童書有小朋友看,而原文教科書買回家後幾乎都只能擺在書櫃上佔空間,當然前者比較有實用價值。

不過,花錢所能得到的滿足感,通常都無法持久,有時甚至只能維持幾個小時。即使是買到好書的興奮,才過一天就被日常生活的瑣事給消磨殆盡了。

星期六, 2月 07, 2009

睡午覺真好

這幾天疲憊不堪,今天太太帶小朋友們到大湖採草莓,留我在家裡。

雖然這是難得的數小時光陰,但自己其實也閒不下來。趁著空檔修補了幾個學弟妹們回報的 THDL 系統錯誤,也花了許多時間整理灑滿小朋友玩具的客廳,並稍稍清理一下自己的桌面。

不管怎樣,總還是在輕鬆安靜的情況下睡了半個小時的午覺。感覺很是舒暢。

星期四, 2月 05, 2009

大呼小叫過一天

照顧小朋友是很奇怪的:小朋友可愛的時候,會有幸福感;但一般說來,大呼小叫的時刻比較多。

今天早上就是這樣。太太有事先行出門,由我來照顧幾個小時。小隻的起床換好衣服、喝完「阿奶」、換好幫幫,大隻的還賴在床上看故事書,不肯去刷牙吃早餐。催促了半天,她小姐才慢慢地行動。

接下來,要帶姊姊讀經,妹妹卻在旁邊亂。姊姊本來就是「一邊玩、一邊跟著爸爸讀」,可是不管姊姊玩什麼,妹妹都一定要插一手,弄得兩人氣氛緊張,然後上演全武行。

「把巴,妹搶我的玩具。」姊姊告狀了。

「妳就讓她嘛,玩別的玩具啊。好,跟著我繼續讀經...」

過了一陣子。

「拔~叫妹走開啦,她這樣我沒辦法讀經。」

「妹,到爸爸這裡來。」我隨手拿起一只玩偶,叫妹妹過來我這裡。

「啊!嗚...嗚...」妹妹不理爸爸,開始打姊姊、扯姊姊的頭髮,姊姊開始哭泣。

「妹!不可以打姊姊!去罰站!」我生氣了,把讀經本放下,拎著妹妹到旁邊罰站。

「為什麼被罰站?」我問小小傢伙。

「因為我打姊姊。」她還知道做錯了什麼事。

「為什麼要打姊姊?」

「我要打姊姊,我一定!」小小傢伙露出很堅定的表情。

「不可以,打姊姊就要罰站!不可以打姊姊,知道嗎?」

「知道。」小小傢伙的語氣終於緩和下來。

罰站幾分鐘後,妹妹問問說可不可以離開,我說好,但不可以欺負姊姊。

過了沒多久,類似的情節再次上演。這回妹妹一定要拿姊姊手上的神奇寶貝圖卡,但姊姊不肯讓她。我把妹妹抱開,勸她玩別的玩具,但小小傢伙不聽,說她一定要姊姊的圖卡。

就這樣,原本二、三十分鐘就可以讀完一遍,在聲嘶力竭下竟然花了將近一個小時。

星期一, 2月 02, 2009

緊迫盯人

天氣好,帶小朋友到淡水曬太陽吹泡泡。才剛回到家,手機就響了。

是負責 THDL 公開版時程的學妹緊迫盯人。詢問一些開發、測試、與資料移轉的相關進度,並問我哪一天會去實驗室。喔,我以為這個星期仍是假日,還想盡量帶小朋友出外遊玩呢。

其實,這個春節假期基本上並沒怎麼清閒,幾乎每天都在跑程式。原本拿到新的資料,就需要三、四天的時間才能將資料庫所需的採礦資訊計算出來(是 24 小時不停地跑程式喔)。但處理了幾天,才發現上游給的輸入資料有一點小錯誤。手動將錯誤刪去後重跑一次,這樣就已經耗去一個多星期了。

接下來,又發現新資料的檔名有了變化。從前來源資料的檔名是以 .txt 結尾,但現在有些文件內含表格資訊,它們的檔名就會改用 .xml 結尾。這些改變雖不會造成檢索上的困擾,卻會對學妹辛苦處理的「上下手契」造成檔名對應不到的問題。過年期間不好麻煩別人,只好自己寫程式進行檔名的對應與轉換。

所以嘛,其實也是在兩三天前,才告個段落,把工作放下的。

剛剛又收到訊息,說是新版的資料其實還有其他錯誤,因此還是得重跑。唉,雖然心裡也知道必然會發生這類情事,但碰上了,卻也很難有好心情去面對...

一直覺得,加班趕工一天,就需要兩天的休息時間,才能讓自己的神智恢復清醒。等這個公開版完成後,一定要好好地休息一陣子。