忙碌了一個多月,今天總算是把 THDL 的公開版放到網路上,提供學者專家申請使用。
這個版本包含了明清檔案」與「古契書」的全文與 metadata,另外也加上「故宮人名權威檔」與「國家圖書館明清人物小傳」的資料。而功能上,除了一般的全文檢索、檢索後分類、自訂文件集、詞頻分析等老面孔之外,另也多出一份「文件年代分佈圖」。
仍然不曉得這些東西是否可以對歷史研究者產生多大的幫助。尤其是,使用者很可能因不熟悉系統功能,而只會進行傳統形式的檢索。如此一來,「希望這些新工具能提供不同視野或角度」的初衷也將大打折扣。
不管怎樣,總是告了個段落,到達一個新的里程碑。
那麼,接下來是不是可以好好地休息一陣子?
人算不如天算。繼兩個小朋友感冒之後,自己也發燒喉嚨痛、四肢酸軟。醫生說,我沒有注射流感疫苗,這症狀應該是得了流感。吃過藥,喉嚨是舒服了許多,但仍然覺得昏昏沈沈,全身無力。
星期四, 2月 26, 2009
星期六, 2月 21, 2009
休兵時刻
燃燒了一整天的小宇宙,賣力測試的人都喊累了。鳴金收兵,先小憩一陣子再說。
不巧兩個小朋友都感冒了。雖然不是很嚴重的病毒感染(聽醫生說這一陣子有很多小朋友上吐下瀉),但聽到她們的咳嗽聲,心裡總不免擔憂難過。
心頭掛念著幾個「應該與統計相關的應用問題」,但因為對些問題的本質感覺頗為模糊,不知道該從哪裡下手。攤開統計學的教科書,亂看了幾個章節,感覺起來問題似乎屬於「多變量分析」,但卻又隱隱與「無母數分析」或「假設檢定」有關。
雖然太太是學統計的,但她說她的「多變量分析」並沒有學好,且專心照顧家庭這麼多年,除了重要的基本概念,有很多東西她都忘了。
自己並沒有懂多少統計的東西。趁著休兵時刻,就稍稍讀些統計書,看看能不能多學到「一丁點」重要基本概念...
不巧兩個小朋友都感冒了。雖然不是很嚴重的病毒感染(聽醫生說這一陣子有很多小朋友上吐下瀉),但聽到她們的咳嗽聲,心裡總不免擔憂難過。
心頭掛念著幾個「應該與統計相關的應用問題」,但因為對些問題的本質感覺頗為模糊,不知道該從哪裡下手。攤開統計學的教科書,亂看了幾個章節,感覺起來問題似乎屬於「多變量分析」,但卻又隱隱與「無母數分析」或「假設檢定」有關。
雖然太太是學統計的,但她說她的「多變量分析」並沒有學好,且專心照顧家庭這麼多年,除了重要的基本概念,有很多東西她都忘了。
自己並沒有懂多少統計的東西。趁著休兵時刻,就稍稍讀些統計書,看看能不能多學到「一丁點」重要基本概念...
星期五, 2月 20, 2009
馬不停蹄修程式
項老師希望下週即將公開的 THDL-Pub (給歷史學者使用的特殊版本)不要出太大的紕漏。
要加上一堆說明網頁,建構使用者意見回饋(尤其是更正資料錯誤)的機制,還要有一個簡單的帳號申請流程。光是這些拉拉雜雜的東西,就足以讓人忙上一陣。
此外,由於我一直把 THDL 系統定位在 prototype(實驗雛型)階段,因此在錯誤的處理上一直沒有花夠多的力氣。項老師前天強力要求實驗室成員幫忙測試,因此光是昨天,就收到許多大大小小的錯誤回報(包含系統錯誤、連結不對、描述不當等)。
從早上忙到夜半,並不時把修正的程式放上系統請大家再繼續測試。算了算,應該也修正了十來處地方呢。
很久沒有這樣與許多人密切地合作開發了。不斷地有人提出建議、回報錯誤,自己則不停地修正更新。頗有在兵荒馬亂戰場上作戰的感覺,雖身體實在疲累,但心頭卻火熱熱地,鬥志昂揚。
燃燒吧!小宇宙。
要加上一堆說明網頁,建構使用者意見回饋(尤其是更正資料錯誤)的機制,還要有一個簡單的帳號申請流程。光是這些拉拉雜雜的東西,就足以讓人忙上一陣。
此外,由於我一直把 THDL 系統定位在 prototype(實驗雛型)階段,因此在錯誤的處理上一直沒有花夠多的力氣。項老師前天強力要求實驗室成員幫忙測試,因此光是昨天,就收到許多大大小小的錯誤回報(包含系統錯誤、連結不對、描述不當等)。
從早上忙到夜半,並不時把修正的程式放上系統請大家再繼續測試。算了算,應該也修正了十來處地方呢。
很久沒有這樣與許多人密切地合作開發了。不斷地有人提出建議、回報錯誤,自己則不停地修正更新。頗有在兵荒馬亂戰場上作戰的感覺,雖身體實在疲累,但心頭卻火熱熱地,鬥志昂揚。
燃燒吧!小宇宙。
星期六, 2月 14, 2009
在地下書街買童書
小傢伙開學一週,日常作息又逐漸規律且忙碌起來。
理想上,載小傢伙上學後,自己就應有一個上午的空閒時光,可以吃頓咖啡早餐,聽聽音樂看看書。但或許是因為睡眠不甚足夠,自己總覺得不怎麼對勁,煩煩躁躁地。
於是,無法好好地靜下心來,會想四處亂逛,「在不怎麼算浪費的程度下,買些應該可以派上用場的東西」。
於是,搭捷運到地下書街買童書。
挑了十幾本童書,打個七五折後的價錢,算算竟比我買兩本原文書還要便宜。童書有小朋友看,而原文教科書買回家後幾乎都只能擺在書櫃上佔空間,當然前者比較有實用價值。
不過,花錢所能得到的滿足感,通常都無法持久,有時甚至只能維持幾個小時。即使是買到好書的興奮,才過一天就被日常生活的瑣事給消磨殆盡了。
理想上,載小傢伙上學後,自己就應有一個上午的空閒時光,可以吃頓咖啡早餐,聽聽音樂看看書。但或許是因為睡眠不甚足夠,自己總覺得不怎麼對勁,煩煩躁躁地。
於是,無法好好地靜下心來,會想四處亂逛,「在不怎麼算浪費的程度下,買些應該可以派上用場的東西」。
於是,搭捷運到地下書街買童書。
挑了十幾本童書,打個七五折後的價錢,算算竟比我買兩本原文書還要便宜。童書有小朋友看,而原文教科書買回家後幾乎都只能擺在書櫃上佔空間,當然前者比較有實用價值。
不過,花錢所能得到的滿足感,通常都無法持久,有時甚至只能維持幾個小時。即使是買到好書的興奮,才過一天就被日常生活的瑣事給消磨殆盡了。
星期六, 2月 07, 2009
星期四, 2月 05, 2009
大呼小叫過一天
照顧小朋友是很奇怪的:小朋友可愛的時候,會有幸福感;但一般說來,大呼小叫的時刻比較多。
今天早上就是這樣。太太有事先行出門,由我來照顧幾個小時。小隻的起床換好衣服、喝完「阿奶」、換好幫幫,大隻的還賴在床上看故事書,不肯去刷牙吃早餐。催促了半天,她小姐才慢慢地行動。
接下來,要帶姊姊讀經,妹妹卻在旁邊亂。姊姊本來就是「一邊玩、一邊跟著爸爸讀」,可是不管姊姊玩什麼,妹妹都一定要插一手,弄得兩人氣氛緊張,然後上演全武行。
「把巴,妹搶我的玩具。」姊姊告狀了。
「妳就讓她嘛,玩別的玩具啊。好,跟著我繼續讀經...」
過了一陣子。
「拔~叫妹走開啦,她這樣我沒辦法讀經。」
「妹,到爸爸這裡來。」我隨手拿起一只玩偶,叫妹妹過來我這裡。
「啊!嗚...嗚...」妹妹不理爸爸,開始打姊姊、扯姊姊的頭髮,姊姊開始哭泣。
「妹!不可以打姊姊!去罰站!」我生氣了,把讀經本放下,拎著妹妹到旁邊罰站。
「為什麼被罰站?」我問小小傢伙。
「因為我打姊姊。」她還知道做錯了什麼事。
「為什麼要打姊姊?」
「我要打姊姊,我一定!」小小傢伙露出很堅定的表情。
「不可以,打姊姊就要罰站!不可以打姊姊,知道嗎?」
「知道。」小小傢伙的語氣終於緩和下來。
罰站幾分鐘後,妹妹問問說可不可以離開,我說好,但不可以欺負姊姊。
過了沒多久,類似的情節再次上演。這回妹妹一定要拿姊姊手上的神奇寶貝圖卡,但姊姊不肯讓她。我把妹妹抱開,勸她玩別的玩具,但小小傢伙不聽,說她一定要姊姊的圖卡。
就這樣,原本二、三十分鐘就可以讀完一遍,在聲嘶力竭下竟然花了將近一個小時。
今天早上就是這樣。太太有事先行出門,由我來照顧幾個小時。小隻的起床換好衣服、喝完「阿奶」、換好幫幫,大隻的還賴在床上看故事書,不肯去刷牙吃早餐。催促了半天,她小姐才慢慢地行動。
接下來,要帶姊姊讀經,妹妹卻在旁邊亂。姊姊本來就是「一邊玩、一邊跟著爸爸讀」,可是不管姊姊玩什麼,妹妹都一定要插一手,弄得兩人氣氛緊張,然後上演全武行。
「把巴,妹搶我的玩具。」姊姊告狀了。
「妳就讓她嘛,玩別的玩具啊。好,跟著我繼續讀經...」
過了一陣子。
「拔~叫妹走開啦,她這樣我沒辦法讀經。」
「妹,到爸爸這裡來。」我隨手拿起一只玩偶,叫妹妹過來我這裡。
「啊!嗚...嗚...」妹妹不理爸爸,開始打姊姊、扯姊姊的頭髮,姊姊開始哭泣。
「妹!不可以打姊姊!去罰站!」我生氣了,把讀經本放下,拎著妹妹到旁邊罰站。
「為什麼被罰站?」我問小小傢伙。
「因為我打姊姊。」她還知道做錯了什麼事。
「為什麼要打姊姊?」
「我要打姊姊,我一定!」小小傢伙露出很堅定的表情。
「不可以,打姊姊就要罰站!不可以打姊姊,知道嗎?」
「知道。」小小傢伙的語氣終於緩和下來。
罰站幾分鐘後,妹妹問問說可不可以離開,我說好,但不可以欺負姊姊。
過了沒多久,類似的情節再次上演。這回妹妹一定要拿姊姊手上的神奇寶貝圖卡,但姊姊不肯讓她。我把妹妹抱開,勸她玩別的玩具,但小小傢伙不聽,說她一定要姊姊的圖卡。
就這樣,原本二、三十分鐘就可以讀完一遍,在聲嘶力竭下竟然花了將近一個小時。
星期一, 2月 02, 2009
緊迫盯人
天氣好,帶小朋友到淡水曬太陽吹泡泡。才剛回到家,手機就響了。
是負責 THDL 公開版時程的學妹緊迫盯人。詢問一些開發、測試、與資料移轉的相關進度,並問我哪一天會去實驗室。喔,我以為這個星期仍是假日,還想盡量帶小朋友出外遊玩呢。
其實,這個春節假期基本上並沒怎麼清閒,幾乎每天都在跑程式。原本拿到新的資料,就需要三、四天的時間才能將資料庫所需的採礦資訊計算出來(是 24 小時不停地跑程式喔)。但處理了幾天,才發現上游給的輸入資料有一點小錯誤。手動將錯誤刪去後重跑一次,這樣就已經耗去一個多星期了。
接下來,又發現新資料的檔名有了變化。從前來源資料的檔名是以 .txt 結尾,但現在有些文件內含表格資訊,它們的檔名就會改用 .xml 結尾。這些改變雖不會造成檢索上的困擾,卻會對學妹辛苦處理的「上下手契」造成檔名對應不到的問題。過年期間不好麻煩別人,只好自己寫程式進行檔名的對應與轉換。
所以嘛,其實也是在兩三天前,才告個段落,把工作放下的。
剛剛又收到訊息,說是新版的資料其實還有其他錯誤,因此還是得重跑。唉,雖然心裡也知道必然會發生這類情事,但碰上了,卻也很難有好心情去面對...
一直覺得,加班趕工一天,就需要兩天的休息時間,才能讓自己的神智恢復清醒。等這個公開版完成後,一定要好好地休息一陣子。
是負責 THDL 公開版時程的學妹緊迫盯人。詢問一些開發、測試、與資料移轉的相關進度,並問我哪一天會去實驗室。喔,我以為這個星期仍是假日,還想盡量帶小朋友出外遊玩呢。
其實,這個春節假期基本上並沒怎麼清閒,幾乎每天都在跑程式。原本拿到新的資料,就需要三、四天的時間才能將資料庫所需的採礦資訊計算出來(是 24 小時不停地跑程式喔)。但處理了幾天,才發現上游給的輸入資料有一點小錯誤。手動將錯誤刪去後重跑一次,這樣就已經耗去一個多星期了。
接下來,又發現新資料的檔名有了變化。從前來源資料的檔名是以 .txt 結尾,但現在有些文件內含表格資訊,它們的檔名就會改用 .xml 結尾。這些改變雖不會造成檢索上的困擾,卻會對學妹辛苦處理的「上下手契」造成檔名對應不到的問題。過年期間不好麻煩別人,只好自己寫程式進行檔名的對應與轉換。
所以嘛,其實也是在兩三天前,才告個段落,把工作放下的。
剛剛又收到訊息,說是新版的資料其實還有其他錯誤,因此還是得重跑。唉,雖然心裡也知道必然會發生這類情事,但碰上了,卻也很難有好心情去面對...
一直覺得,加班趕工一天,就需要兩天的休息時間,才能讓自己的神智恢復清醒。等這個公開版完成後,一定要好好地休息一陣子。
訂閱:
文章 (Atom)