星期一, 6月 25, 2007

病情終於穩定

在上週的「排出性膀胱尿道攝影」後,醫師說,小寶寶並沒有尿路回流的問題。

既然推翻了先前最可能的猜測,醫師也只能說,小寶寶的腎臟發炎,是經由「血液型」的感染途徑,大腸桿菌是從腸胃黏膜穿過腸壁侵入腎臟,因而造成發炎。

如果發現有(通常是先天性的)尿路回流,病童接下來就得進行為期數年的抗生素治療。沒有發現回流現象,對於我們或小寶寶都是不錯的消息。

於是,雖然還是得繼續住院施用抗生素一週,但我們總算放下忐忑不安的心。接下來,就是期盼小寶寶的腎臟能夠儘量修復,不要受到太大的傷害。

當然也還有些令人不解之處。例如,先前抽血後也有做細菌培養,在血液中並沒有發現大腸桿菌(尿液與糞便中則都有發現)。醫師說,或許是剛好抽到乾淨的血液吧。

在工作方面,還好做 Post Doctor 相當有彈性,能夠讓自己請長假來幫忙照顧小寶寶。但由於不希望這兩週所造成的工作延遲,會對他人的進度造成太大的影響,因此我這幾天來都把筆記型電腦帶到醫院,並儘量抽出時間來寫程式。

在這種時候,就會覺得 Notebook PC 實在是很好用的。

星期五, 6月 22, 2007

從「文件的後分類」談起

約從三個月前,項老師在實驗室會議裡,就多次提到「文件檢索後分類」的重要性。

對任意的使用者查詢字串 q,系統可以計算出一個符合 q 的文件集合 R(q)。對我來說,「檢索後分類」 (post-query classification) 指的是,對 R(q) 進行分類,並將分類的結果呈現給使用者,讓使用者決定接下來要做什麼動作。

這麼簡單的想法,講起來還真的沒什麼(至少我在多年前的博士論文就提過啦)。不過,據說對「圖書資訊學」來說,這個觀念還頗新奇呢。

項老師說,他覺得「檢索後分類」和「傳統的檢索」是很不一樣的。他說,傳統的檢索,目的是「找一篇或幾篇文件」,但「檢索後分類」卻可以讓使用者「看到」文件集合的特性,因此「檢索後分類」的背後,應該還有著更深層的哲學基礎。

是啊,我也認為「檢索後分類」的背後,還有很多值得細細思考之處。例如,我覺得有一種看法就頗值得想想,那就是從「資料採礦」(Data Mining) 的角度,將這些後分類視為「mining for document patterns」。

只是,「文件檢索」和「資料採礦」,在本質上終究還是有著頗大的差異。我想,若能細細品味、思考其間的關係與異同,應該也是一件很有意思的事情吧。

星期三, 6月 20, 2007

病情應已取得控制

小寶寶生病,實在沒有什麼心情寫文章,因此拖了好幾天沒有更新 Blog 內容。

算算小寶寶住院也已經有 12 天了。前天下午做「電腦斷層 CT 掃瞄」,醫師帶我和太太去看掃瞄的結果:右腎上方確實有問題,但左腎也有腫大、發炎的情況。

醫師說,這是「他遇到第二嚴重的 case,最嚴重的那個病例腎臟發膿,馬上就送進外科手術房了」。他還說,這麼嚴重的發炎,大概得施用注射型抗生素三、四個星期。

換句話說,我們還得陪小寶寶住院許多時日。

聽到醫師如此解說,我們自然頗為擔心,心情當然也開朗不起來。

還好,這幾天小寶寶的精神狀況都很好,而昨天高燒情況也似乎有了改善。因此今天就停用退燒藥,觀察一天(當然,還是得繼續打點滴、施用抗生素)。如果高燒不再出現,接下來就要進行「排出性膀胱尿道攝影」,檢查是否有「尿路逆流」的狀況。

接下來呢?

又是一堆令人擔心的未知情況。醫師說,現在討論都還太早。除了必須不間斷地使用抗生素外,必須等到回流檢測的結果出來後,才能確定下一步該做些什麼。

你相信超自然的力量嗎?如果對小寶寶的病情有幫助,我願意相信。

我也相信,小寶寶一定會康復的。

星期六, 6月 16, 2007

仍然提心吊膽

小寶寶住院已經超過一個星期了,但今天清晨依然有高燒(超過 39 度)的現象。

昨天照過「腎臟核子掃瞄」,結果右腎的上方約有 1/3 並沒有顯像(沒有「工作」的意思)。更令人困擾的是,已經施打(確定有效的)抗生素這麼多天,卻依然有高燒的現象,似乎表示病情還未取得令人滿意的控制。

於是,醫師建議做「斷層掃瞄」來取得更詳細的資料,據以判斷腎臟的受損狀況。

無心寫 Blog,甚至不太知道自己究竟在記錄些什麼。總之,心情七上八下,仍然提心吊膽。

希望明天清晨不會再有高燒的現象。

星期三, 6月 13, 2007

小寶寶入院記

看到小寶寶因扎針抽血、掛點滴而掙扎哭喊,眼眶裡盡是不捨。

上週一起,小寶寶就開始發燒,且經常會高達 39 度以上。看過小兒科之後,初步懷疑是「玫瑰疹」,應該三五天後就可以康復。但是幾天過去,高燒依舊,也沒有看見疹子,因此醫生認為必須做血液與尿液檢查。

血液檢查的結果,白血球指數竟然有 30,000 個,發炎指數也高達 33。(醫生說,這種情況一年難得看見一次,十年也僅碰見一、兩例。)

發炎太嚴重了,醫生說。必須馬上住院治療。

於是,上週五就由急診轉入住院病房,抽血打點滴、驗尿驗糞培養細菌,幾天後確認是泌尿道感染。

於是,這幾天都在醫院中,手忙腳亂、提心吊膽、心情七上八下地度過。既不明瞭為何在「應該很小心照顧」之下會引發如此嚴重的發炎,心疼寶寶這幾天在高燒起落間所承受的苦痛,更憂心寶寶身體會受到難以康復的損傷。

「別人問我應不應該生小孩的問題時,我不會教他們怎麼做。我只是簡單地說:『沒有別的經驗比得上生兒育女』。就這麼簡單,這件事沒有別的可以取代。朋友不行,愛人也不行。如果你要對另一個人負起完全的責任,學著如何去給予最深的愛與關懷,那你就應該生小孩。」

我問,那麼你會願意再來一遍嘍?

「我願意再來一遍嗎?」墨瑞驚訝地看著我:「米奇,我說什麼也不會放棄這個人生經驗。即使是... 即使是你得付出一項很高的代價。」

因為你總有一天得離開他們。

「因為我很快就要離開他們。」

墨瑞嘴唇緊閉,闔上眼睛。我看到他臉頰滴下第一顆眼淚。


雖然醫生們認為病情應該已經有相當程度的進步,但昨天傍晚小寶寶還曾一度高燒到 40.9 度。曾為父母的人必然知道,那種煎熬的心情多麼令人難受。

衷心期盼、祝福小寶寶早日康復。

星期六, 6月 09, 2007

《最後 14 堂星期二的課》:佳言一

最近忙壞了,沒有時間整理心得。沒辦法,就先用「書本上的內容」來將就一下吧。

感覺起來,《最後 14 堂星期二的課》就是向讀者強調美好的人生,不應該跟隨著「錯誤的時代文化」走。以下先記錄一些我覺得還不錯的書中佳言:
「如實接受你做得到的事、和你做不到的事。」

「過去就是過去。接受它,不否認也不揚棄。」

「學著寬恕自己、寬恕別人。」

「與人為善,永不嫌遲。」

「我決定我要好好活著,至少要嘗試著好好兒活。照我想要的方式,帶著尊嚴、帶著勇氣、帶著幽默、帶著冷靜。」

「有時候我早上醒來會哭個不停,為自己而傷心。有些早上我則是既憤怒又不甘。但這種情況不會很久,我會起身,說『我要活下去。』」

「好吧,我就當你的教練,那你就是我的選手。我現在太老了,你可以代我迎向生命中許多美好的挑戰。」

「我沒有什麼託詞可以卸責。除了現在大家都有的那個理由:我太忙了。我的日子填得滿滿地,但我大半時間仍然覺得不滿足。我已經在生活中迷失自我。--- 我到底怎麼了?

「你有沒有找到一個可以分享心事的人?你對自己問心無愧嗎?你有沒有努力做個最好的人?」

「我們的文化讓人們無法自知自適。我們教的東西不對。而你得要十分堅強,才有辦法拒絕這錯誤的文化,才能自己找到出路,創造自己的文化。這點多數人都辦不到,他們比我更不快樂,雖然我現在是這副德行。」

星期二, 6月 05, 2007

寂寞的四歲半

小傢伙近來常黏著我,略帶抱怨地說:都沒有人陪我玩。

最近工作上的事情多,忙碌到脾氣有些焦躁。而自己也怪,寫程式的效率,經常在家比在實驗室還要來得高。這直接導致一個結果,就是自己陪小傢伙玩的時間減少,或者顯得分心或焦慮。

幾年前我曾杞人憂天地說,現在的小孩都很早熟,也許只能「可愛」到五、六歲。想想時光過得也真快,小傢伙已經快要五歲了。對於許多事情,她早就有了自己的想法,我們只能儘量幫助她,改掉不好的個性或舉止。

拒絕小傢伙的要求,有時會令自己覺得慚愧;但接受她的請求,卻讓自己更難處理掉那些「似乎已經排到數個月後」的各種工作項目。既然工作永遠做不完,我是不是該騰出更多的時間,來陪伴小朋友一同成長?

這真是兩難的人生問題啊。

星期六, 6月 02, 2007

重新學習、從頭學起

不知道自己從前是怎麼求學的,竟然還能「頗順利」地畢業。

怎麼會問這樣的蠢問題?(註:使用「蠢」這個字的靈感,是來自珍珠圓的一則笑話

因為我最近發現,自己從前可說「根本就不知道在學些什麼、根本就不知道該如何有效地學習」。

接觸粗淺的機率與統計,至少也有二十年了吧?但是,自己從來就沒有真的吸收、了解一個最基本的問題:「什麼是隨機變數」、或者「隨機變數的定義是什麼」。

直到半年前重新複習隨機過程(Stochastic Process,或譯為隨機程序)的一些內容,自己才似乎「比較知道該怎麼讀書」;直到最近因為寫一篇論文,其中有用到「簡單隨機抽樣」的統計技術,強迫自己「盡量從頭說起」公式的推導過程,才豁然發覺:原來機率模型、隨機變數的概念如此簡單、如此直觀。

課本裡,對隨機變數的定義講得很清楚,實例也不少。那麼,自己從前到底在讀些什麼?到底是怎麼回事,自己竟然能夠讓在不懂基本的定義下,卻還能修課,甚至可以順利地通過考試?

難道,這就是一般所謂的「聰明」?聰明到能夠舉一反三、聰明到能夠不需定義,就可以僅憑著隱隱的感覺與直觀,去修課考試。

只是,就算自己真有著這麼點「小聰明」,也是把這種天賦錯用地方了。對於許多理論的東西(尤其當牽涉到數學的時候),不了解定義、不明白定義背後的直觀,對於學習幾乎必然會導致「事倍功半」的結果。

在孔老夫子已能不惑的年紀,才驀然發現自己讀書求學的方式不對,想來總是令人不勝欷噓。雖然明知道實現的可能性不高,但我依然希望,自己能夠有機會「重新學習、從頭學起」。

星期三, 5月 30, 2007

工作雜記:2007/05

發覺自己在工作上,若找不到比較大的目標,很容易因失去方向感而倦怠。

從記事本中,可以看到這個月主要的工作事項。嗯... 自己在 5/16 就把論文初稿交給項老師了。少了這麼大的一個工作項目,難怪這兩個星期都覺得有些茫然。
生命似乎充滿了矛盾。物質匱乏時,以為豐衣足食就是幸福美滿;衣食無缺,卻又發現日子無聊難耐。貧困的生命積極進取,富足的生活慵懶無助,存在到底為了什麼?
--- 摘自《道德:幸福的必要條件

但其實日子過得匆忙,每天都有許多「必要的雜事」得做。

其中比較重要、有一些時間緊迫性的工作項目,就是利用先前開發的 THDL Prototype System,把圖書館特藏組的一些需求實作出來。為什麼要做這件事?因為項老師發現,特藏組的系統外包給廠商後,最後通通都「很難使用」。

而我因為論文剛寫完,心情正好,就「相當有效率」地在兩三天內,就把最基本的檢索需求用 THDL Prototype 給弄出來了。

於是,接下來就有更多的事情可做:因為圖書館所給的 metadata 有著許多錯誤(這是現實中很重要的定律:人工處理必會有錯),因此我就必須找機會向辛苦的編目人員解釋,她們可以怎樣運用資訊處理技術,改善現有的流程與產出物的品質(通常這些流程會因為「太細節」而被大官們所忽略,但其實沒有這些細節,就很難得到好品質的產品)

有人曾問我一個問題:為什麼公家機關的許多系統,外包出去之後,一開始看起來沒什麼問題,但最後做出來的東西就是「不能用」、「不堪用」、「不好用」?

大哉問。撇開政治因素不談(公家機關想當然政治優先,自古皆然),我覺得這個問題彰顯出落實軟體工程的許多困難。

遇到困難,其實也正彰顯這個問題的重要。雖然這個問題遠超過我目前所知所能,但與其束手無策、甚至相互推卸責任,不如深切思考問題的本質(包含問題的抽象本質與實務考量) ,並且實際動手去做(邊學邊做、同時也邊做邊學),不是嗎?

星期六, 5月 26, 2007

為什麼我還頗喜歡 PHP5

為什麼我近來頗喜歡用 PHP5 來寫些「不大不小」的程式?

我猜想,最主要的理由,應該是 PHP5 體積不胖、夠簡單、也夠便利。此外,自己目前所寫的程式與系統,利用現成元件與資料庫來開發後,通常也不算太複雜。

為了防止世界被破壞、為了守護世界的和平,我們不得不將各種應用程式的變異性考慮在內 --- 我們在實務上需要有一套通用的程式開發環境。

就個人的喜好,我比較欣賞「小而美、便利性好、實用性強、且各類延伸環境支援度高」的程式語言與開發工具。雖然從程式語言的角度來說,PHP5 並不算很美;但從理論與實務兼顧的角度來看,我覺得它是一個相當好的工具,頗適合被用來快速開發一般的網頁應用程式。

有人說,PHP 不是相當「髒亂」的程式語言嗎,為什麼我不選用 Java、C#、或者像是 Python、Ruby 之類的語言?但我認為,PHP5 其實也支援了物件導向的語法,寫程式會弄到「髒亂」的地步,通常是程式設計者自己的訓練不夠、習慣不好、經驗不足,似乎不應該把責任推到程式語言的頭上。

這幾年來,主流的程式開發,使用的工具應該是 Java 與 .NET framework (新近的 Python 或 Ruby 或許也能算上「半個主流」),但 PHP 的使用者似乎也不少。跟隨「主流」有個優點,就是「使用者多,就比較能夠吸引目光,取得較多資源」。而大家都這麼選擇,通常也暗示「若跟著這樣做,相對的風險並不會太高」。

另外,現代的電腦運算能力強,而一般常見的 Web Applications 通常並不需要太多的數學計算(什麼叫做龐大的數學運算?嗯... 算 Ackermann's function 的值應該就算吧 :p)。一般說來,繁瑣的中文編碼的轉換、網頁內容的編排、人員帳號的控管、資料庫內容的讀寫(通常是字串的處理,而非數值的運算),就會佔去大半設計與開發時間。

當然,還是有許多工作,需要用到龐大的運算能力。遇到這種狀況,通常的解決方式是,先把耗時的運算結果先存起來,當使用者發出 request 時,就用「查表」的方式來減少所需的即時運算。

這樣,若不是想把 scale 弄到「非常大」,就應該能解決大半的實務問題了。至於「理想中的程式語言,應該有什麼樣貌」這類問題,就留給理論學者去爭辯囉。

星期二, 5月 22, 2007

摘錄:關於寫作的一些要領

這是路易斯 (Clive Staples Lewis,「納尼亞傳奇」的作者) 關於寫作的建議。
--- 內容取自:「父親給孩子成就一生的 100 封信」(The Father Drives The Life For The Child 100 Letters)。
  • 語言必須簡潔有力,能夠清晰地表達文章的主旨。千萬不要讓自己的句子寫出來之後走樣,甚至讓別人誤解。

  • 寧願用直接而淺白的語句來表達,放棄使用冗長而模糊的詞藻。儘量遵守規則,但不必墨守成規。

  • 如果有具體的詞語可以使用,就不要用那些抽象的詞句。例如你要表達「很多人死了」,最好不要寫成「玫瑰紛紛凋謝」。

  • 在文章當中,如果你要描述對一種事物的感覺,一定要細緻具體。你希望讀者產生怎樣的感覺,不要只用形容詞就完事了。

    比如說,你說一樣東西很可怕,你要多加描述,使讀者也產生「害怕」的感覺;你要表達高興的事情,不要只是說「很高興」、「很喜悅」。任何可怕的、美好的、醜惡的、優美的事情,如果只是一筆帶過,怎麼能使讀者感同身受呢?

  • 用詞不要過於誇張。比如說,該用「很」、「非常」這類詞彙的時候,就不要使用「無與倫比」、「不可思議」。不然,等到真正該誇大的時候,你就不知道要用什麼詞彙來描述了。
我覺得 Lewis 的建議相當中肯平實。問題是... 說來容易做來難啊。這些建議看起來沒什麼,但實際上要切實做到,沒有經常練習或深厚的寫作功力,恐怕都不易達成呢。

星期四, 5月 17, 2007

十分之一的網站很危險?

在中文 CNET 網站上看到一則新聞:「Google:十分之一的網站很危險」。

新聞的內容說,Google 對 450 萬個網站做了深入分析,發現其中每十個網站就有一個可能順便把木馬程式病毒成功下載 (drive-by-download) 到訪客的電腦裡。

我對這個比例感到好奇與不解。對於「網站」或「網頁」而言, 10% 都算是相當大的比例耶。因此多花了些時間,找到 CNET 的英文網頁,以及那篇 Google 的報告 The Ghost in the Browser: Analysis of Web-based Malware

翻譯的人並沒有錯,英文網頁上也是這麼寫:Google: 10 percent of sites are dangerous。網頁下的讀者意見,有的是建議使用者改用 Mac,有的是批評 Google 只說不做,任憑這些網頁為非作歹。

在好奇心的驅使下,今天早上「很難得」地看過 Google 的這篇論文,然後...

然後,發現新聞的報導是錯的。

不是「10% 的網站裡有『有害連結』(在此不用『惡意連結』這個詞,是因為網站可能非惡意,但卻含有這些連結)」,而是「數十億個 (several billions) 網頁 URLs 中,經 heuristically 篩選後的 450 萬個 URLs 中,約 10% 含有這類連結」。

只是,若只是看論文的某個段落,還真的頗容易被誤導:
... we have conducted in-depth analysis of about 4.5 million URLs and found 450,000 URLs that were engaging in drive-by-downloads. ... That means that about about(原文似乎是因為筆誤,多寫了一次 about) 10% of the URLs we analyzed were malicious ...

要算出「有多少比例的 URLs 內含有害連結」(論文中沒有提到有多少比例的「網站」內含有害連結),必須回溯到論文第二頁的一段文字:

We analyzed the content of several billion URLs and executed an in-depth analysis of approximately 4.5 million URLs. From that set, we found about 45,000 URLs that were successfully launching drive-by-downloads of malware binaries ...


看吧,45 萬(確認有害的 URLs)除以幾十億(Google 索引到的 URLs),其實比例還不到 0.05% 呢!(當然啦,沒被篩選出來的 URLs 也有可能內含有害連結,所以真實比例有可能會高上許多。)

所以啊,網路新聞還真的很容易誤導大眾呢。令我好奇的是,Google 怎麼沒有(在第一時間)出面澄清呢?這麼龐大的公司,還標榜不會「do evil」,卻任由大眾莫名其妙地散佈不實謠言(或甚至被資安業者加油添醋後造成心理上的恐慌),實在也說不過去吧?

星期三, 5月 16, 2007

工作與生活:2007/05

看到廖在 MSN 上寫著「老公加班無窮盡,此恨綿綿無絕期」。

最近許多朋友的生活品質,似乎都被「工作」給攪壞了。MPH 工作超級忙碌(看看他的這份 Blog:「這三個月打字最多的一天按了兩萬九千多鍵,平均約一萬多鍵,滑鼠移動都在一兩百公尺上下,至於滑鼠大概都點了數千下」。每天耶,真是驚人),最近大概也經常加班到夜半。因此,廖會有些抱怨,想想也是很自然的。

另外,貓的工作也似乎從「瘋狂的四月」變成「長時間工作的麥當勞工讀生」;珍珠圓在工作上許多朋友的離去,讓她難過到也想「跳船」。看來,還是當老師的 jlchang 和阿尼,在工作上比較穩定自在些。

是整體經濟環境惡化的影響嗎?在激烈的商場競爭下,公司賺錢越來越不容易,連帶使得員工也不得不承受更大的壓力,被迫以更多的勞力「至少在表面上」顯示自己已經盡了心力。只是,長久下來,這會惡化生活品質的。但是,賺錢來提高生活品質,不是原本「工作」所承諾給予的嗎?

真是複雜又弔詭的現象。

我自己呢?論文初稿在有些「虎頭蛇尾」的狀況下,算是完成(交給項老師)了。工作上的待辦事項雖然不少,但排排優先順序,也還算不上有太大的壓力。但是,怎麼這幾天一直有「快要虛脫」的感覺啊。難道這是「一陣忙亂」之後的正常現象嗎?(這兩個星期忙到沒什麼時間陪小朋友玩。)

基本上,回鍋作 Post Doctor 的工作,有部分原因也是想讓自己能夠多騰出時間,做些自己比較感興趣的事,並陪伴小朋友一同成長。只是,現實生活中,即使自己想「從忙碌的工作中掙扎、探索出悠閒的機會」,也總是「說來容易做來難」呢。

星期五, 5月 11, 2007

忙裡偷閒

待辦事項越來越多,有時脾氣也變得焦躁不安。

覺得應該掙扎出一些時間帶小傢伙出外走走。就是這樣,昨天出發前往淡水。非假日的捷運站外,顯得相當空曠。而即使在五月的豔陽下,小朋友仍然顯得相當興奮。


大人們可以慵懶地閒坐,欣賞河岸的景觀。小朋友呢?最簡單的吹泡泡遊戲,就能讓她全神專注、玩得興高采烈。


欣賞小朋友的天真模樣,心裡的感覺很滿足。
      

不必等升官發財、也不必等功成名就。在忙碌的生活中偷閒,有時更能讓自己感到該珍惜生活中的美好事物。

星期二, 5月 08, 2007

自言自語

最近工作得有些莫名其妙。

工作些什麼呢?雖然有許多是屬於「寫寫程式」之類的系統開發工作,但其實自己心裡有數:最傷神的還是寫論文這件事。寫程式通常看得出進度或成果,但寫論文... 唉,一言難盡啊。

說「工作得莫名其妙」,是因為實在想不出什麼好理由或好藉口,能夠強而有力地說服自己:「花這些時間與精力是很自然、甚至是必要且值得」的。

文章是用中文寫的、實驗是學弟去年就做的、主要的材料也都來自那位學弟去年的碩士論文。那麼,為什麼我已經耗上兩個多月,卻連「初稿」都尚未完成?(更糟的是,寫到快沒力了,就有些想偷懶,但這樣論文後半可能就會顯得有些「虎頭蛇尾」的味道。)

我覺得,自己在寫論文這件事情上,應該還算是認真且盡力。那麼,除了「寫篇像樣的論文,本來就不是件容易事」與「自己寫作表達能力不佳」之外,我還能有什麼理由或藉口呢?

難道... 難道,另一個原因,竟然是「年紀稍大,導致生產力下降」?

星期五, 5月 04, 2007

Joel 的「抽象滲漏法則」

對「約耳談軟體」(Joel on Software) 的這篇文章頗有共鳴。

「抽象」(abstraction) 是系統化增加生產力的有力工具,因為它可以將許多複雜的東西,隱藏在一組簡單的概念或動作之下。它讓開發人員能夠經由這組簡單的概念思考,運用這組簡單的動作寫程式,因而簡化了系統開發的複雜度。

有意思的是, Joel 說「所有重大的抽象機制在某種程式上都是有漏洞的」,並舉了許多實例來說明。

我看到這句話的第一個感覺像遭到小小的電擊。喔,對啦,他說出了我心底對軟體開發「為什麼總覺得某些地方怪怪地」的一個重要原因,他也用這個「抽象滲漏法則」(The Law of Leaky Abstractions) 說明為什麼「漂亮的理論模型」在實務中不見得可以幫上我們太多忙。

因為... 如果實際上的系統頗複雜或頗新穎(因此,很少實際的他人經驗可以借鑑),在套用這個模型之前,我們必須弄懂那個抽象模型的原理、以及它所隱藏的東西。否則,當我們遇到問題時,就很可能被卡住,然後不知道該如何解決問題!

不是嗎?即使先進的程式語言都提供了各式套件來處理 unicode 或各類文字編碼的問題,但實務上每隔一陣子就會看見有人卡在「中文轉碼」的問題上。即使自認為已經對中文轉碼頗有經驗,碰到問題時(例如,先前在「又遇編碼問題」的狀況)也很難在短時間內找到好的解決方式。

所以,Joel 說「這一切都似非而是地表示,即使我們擁有愈來愈高階的程式設計工具,抽象化也做得愈來愈好,要成為一個純熟的程式師卻是愈來愈難了」。

真是令人感傷。

星期二, 5月 01, 2007

8-puzzle

解 8-puzzle 是一個古老的益智問題。

年少時對解這類「益智問題」,總有著那麼些興趣。學生時期,在人工智能 (AI: Artificial Intelligence) 的課程裡,教授們介紹 searching methods 時,有時也可以看到這個問題。可惜的是,或許是因為當時的課程內容太豐富,反倒沒有機會真的將這個程式寫出來玩玩。


這一陣子想整理一些從前感興趣的小程式,偶然間就想起 8-puzzle(或者更大盤面的「15-puzzle」)來。於是,花了些時間用 PHP5 把它實作出來。

演算法是採用 IDA* (Iterative Deepening A*),因此理論上求得的應該是最佳解(什麼時候不是最佳解?就是我程式寫錯的時候啦)。上圖左方的盤面,程式花了 22 步才走到右方的目的地。

星期五, 4月 27, 2007

工作雜記:2007/04

最近工作上的「待辦事項」增加了。

做的事情還是一樣:「寫論文」與「開發、修改、除錯、維護 THDL 檢索系統」。只是,由於自己寫論文的速度太慢、項老師希望系統能夠稍作修改來讓別人使用、再加上詩沛的善意提醒(提供「最新版本」的 metadata 檔、回報系統的臭蟲 bugs、以及使用介面的建議),因此必須撰寫或除錯的程式就增加了。換句話說,現在手頭「同時」有著許多小工作等待完成。

說來也是奇怪,自己在「寫論文」 -- 還是用中文寫的喔 -- 這件事情上,怎麼如此沒有工作效率啊?

上個月在「疲倦?茫然?」中,曾提到自己為了瞭解「簡單隨機抽樣」與「信賴區間」的概念,花了約兩個星期的時間。

不過呢,當我把「介紹什麼是信賴區間」的內容寫好之後,過幾天卻發現自己仍然因觀念不清而在推導的過程中有著瑕疵。

於是,又花了許多時間,大幅修改了原先的內容,然後請太太撥一點時間幫我看看,是不是還有重大或明顯的錯誤。

「之前不是就寫好了嗎?」太太問道。

喔,因為後來發現一些觀念與符號上的錯誤,所以... 就重寫這個部分了。看過之後,她似乎也同意我原先的寫法是有問題的。但... 為什麼之前沒有發現呢?

或許,之前沒有發現,是因為「答案是正確的」吧。太太知道「最初的條件」(實務上如何運用)與「最終的答案」(就是列在統計教科書上的公式)是什麼。因為先前的推導過程,也是我「很努力地勉強整理」出來的,所以若沒有仔細看,是不容易發現其中失誤的。

太太略帶佩服地(不要太認真:這只是我為了讓自己快樂些,拿來吹捧自己的用詞)說,我怎麼像是在寫教科書啊?我說,我也不知道寫論文與寫教科書有什麼差異呢。自己手頭至少有五本提到統計抽樣的教科書,卻沒有一本能夠讓我「看了之後真的有懂」(或許是因為自己資質太差吧)。所以嘛,很希望自己能夠從頭推導一遍。

我甚至不曉得這段內容會不會在最後投稿的內容中,因頁面限制而決定將它簡略掉。只是,自己弄不清楚一些基本觀念,卻大言不慚地引用「大家習以為常的公式」,總會讓我在一段不算短的時間內覺得不甚舒服。

例如,我的博士論文就有運用到「信賴區間」的概念。但我敢說,自己當初並不了解「信賴區間」是什麼(腦子裡響起另一股聲音:喂喂喂,你怎麼啦?不怎麼了解,當然還是可以生產論文啊)

這回,我還是可以直接引用教科書上的公式(這可是標準教科書的內容耶,看不懂也敢來審閱論文?)。但我希望、也試著在寫論文的過程中,強迫自己去推導、明瞭「實務上的抽樣」是怎麼與「理論上的機率」相結合的。

就是這樣。

僅僅這樣,就可以吃掉我數週的時間。

星期四, 4月 26, 2007

《最後 14 堂星期二的課》

我的眼眶有些濕潤,甚至得輕輕用紙巾拭去眼角的淚水。

這是一本讀來不甚費力、字裡行間卻能動人心弦的書:《最後 14 堂星期二的課》。博客來這樣介紹它的內容:
  本書作者,米奇,曾經是老師眼中的希望。大學畢業後,他進入社會,載浮載沈,曾有的理想逐漸幻滅,人生的課題日益龐大難以面對。十六年後,他偶然與大學時代的恩師重逢,而這時他的老師只剩下最後幾個月可活。於是,他又上了十四堂他老師的課 ……

  米奇每個星期二到老師家探望他。這位老師,墨瑞.史瓦茲 (Morrie Schwartz),面對著死亡一步步接近,誠實看見自己在死亡面前的恐懼與脆弱,承認自己對人世的眷戀不捨,但他掙脫這些情緒,展現出洞澈人生之後的清明與安靜,並且帶著幽默感。

  墨瑞不僅自己勇敢面對死亡,窮究死亡的多重意義,更藉著與學生米奇的談話,一點一點讓米奇因為世故而僵硬的心逐漸柔軟,讓他重新看待生命。

  作者在夢想褪色、視野變窄、情感變得僵硬的時刻,有機會聆聽昔日恩師的教誨。讀到這本書的人,也彷彿跟著旁聽了這堂叫做「什麼是人生」的課,汲取了其中的智慧與溫暖。這是個會發光發熱的故事,讀後會讓你一輩子難忘。

我必須承認,自己在閱讀時,幾度眼眶濕潤。我不知道自己為什麼遇到這類真誠的人性表白,總會顯得如此脆弱。不過,這樣也好,它表示我並不是個機器人,而是有血有肉有感情的真實人類。

或者,講得文謅謅些,是真實的故事被作者以生動的文筆與穿插的劇情,真誠且直接地穿透我的心房。我因此而動容。

會想起這本書,是因為幾天前經過誠品,看到它陳列在展示區內。想想這本書當初好像也是貓推薦的,印象中自己看過後也曾頗有感觸。只是,回想起來,隱藏在書本字裡行間的人生哲理,卻似乎早已忘卻。於是,回家後把這本書從櫃子裡尋了出來,這幾天早晨在咖啡館裡重新咀嚼回味。

自己現在的心境,頗能感受墨瑞 (Morrie) 一些話語的內涵。我想,這回看完後,應該將書中自己覺得有益的箴言與建議寫下來,在日常生活中細細品味與實踐。

什麼是人生?不要被世俗的文化所欺騙。如果最後我們終於知道,我們只是自然的一部份,而可以安然接受死亡,那麼我們就可以做到那件最大的難事:安然接受生命。
 

星期一, 4月 23, 2007

檢索的「採莓模式圖」

上個月曾經記錄了一些自己看「資訊架構學」的感想

前幾天詩沛到實驗室,說她也想看看這本書的內容(但是... 她也說沒有足夠的時間好好地閱讀)。我向她簡單地說了點想法,順便請她把書上的「採莓模式圖」掃瞄(或照相)下來寄給我。

後來,詩沛確實把照相的圖檔寄給我了,但我覺得這個圖檔的品質不甚理想,不如自己重畫。於是,早上騰出一段時間,把這個模式圖重繪一次。在過程中,也順便想一想檢索流程中,自己可能忽視的部分。


在思考「使用者」與「資訊檢索」的交互運作時,多數人應該都會注意到類似的流程。問題是,這些流程之間的變化相當複雜,何時會走哪一條路線也很難加以明確定義。於是,雖然大致上知道使用者在資訊系統中怎樣「移動」來檢索資料,卻很難將這些模型很「漂亮地」延伸到實務面的應用上。

我覺得,要從「廣度」的層面來大幅精進檢索的成效,應該要思考每條路線的內在意涵、應該要經過更深厚的使用者習慣分析,才能夠有所突破。在缺乏這些資源的情況下,或許專注些、從個別的路線來「改善」,會是比較務實的做法。

星期三, 4月 18, 2007

謝謝老天爺

經常因小朋友的天真而感動莫名。

昨晚,我略帶感嘆地說:「時間過得好快啊,明天就是星期三了。」

小傢伙聽見了,很高興地大叫:「謝謝老天爺!這樣把巴就可以陪我玩了。耶~」

我問她:「為什麼這樣爸爸就可以陪妳玩?」

她說,「因為這樣很快就可以週末啦,謝謝老天爺!」

肇因於被重視、被需要所延伸而來的存在感、想要讓她健康地生活成長的責任感、以及自認為應該做得更好的愧疚感(因工作上的生產效率差,最近經常在家趕一點工,因而疏忽了關懷與照顧),剎那間錯綜複雜地襲上心頭。

謝謝老天爺!只有天真的小朋友,才能這句話由「慶幸」轉回「發自內心的感謝」。

星期一, 4月 16, 2007

初生之犢不畏虎?

勇敢(有勇氣)與無知魯莽,經常只是一線之隔,難辨是非。

突然對「初生之犢不畏虎」這個成語感到好奇:它是說小牛有勇氣,還是表示小牛無知?

教育部國語辭典的解釋,是說「剛出生的小牛不懼怕老虎。比喻閱歷不深的年輕人敢說敢做,無所畏懼。」我從前也習以為然地認為,它是在正面稱讚年輕人有勇氣面對未知。

但最近試著講故事給小傢伙聽,講著講著卻漸漸覺得,許多童書對成語或故事的解說頗為牽強。小牛不怕老虎,應該是因為牠沒有見識過老虎的可怕。但是,牠會因為不怕老虎,而跟老虎持續拼鬥、無所畏懼嗎?很難想像。

或許,這個成語的解釋,應該是「比喻閱歷不深的年輕人敢說敢做,無知莽撞,有勇無謀」呢。

也或許,這個成語其實是「陽褒陰貶」,表面上是稱讚年輕人無所畏懼,底子裡卻是諷刺他們有勇無謀?

也或許,這個成語適當的使用時機,是在事後(心平氣和、不帶褒貶地)描述年輕的特質:衝撞有活力、卻略嫌魯莽。

越想越不明白。嗯,自己似乎想太多了... :)

勇氣,並不是不帶有畏懼。它應該是:持續面對並克服恐懼的行動。
 

星期六, 4月 14, 2007

產生迷宮的另一種方法

約一年多以前,曾寫了些關於「如何產生迷宮」的 Blogs。

前些時日,在書店亂逛,無意間看到一本關於資料結構與演算法的書,裡頭提到利用 Set Union 來產生迷宮的方法(Weiss: Data Structures and Algorithm Analysis in C++, 3rd edition, pp.331-334)

這個方法的概念很簡單:
  1. 首先,將地圖中的每個單位 (cell) 視為個別的小集合,然後將這些集合的 collection 稱為 C。

  2. 隨意從 C 裡抽出兩個集合 x, y。若這兩個集合「打掉一面牆」之後可以連通,那麼就將這兩個集合聯集 (union) 成集合 z,並將 z 放入 C 中。

  3. 反覆執行步驟二,直到最後 C 只含有一個集合為止。

我覺得這個演算法很漂亮。

春假期間騰出一些時間,用 PHP5 把它實作出來。(為了避免無效率地從 C 中挑選元素,我先將所有「可被打破的牆」排序並打亂後,逐一檢視每一面牆「若被打掉後,是否相當於將 C 裡的兩個元素作聯集的動作」。)


產生的迷宮「效果」如何?我覺得還算不錯。它似乎比「稍微有些曲折的迷宮」的結果來得有變化,但並沒有「更為曲折的迷宮」所產生的迷宮那麼蜿蜒。

星期四, 4月 12, 2007

又見對資料處理的苦笑

昨天在實驗室碰到 Hsu,他笑著向我吐苦水。

怎麼回事呢?原來,他幫項老師做計畫(寫程式),詩沛請他幫忙處理一些古籍 metadata 與文件之間的對應。然後... 他也碰上一大堆「不該有」的問題,隨便列舉幾個:
  • 原先以為文件都是 Unicode Little Endian 編碼,處理後才發現有的文件依然是 Big5 編碼。

  • Metadata 是用 Excel 編寫的。如果從外部呼叫 Excel 的Automation 元件,每個欄位的長度不能超過某個值(他有說一個數字,但我忘了是多少),但剪貼並不會有這樣的問題。於是,他只好先將 Excel 檔的內容匯出,然後再自己剖析 (parse) 輸出的文件。

    類似這樣的 Excel I/O 問題,屹靈(實驗室碩二的學弟)和我都曾經碰到過。只是,解法雖類似(都先從 Excel 匯出檔案),但因為目的不盡相同、使用的程式語言也不太一樣,寫出來的程式(或格式轉換工具)彼此是不能互通的。(永倫也曾碰到反向的問題:產生一份 Excel 可讀的檔案。)

  • 要寫剖析的程式,當然得先知道輸入字串的格式(或語法,syntax)。問題是,有些地方會出現莫名其妙的分斷字元或符號,而這些字元該如何被處理,往往需要重新檢視 Excel 檔的內容,然後以「經驗」再加上一些「Common Sense」來決定該怎麼做(直接捨棄這個字元、還是這個字元前後代表不同的欄位... 等等)。

    這表示,程式得因為這類「不在預期中的小問題」一改再改,程式碼最後可能會變得雜亂或醜陋,而增加日後維護的困難。

哇哈哈,你看,這些問題是不是在一年前我就曾碰到過、抱怨過?「垂直式的開發模式」就是會有這樣的困擾:每個人各自開發一個子系統,獨立解決自己看到的問題,然後... 類似(或甚至是相同)的問題反覆出現,每個人都得「重新發明輪子」來讓自己跑得輕便些。

厲害些的人,遇到這樣的問題,會知道如何去處理(但通常還是會抱怨、嘆氣、或苦笑一番)。實務經驗比較缺乏的學弟妹們,遇到這類「煩人的瑣事」,往往就會被卡住幾個星期、甚至數個月。

所以,會不會覺得很奇怪:處理 THDL 的資料,怎麼會遇到如許多的問題?

我認為,一個複雜系統之所以困難,有很大部分是來自於合作的挑戰,以及對「未來之不可預期與不確定性」的一致期許與規劃。這應該也是軟體工程所看見的問題與挑戰吧(當然,還有「降低成本」的挑戰。「工程」就是要在現實的環境下儘可能地滿足需求)

星期日, 4月 08, 2007

妮基的異想世界

「若人生是一場牌戲,即使無法得知遊戲規則,我們仍得玩下去。」

妮基 (Niki de Saint Phalle, 1930-2002) 是一位著名的素人(沒有經過正式的藝術教育或訓練)藝術家。歷史博物館 在今年的 2/9 - 4/29,以「妮基的異想世界」為題,展出妮基的一些作品、道述她傳奇的一生。

因為出生的時機,正逢經濟大蕭條,妮基從小就不被父母所疼愛,而由爺爺奶奶所撫養。年少的她,甚至曾被父親性侵害,且因牧師不願信任他而學會緘默。年輕時美麗動人,曾擔任模特兒(雜誌封面人物),18 歲就結婚私奔,卻因不堪承受壓力而精神崩潰。直到她遇見丁格利 (Jean Tinguely) 之後,生命從此另闢一片天空。

妮基的 Nana (「女人」之意)系列,展現了豐富的色彩與想像,頗能討人喜歡、並進而引發省思。塔羅公園 (Tarot Garden) 也相當有意思,妮基希望它是寄託夢想與快樂的所在。

在小傢伙昨天(星期六)的課程裡,蘇荷的老師介紹妮基的生平及一些作品。蘇荷很有意思,除了鼓勵家長帶小朋友去參觀展覽,也讓家長旁聽。我對藝術可說是一竅不通,但聽蘇荷的老師用小朋友可接受的方式介紹妮基,竟也聽得趣味盎然(從這裡就知道,我的藝術欣賞能力,大約只有小朋友的程度,哈!)

想說既然蘇荷極力推薦,似乎該帶小傢伙去參觀展覽。於是,趁著天氣還算不錯,下午先徵得小傢伙同意,帶她到歷史博物館走走看看。

參觀的人數眾多,頗出自己意料之外。我自忖,如果不是聽過蘇荷的介紹,我就算心血來潮去參觀,自己恐怕感受不到其中的許多趣味。看來,我自己看不懂,就以為別人也不會欣賞,真的是「以小人之心」來猜度他人的藝術鑑賞或品味能力了。

太太很欣賞妮基的後期作品。不過,紀念品實在太貴了,我實在買不下手。斟酌再三,最後只購買了一本「妮基的異想世界:導覽手冊」(中文書籍的價格,還是比較合理,NT$200)與一片 Nana 圖案的小塑膠磁鐵(這個單價就要 NT$120 呢),以供日後回憶。

星期六, 4月 07, 2007

從 Ankh 的虛擬書櫃談起

Ankh 在 aNobii 為他的實體書籍,建了一個虛擬 (virtual) 的書櫃

不包括中文書,就已經有 597 本書了。雖然好像尚未完成分類的標記,看起來數學和語言學的書籍最多。嗯... 光從這麼粗淺的分類統計,就可以大略得知他的研究興趣(不說是「閱讀喜好」,是因為這些擺上櫃的圖書,幾乎都是很「硬」的教科書)了。

所以,我認為統計應該是很實際,很有意思的一門學問。許多學者重理論而輕應用,稱機率而鄙統計,其實正可彰顯出「理論」與「實際」間的距離。

看別人的書櫃,似乎可以滿足一些偷窺的慾念。一個重點是,自己還認識擁有這個書櫃的實體人。「喔,這本書我也有耶」、「嗯,這本爛書他也有,哈哈」、「啊,竟然有這麼一本有趣的書」之類的想法此起彼落。

此外,由於自己的閱讀速度慢,看到他在許多圖書上標示「已讀完」時,感覺是頗複雜的。「嘿,我應該也不算很混、應該也是也很認真地在閱讀、求學、上進、成長的啊,怎麼幾乎每本書都沒能看完?」

妙的是,自己竟然覺得:在「比較」之中觀看自己的心情(即使是「既羨慕、又嫉妒」的感覺),也是頗有趣的一件事。

坦白說,我個人是很佩服 Ankh 的。他每個星期幾乎都會到台大圖書館借閱書籍(也似乎都至少有瀏覽過那些借閱的書籍),這讓我認為他必然屬於借書的大戶。不知道圖書館會不會善加利用這類資訊來與借閱者溝通,甚至藉以「教育」其他潛在的借閱者?

星期二, 4月 03, 2007

天下雜誌:直昇機父母

從中時電子報上,看到天下雜誌的一篇文章,談到「別當直昇機父母」。

根據該文的說法,「直升機父母」(helicopter parents)指的是「過度介入」與「過度焦慮」的父母。他們像極了直升機在上空盤旋,無時無刻守望孩子的一舉一動。

文章說,台灣現在約有六百萬位父母(大多數在一九六一到一九七六年階段出生、解嚴前後接受大學或義務教育),被威權教育訓練為學歷至上的競爭動物,上最好的學校、爭取頂尖工作。由於他們多半只有一兩位小孩,又身處全球化無情競爭、就業市場不確定的環境,因而把「教養小孩」當成「極限運動」(extreme sport),帶著小孩四處補習,就怕輸在起跑點。

講到最後,撰稿者終於提到自己的看法:「直升機父母被困在一種愛的陷阱裡。誤以為愛孩子,就要為孩子掃除一切人生的障礙、幫孩子成功(successful);其實,愛的價值是在幫助孩子找到重要價值(significant value)」。

喔,原來文章開頭寫得落落長,還用數個案例來凸顯問題的嚴重性,現在才說到重點:「一旦堅信孩子都是獨立的個體、都有其價值,父母就能學會接受與放下」。

不是嗎?每個人都有自己的天賦、都有自己的自性、都有自己的使命感、都有自己的人生路。或許父母所該做的色,是從旁協助與鼓勵小孩往「成就自我」的方向努力。換個角度說,若父母把自己的價值觀強加在小孩的身上,那恐怕就「關心過頭」了。

星期五, 3月 30, 2007

小傢伙的魚版畫

說自己對美勞有所畏懼,其實是有些道理的。

隱約記得,在某次的夢境中,美術課老師出了一道題目要同學們畫。我緊張萬分、腸思枯竭,卻怎樣也畫不出來。夢醒後,對於那種「必須在兩個小時內畫好」的美術課,似乎還心有餘悸。

兩個月前,小傢伙在蘇荷有一堂「魚版畫」的課。起先我很是懷疑,教四歲多的小朋友玩版畫,他(她)們跟得上嗎?會不會都是老師在唱獨腳戲啊?


結果讓我大吃一驚。小朋友們幾乎個個都能做出很棒的作品,而小傢伙的「魚版畫」,看起來也是那麼地有美感(那條大魚張開尖尖的嘴巴,打算吃小魚)。

不得不佩服小朋友的創作力。

星期三, 3月 28, 2007

疲倦?茫然?

有時,理解一個觀念並不容易。但是,理解後再把這份理解寫出來,對我也是很具挑戰的事。

這幾天的空閒時間,幾乎都在忙著「寫論文」。寫些什麼?寫這篇論文所需要用到的一項統計觀念:「95% 信賴區間」。

嗄?這太不合理了吧,只是一項「基本」的統計概念,就寫了這麼久,就需要花這麼多時間?

是啊。雖然有太太的幫忙,得以加速整個理解的過程;但是要從「直觀上感覺有意義」、到「大致看懂統計書上的符號意義」、然後「理解推導的過程」,再將這些「理解」轉化為「有系統的介紹文字」,還是遇到頗大的困難。

於是,這幾天連小傢伙晚上睡覺的時間都延後了。覺得不太應該。

於是,回頭反問自己:為什麼要花這麼多氣力來寫這部份的內容呢?為何不省些氣力,直接引用統計書上的公式,讓自己「不用花太多力氣,就能顯得更有學問些」呢?

除了讓自己對「95% 信賴區間」這個觀念有更深的認識、讓自己對寫出來的內容比較有把握之外,整體的投資報酬率 (ROI: Return of Investment) 似乎太低了。

太執著了嗎?有些疲倦,也有些茫然。

星期五, 3月 23, 2007

兩張小小傢伙最近的照片

時間過得快,小小傢伙也已經出生七個多月了。

     

這幾天生活忙碌且單調。工作上一個重點是「寫論文」--- 將去年某位學弟的碩士論文整理並撰寫出來。原本是用 Word 來寫,但因為寫不出 p-hat(在字母 p 上面加一頂 ^ 帽子),又對 Word 所附的 Equation Editor 不滿意(因為覺得編寫出來的東西還是很醜),因此只好改用 cwTEX。也或許是因為自己有了些年紀,cwTEX 使用起來竟總覺得不是很順暢。

感覺起來,腦袋裡似乎裝滿糨糊,灰白、黏稠,但我卻無力清乾淨來讓自己舒爽些。回想不出什麼有意思的內容來寫 Blog,而自己也很久沒有告知親朋好友「小小傢伙」的近況了,就先在這兒貼上兩張她的可愛照片好了。

也算是「炫耀文」罷。

星期三, 3月 21, 2007

什麼!又一個月過去了?

最近是怎麼回事,怎麼日子過得好像無聲無息,「忙碌」到不知道自己在做些什麼。

昨天突然想到,自己好像有一陣子沒有連上圍棋網站看棋了。自己的棋力很差,但觀看高手對奕,有時就像是欣賞電動高手破關,還真有些趣味或美感。若是太久沒有登入線上的圍棋網站,帳號很可能會被關閉、甚至刪除的。趕緊登入圍棋網站,順便亂看幾局棋。

是啊,從春節到今天也一個多月了,我到底在做些什麼啊?說是「浪費生命」似乎也不妥:還是有做些工作,還是將工作外的時間幾乎都放在家庭生活上。讓工作與家庭生活佔據大多數的時間,似乎是「正常」、似乎是「應該」的吧?

嗯... 工作上比較傷神的,應該是審視、整理去年某位學弟的實驗、報告與碩士論文,然後寫出一篇論文吧。對我來說,「寫一篇好論文」還真不是一件容易事呢。要先了解實驗的內容、步驟與結果,構思論文的主軸與「問題的看待角度與方式」,鋪陳前後一致且連貫的論述,然後加入合適的引言或範例,還必須在適當的地方引經據典來加強論證。

有時,光是追究某些名詞的定義,就需要花費相當多的時間與精力。例如,前些日子突然對「domain name」的定義產生疑慮,但網路上相對容易取得的「定義」或說明其實都相當模糊,或甚至是錯誤的(用 Google 查 "define:domain name" 就知道了:IP addresses 與 domain names 之間,應該不是一對一的對應關係)。而網路上的資訊品質難以判定,或許正是「為什麼美國有歷史系禁用維基百科」的原因罷。

星期五, 3月 16, 2007

「資訊架構學」的系統圖

中午悶得有點慌,把實驗室新購的「資訊架構學(原文雖然已經發行第三版,但中文譯本還只有第二版)拎到麥當勞,很快地看過前三章。

大致上說來,每個人都有自己處理資訊的方式。然而,當資訊量變大,又希望能夠提供「可用、好用」的環境來讓別人取得資訊(降低「資訊過載」的衝擊),問題就不是那麼簡單就能解決了。於是,就衍生出「資訊架構」(information architecture)這樣的需求。

對其中兩張圖表的印象頗感深刻。其中一張是「資訊架構系統」圖(如下圖所示),它簡要地描繪了搜尋系統的處理流程、使用介面的經典鋪陳方式、以及圖書館學(作者具有圖書館學的背景)經常提到的語意網路單元。


另一張「描述使用者在資訊系統中如何移動的『採草莓』模式」圖也頗有意思。作者說明這個模式的出處是 Bates 在 1989 年(嗯... 這類問題在十五年前就已經有人研究啦)所發表的一篇文章。可惜的是,我在網路上找不到作者在第二版所整理繪製的圖(第三版好像把這張圖移除了?),沒能將它轉貼在這裡。

星期三, 3月 14, 2007

從《約耳談軟體》受益匪淺

覺得自己似乎對於軟體開發「有了些不一樣的感覺」,因此打算抽時間看一些相關的文章。

不過呢,自己閱讀的速度慢,空閒的時間其實也不多,所以若能看中文的翻譯,當然可以節省許多時間。看些什麼呢?我想起 MPH 翻譯 《約耳談軟體(Joel on Software)》的許多文章。心想 MPH 是老朋友啦,他翻譯的東西應該具有一定的品質吧。

果然,才看了前二十篇文章(之後的文章還沒看),就感覺受益良多。這些文章雖然都是西元 2000 年寫的「老古董」,但我認為大多數內容仍然值得閱讀(這句話的意思是,我對一小部分的內容不怎麼認同、也對另一小部分很不認同),甚至可說是歷久彌新(經過長久的時間,不但沒有衰敗、陳舊,反而更新、更好)

當然啦,我其實是很想對這些內容有些更深入的思辨(或者說「批判」?哎,我怎麼老對這個詞彙有負面的感覺啊),但... 坦白說自己連「內容摘要」、「要點分析整合」等基本工夫都沒有做,又怎麼能「引發思辨歷程、繼而有系統地整理自己的想法」呢?

閱讀間,其實也發現一些翻譯上的小失誤(通常是打錯字)。但瑕不掩瑜,我還是相當感謝 MPH(以及其他的翻譯者)能夠將 Joel 的文章翻譯成中文 -- 至少可以嘉惠像我這樣「妄想一步登天了解軟體開發,卻不太能夠動腦,甚至只有一點點時間」的人。

星期一, 3月 12, 2007

對詞彙的主觀感受

驚覺自己對於一些詞彙的主觀感覺很強烈。

比如說,當我在某篇文章裡,看到「意識型態」或「批判」這樣的詞彙時,心頭第一個印象就是負面的。

然而,「意識型態」的解釋是「個人或團體所持有的特殊觀念或思維方式」,本身應該沒有蘊含是非好壞的判斷(每個人、每個團體,都會有自己的意識型態)。「批判」這兩個字更有意思,它的解釋是「是非的判斷」。從批判性的角度出發,探討事情的真相應該是件好事;而擁有批判性思考,更應該值得鼓勵。

那麼,自己為什麼對「意識型態」或者「批判」這兩個字眼時,會不自覺地湧起一股厭惡的感覺?

猜測是受到中學教育(印象中,「三民主義」或「國父思想」的課程裡,動不動就是「共產主義的意識型態」或「馬克思主義思想批判」之類的文字)的影響。大學教育後,就幾乎只能從報章雜誌的報導中看到這些詞彙;而看到的文章也多半含混籠地運用這些字詞,導致自己的字感被長期扭曲。

有時會覺得,人與人的溝通之所以困難,有很多都是來自於誤解。語句中避免使用「意識型態」或者「批判」這樣的詞彙,應該可以減少溝通之中主觀印象的影響,避免不必要的誤會。

只是,我總還覺得應該訓練自己:當看到這類詞彙或語句時,能夠「回到原點」、「回到原本的字義」來思考,不要輕易被過去不當的教育所扭曲或誤導。

星期六, 3月 10, 2007

鈍化的記性

不知道怎麼回事,這一陣子記性好像變得很差。

整體上,覺得在這一個月裡每天都撥不出什麼空閒,但自己究竟忙了些什麼,卻一點也想不起來。是的,就連前幾天自己做了哪些事,立即式的反應都是一片空白。

這時,有一個簡要的記事本,簡單地記錄當日「比較重要的雜事」,就經常能喚回一些「實際上只是前兩天發生,但感覺上飄渺久遠的事」。

從記事中,我才想起上週曾經開車帶小朋友走過台北燈節的「燈海隧道」,帶小傢伙去學畫畫、學律動(加上一次補課,共佔了兩天),也曾陪她在傍晚時分到中正紀念堂看花燈。喔... 原來工作外的時間,幾乎都消磨在小朋友的日常生活中了。

想到自己才剛滿四十歲沒有多久,今後身體或記憶狀況大概只會一年比一年差,就既傷感又震驚。人似乎總要在失去時,才能體驗到某些東西的重要。

星期三, 3月 07, 2007

本週的一篇紐時報導

接受自己英文程度不怎麼好的現實。

或許也是因為如此,最近比較能用輕鬆的心情,來閱讀每週聯合報所附贈的 New York Times。

這個星期的封面標題是「Reaching for a Better Life」,一幅大大的兩對新人結婚照,很觸動人的好奇心:究竟是什麼內容,讓人能夠擁有比較好的生活?

喔,原來是在報導說,在亞洲的一些國家,未婚男性越來越不容易在國內找到適當的伴侶,因而衍生出「結婚市場」(Marriage Market),導致「異國婚姻」的比例越來越高。這些國家的人民,普遍都仍有重男輕女的傳統觀念。隨著性別篩選科技的進步與普及,造成了男女比例的失衡;再加上女性的社會地位提高,就導致相對弱勢的男性很難在國內找到對象。

令我感到訝異的是,這篇報導說,在韓國,異國婚姻(通常是較為富裕國家的未婚男子,到中國大陸、越南、或泰國等地尋找新娘)的比例,已經從 2000 年的 4% 增加到 2005 年的 14%。百分之十四?那可是不小的比例啊。(嗯... 那麼台灣的情況(謝謝 askker 提供的連結),又是如何呢?)

來自較為富裕國家的新郎,通常在本國都遭遇到求偶的困難;而來自較為窮困國家的新娘,則通常都嚮往更好的生活。兩方各取所需,造就了異國婚姻的市場。在為期五天的旅遊行程中,尋找伴侶的男女就從完全不認識的狀況下,選擇並決定了自己的另一半。

只是,我真的頗感好奇:「王子與公主」在如此有效率的婚姻仲介下,配對成功之後需要哪些努力、必須經過哪些磨合,才能「過著幸福快樂的生活」?

星期五, 3月 02, 2007

形色分離

去年底就想對「形色分離」記錄下一些感想,但不知怎麼卻一直拖延著。

小傢伙到「蘇荷」玩繪畫的啟蒙班課程裡,蘇荷同時為家長們「上課」。我對美術原本應是一竅不通,但是經過幻燈片的播放與講解(講解者應該是蘇荷的創辦人林千鈴吧?),對某些畫作卻竟然能隱隱產生一些共鳴。雖然只是那麼「一丁點」的共鳴,有時卻像是「茅塞頓開(比喻馬上開悟,忽然明白),感覺很是舒暢。

例如,「形色分離」的概念,就頗能夠觸動我的內心。講解者說,文藝復興時期,繪畫擬真已經達到登峰造極的地步,其中最有名的就是達文西的那幅「蒙娜麗莎的微笑」。之後的繪畫突破,就是從形狀與顏色的分離開始,在形狀與顏色上創作革命(背叛從前人所贊同的繪畫或美學觀點)。

講解者並認為,台灣的幼兒繪畫,太過著重在「形」,而對「色」則相對疏淺。例如,下圖左方小傢伙的塗鴉作品「與動物們去郊遊」,就僅著重在「形狀」。相對地,下圖右方的「配色練習」,則是讓小朋友們利用三原色(紅、黃、藍),來調配、變化出各種不同的色調。

     

也覺得自己頗能認同蘇荷的一些理念:『美術教育很重要的期待是培養孩子的觀察力,帶領他們去「看」,發現一些平常至是隨意帶過的細節...』、『「學習」是通往藝術不能省略的途徑... 任何一種藝能都是長期磨練和不斷的自我超越的結果。』

台灣社會裡,其實處處可見有心人士為理想而付出、實踐、奮鬥。只是,自己從前為什麼都沒有關注、讚賞他們的努力與成就呢? 我想,或許從前就是對自我太過執著,才會對這些值得稱許的情事視若無睹(當作沒看見一般。形容對事物毫不注意)罷!

星期一, 2月 26, 2007

柏拉圖靈丹

自己看書的速度頗慢。最近這兩個月,早晨閱讀的書籍是「柏拉圖靈丹」。

這本書引用了一些實例,講述說明「哲學諮商」在實務上的用途:它能幫助人們,在人生旅途遭遇困惑時,從累積數千年的哲學智慧中,找出符合自性、值得參考的哲理,並引發接下來的實踐動作。

類似「哲學家探索世界、更關心人性」、「多數哲學問題並沒有答案、更沒有標準答案」這些老生常談(老書生的尋常言論。比喻時常聽到,了無新意的老話)聽多了,總覺得思想似乎已經麻木,對於哲學總還是隔靴搔癢(隔著馬靴搔癢處,比喻不切實際),抓不著要領。

於是,當我看到作者強調「每個人都有每個人的哲學」-- 每個人都有自己特殊的哲學自性與信仰 -- 時,內心頗受震撼。

從前,或許自己太受柏拉圖學說的影響,認為萬事萬物背後總有、也該有永恆的真理(理型世界)。於是,對於一些「看似不合理」的情事,就會覺得不舒服,就會有一堆牢騷。

然而,即使是大哲學家、大思想家,也未必完全同意柏拉圖的觀點。或許,世界上並沒有絕對的對錯,而只有好與壞。或許,世界本來就應該是這樣的。或許,我們只應關注於「如何過好的生活」。也或許,人生本來就是痛苦的,我們應該要尋求永恆的解脫。

其實,似乎還真的是因為自己「還沒有準備好」,自己「用了不適當的心態閱讀思考」,因而連哲學的前院都無心去留意,更不用說要踏進哲學的大門了。

世界是如此奇妙,而人生又是如此短暫。很高興自己仍然走在探索「自我、目的、意義」的路上,並希望能夠對它們有更深刻的認識。

星期五, 2月 23, 2007

蘇格拉底法

「蘇格拉底法」(Socratic Method) 是一種批判性的自我反省方法。

據說蘇格拉底很會藉著一系列的問題,去誘導、探究人們在思想上的一些矛盾。而如果你很輕率地給蘇格拉底一個關於「正義」的定義,而他後來引導你承認你的定義可能會造成不正義,那麼你就是自相矛盾。

可惜的是,蘇格拉底法只能顯示出「某樣東西不是什麼」,卻不能顯示「某樣東西是什麼」。因此,如果用這種方法探究自己究竟懂了些什麼,最後可能會發現自己「其實什麼都不知道」。

於是,蘇格拉底有一句名言:「我只知道一件事,就是我一無所知」(I know nothing except the fact of my ignorance)。

於是,即使是「無知」這樣的詞彙,也經常存有多種不同的解讀與層次。一般所謂的「無知」是「沒有知識、不明事理」的意思(英文單字 ignorant 也常被翻譯為「無知的」)。但這兒的「一無所知」卻是從批判性的角度反省而來,當事者很可能已經頗有了解,只是一直無法很明確地定義出某些基本的元素究竟是什麼。

此外,莊子說「形體立於虛空之中,似是無知之貌」,道家思想主張「無知、無欲、無為」,其「無知」(棄智)的境界,似乎又更為高遠深邃。

人類的思想真是奇妙,能夠辨識出這些有趣微妙的差異。世界也真是奇妙,處處充滿這些難以定義解釋的東西。

星期二, 2月 20, 2007

豬年第一篇雜記

今天是大年初三吧,先向大家拜個晚年。

昨天是星期一。或許是因為過年編輯們都放假了,昨天的聯合報並沒有隨報附有兩大張的 New York Times。這樣也好,過年期間我應該都待在家裡,因此大概就沒有早上喝咖啡看報紙的時段了。

Google 提供新版面配置,已有好一段時間。猜想這類新花樣應該有一定的穩定度了,因此也試著套用來看看效果。許多原先的設定(例如字型的大小)都遺失了,花了不少時間才弄到一個比較像樣的面貌。可是,新的版面配置元素裡,卻似乎沒有「舊版提供的 Previous Posts」功能(將最近貼出的 posts 文章標題列出來),總還是讓我覺得不舒服。

其實,我是覺得 Google Blogger 除了該提供「Recent Posts」、「Recent Comments」(最近的一些 post 回應)之外,應該提供「將符合特定條件的 posts 標題排列出來」的功能。例如,列出將某個月份的 posts 時,就可以將它們的標題列在左方作為簡單的摘要資訊。不過,就新版本的狀況來看,Google 似乎不認為這些功能有多重要。

難道,是我的要求太多?或許,能夠有免費的 Blogging 服務,就該感到知足、就該感到滿意。只是... 合理、合適的要求,應該也是促成進步的一項重要因素,不是嗎?

星期六, 2月 17, 2007

小傢伙的紅包袋

明天就是農曆春節了。

這幾天「放假」,早上沒能到丹堤吃早餐、看看 New York Times、讀讀書。回想了一下,每天照顧兩個小朋友、出門採購年貨零嘴、整理小傢伙的玩具、清掃環境... 等,就足夠讓自己找不出時間來做一些「自己想做」的事情了。(也因此,我現在是很佩服家庭主婦的。)

小傢伙不知從哪得來的訊息(我猜是「巧連智」,但無法確定),前幾天就從她的存錢筒裡,掏出一些銅板放在紅包,說是要給我。

而昨晚我在清潔舖在地板的泡棉墊時,她看到桌上的一些空紅包袋,心血來潮說要包紅包給姑姑。她說,「姑姑對我很好,都會買玩具給我,還會陪我玩,我要包很多 ㄎㄡㄎㄡ 送給她。」接下來,她又包了好些個紅包,直到她的存錢筒裡只剩下幾個零錢。



她說,裡面只剩下幾個 ㄎㄡㄎㄡ 了,可以等到以後需要錢的時候再拿出來。

很明顯地,小傢伙雖然有「多少」的概念,但還不是很能認識「五十元」、「十元」、「五元」與「一元」的不同。因此,最大的紅包(圖片右下角的那一個)就鼓鼓地、重甸甸地,裡頭塞滿了大大小小的硬幣。趁著她還沒睡醒,我很快地數了一下,裡頭竟然有 68 個銅板,價值 1709 元呢。

想起她昨晚說話時那副認真的表情,覺得小朋友的純真實在很窩心、很可愛。

星期一, 2月 12, 2007

大掃除

小時候,對過年過節,似乎總存有著那麼些幻想與期待。

只是,總覺得這些年來,年節的氣氛減少許多。或許是因為社會大環境的競爭激烈、步調快速,因此對於中式節日缺乏細細品味的時間;或許是因為年紀漸增,已不再對於過年過節存有「神奇的魔法想像」;當然,也有可能是因為自己根本就迷失在忙碌的工作裡,早就忘卻培養欣賞年節趣味的能力。

因為小傢伙對塵蟎過敏,前幾天太太找到一家沙發改裝店,將原來的布沙發換裝成皮面。沙發運走後,客廳顯得空曠許多,正適合清除堆積多年的塵垢。加上農曆春節即將來臨,若能將家裡好好地打掃一下,應該能夠增添一些除舊佈新的年節氣氛。

今年春節,可以感受到比較強烈的年節味嗎?雖然不免因自信不足而有所懷疑,但卻衷心地希望它能夠實現。

星期三, 2月 07, 2007

在魔法與現實之間

在陪伴小朋友長大的日子裡,經常可以獲得許多美妙的經驗。

部分的原因,或許在於小朋友很天真,在他們小小的腦袋裡,還相信世界上有著神奇的魔法。

這個星期聯合報所附的 New York Times 裡,有一篇「Power of Superstition: Do You Believe in Magic」(迷信的力量:你信不信魔法)。這篇文章討論現實生活中許多迷信(例如,相信配戴特殊的幸運符可以帶來好運)的影響,但有個小段落更吸引我注意。

這個小段落說,十八個月大的小孩子就會有一些神奇魔法的想像,但在八歲或更早,小孩子就會知道幻想與實際的區隔。也就是說,那個年紀的小朋友,對於魔法與現實之間的清楚區隔,已經與成年人沒有什麼差別了。

小傢伙經常希望我能夠在家裡陪她。晚上睡覺前,她有時會很淘氣地將床頭的鬧鐘藏起來,或者是把時間轉慢一小時。問她為什麼這樣做(也告訴她不可以如此),她的臉上閃過一絲狡黠的笑容,很天真地回答:「因為這樣爸爸明天就可以不用去上班,就可以在家陪我玩。」

雖然有些像是在寫「炫耀文」,但有時自己還真的頗陶醉在小傢伙那天真又迷人的笑容裡。

星期一, 2月 05, 2007

提升眼光的高度

在電子報上,看到龍應台的一篇文章:「自首報告:路走得寬闊,人顯得從容」。

很難形容看過以後錯綜複雜的整體感覺。或許,印象比較深的感覺就是「現實是很複雜的」。多複雜?一個例子是龍應台說的「道德不能處理法律問題,法律又不能處理政治問題」,而現實卻又不僅僅是道德、法律與政治問題。

有時想想,對一個人的了解不多,卻讓媒體新聞的炒作評論來帶領自己對政治人物的觀感,實在是件頗為悲哀(悲傷痛苦)的事。雖然看膩了、聽多了,也習慣不把它們當作一回事。但是,這些媒體評論來來去去,除了激發各個陣營「自以為是」的片面觀感,卻似乎很少能提升民眾對於「民主」、「法治」、或者「道德」的認知,這樣是否類似於「在原地空轉」,以致「太浪費社會整體資源」了呢?

很喜歡文章中所說的:「白老鼠走不出他的迷宮隧道,因為他自始至終在迷宮隧道裡打轉,沒有高度,就無法綜觀全局,看見出口」。沒有提升到一定的高度,就不容易找到出口(或者問題的解答)。

因此,就像文章所說,真正的問題應該是:「我們眼光的高度要放在哪裡,才能在複雜混亂中看見出口?」看待紛亂的的社會,應該從這樣的角度著手;而即使範圍縮小,思考公司、實驗室、乃至於個人的的研究與發展,似乎也應如是。

星期六, 2月 03, 2007

在實驗室會議,談系統整合

實驗室在星期三,舉行了一場從早到晚的會議。

原本項老師是希望讓所有的實驗室成員,各自報告其進度與展望。可是老師一開口談 THDL,就花了一個半小時。接下來學妹和我說明彼此對 THDL 的一些想法,又花了差不多兩小時。

我的投影片內容應該不算多。比較起爭議的是在於,我覺得「系統整合」是一項吃力又不討好的工作(學術價值低、必須遷就現實環境的限制、還必須顧及上下游的支援),因此需要採用「軟體工程」的觀念與做法。

然而,項老師還是從「理論」的角度去看系統 -- 他似乎以為,只要有好的理論,系統就有好的基礎,於是「自然」就能夠有好的實作。殊不知,對於一個頗具複雜性的系統而言,這個「自然」一點也不自然。若希望 THDL 在長久的研究發展後有一套不錯的實用系統,就應該特別的關注系統開發的一些問題;否則弄出來的東西,必然無法應付實際面的各類複雜問題、必然是會出狀況(尤其是在系統維護 -- 包含系統升級與擴充 -- 方面)。

雖然自己對於軟體工程,懂的也實在不多,但最近已能 appreciate 其認知的觀點與許多對應的做法(我還是會對其中許多「假科學」的作法持保留的態度,但這些並不妨礙軟體工程的重要性)。軟體工程並不能給你一個「最好的標準答案」,但是它會告訴你一些軟體的特質、以及開發軟體所不能忽略的事情,而我們也必須從中選擇、嘗試、尋找最符合自己(團對)的開發方式。

我猜想,一個人能夠開發出一套好軟體,或許也是因為他自己就已經「有自己的一套軟體工程思維」,有自己對待寫程式、模組化、除錯、乃至於後續維護的看法與做法。但是,當研究的時程拉長、開發的人數增加,在流動的人員之間,就應該有較為一致的軟體工程角度,才能順利地進行系統開發與維護。

沒有能夠說服項老師,是預料中事。然而,沒有能夠讓他更加認同「系統整合」的重要性,則多少表示自己的報告「還是沒有能夠切入要害」。不過,我還是覺得,只要有努力嘗試,就會有希望。

星期一, 1月 29, 2007

終於把論文寄了出去

今天終於把論文遞交出去了。

這篇論文的「原始想法」其實在七、八年前攻讀博士學位時,就完成得差不多了。但算了算,從初稿完成到現在,竟然已經有三個多月的時間。如果把寫初稿的時間也算在內,那這篇論文恐怕花了不只半年才完稿。

嗯,從這兒就看得出來,自己真的缺乏寫作的才能 -- 或者說,缺乏有效率製造論文的能力。

星期五, 1月 26, 2007

需要有網路版中文參考資訊

覺得網路上的中文參考資訊,在品質、數量、組織、以及檢索方式上,都有很大的進步空間。

首先,是自己的一些經驗。我寫 blog 有一個附加的目的,就是希望藉著寫些文字,來訓練自己在語文寫作與表達上的能力。既然 blog 是透過電腦與網路輸入的,想找參考資訊當然是先透過網際網路搜尋。問題來了,我竟然找不到多少「經過組織、質好量多」的參考資訊。

最近常用的,就是教育部的國語辭典了。坦白說,我覺得這部辭典在內容品質、解說範例、以及相關連結上,都仍有相當大的進步空間。可是,網路上好像就只有這部國語辭典可用,於是就只能妥協了。

此外,即使教育部已經在網路上提供「國語辭典」與「成語典」,貓還是覺得,我們可以在網路上編一部「常用成語說明」,提供更豐富的說明、範例、相關連結、以及檢索方式。

Wiki 模式的成功,證明了網路可以匯集有心人的力量,來提供有質有量的資訊。貓和 Ankh 都覺得可以依循 Wiki 模式來建構好的辭典。學弟永倫也認為可以利用 Wiki 來分享課堂上的筆記,他認為這類的資訊分享,應該應該有助於台灣的教育。

那麼,如果要建構這樣的系統、提供所需的功能與資訊,現在缺的是什麼呢?

我想,在欠缺制度與規模的現況下,需要的應該是有心人士的分工合作,以及長時間且持續地投入吧。

-----------------------  題外話  -----------------------

對於前些時日我們的教育部長語出驚人,說『成語這個東西會讓人思想懶惰、頭腦昏鈍、一知半解』,但我寧可相信他是在「硬拗」,是為了替自己先前的失言辯解(卻不幸越描越黑)。

我覺得,成語在表達與溝通上是很重要的。成語用得適切,對文章常有畫龍點睛(比喻繪畫、作文時在最重要之處加上一筆,使全體更加生動傳神)之效。

星期一, 1月 22, 2007

又見 Blogger 的問題

Blogger 很早就在控制主頁裡拿掉 Beta 字眼,推出「號稱通過測試」的正式版。


不過呢,最近他們不知道出了什麼狀況,導致伺服器經常無法提供服務。

我上週五才寫說,第一次看到 Blogger 正式版的錯誤頁面。接下來,貓在他的 Blog 裡,就訴說他因手癢,將 Blog 的內容「轉換」了一下(他沒有說是轉換什麼,大概是 character encoding 吧),結果導致亂碼的故事。

而今天早上,我又遇到另一次 Blogger 的 server error。這次是發生在欲將寫好的回應上傳時:



嗯,即使是 Google 這般有錢有勢有人才的大公司,推出的產品也不見得問題就會比別人少很多。當然啦,或許 Blogger 和其他提供網誌(部落格)服務的網站之間,最大的差異是在於使用者的數量,但... 這不也正是 Google 的強項嗎?

先前在 Blogger Beta 時,我也曾手癢按下一個「轉換網頁」的按鈕,不過每次得到的訊息都是「頁面轉換失敗」。這回貓實驗後的結果,似乎是可以「轉換成功」,但部分內容卻變成亂碼。

我這回雖然沒有手癢去轉換,但... 也還是會遇到一些亂碼問題。例如,這篇 post 的回應者「被掛掉的阿尼」就會變成亂碼「被掛掉的阿尼」;但同樣的中文名稱,在這篇 post卻可以正確顯示出來。

我不禁又想起半年前曾抱怨, Gmail 傳送中文內容,根本就不顧及信件接收者所使用的 mail client 特性,導致我收到的 Gmail 中文內容,每次都得手動轉碼才能正確顯示。

感覺起來,Google 在中文的處理上,不是經驗與努力不夠、測試的涵蓋面不足,就是從基本面上,根本就忽略了台灣人「過去經常使用」的 big5 編碼。

星期五, 1月 19, 2007

工作上的肯定與鼓勵

書上說,黑格爾 (Hegel) 認為,人都有對他人肯定的依賴。

自從項老師擔任行政職務後,除了每週固定的實驗室會議,很少能在系館或實驗室見到他。不過,昨天與今天早上、還有今天下午,他「竟然」三度到訪實驗室。(昨天早上實驗室裡有兩個人,但今天就只有我一個。項老師還問說,這些小朋友們是不是很少到實驗室呢。)

前些時日項老師承諾,要看過並修改我寫的論文。昨天早上,他問了我一些論文中的語句,問我想表達的意思是什麼,他好根據我的原意重寫那些英文句子。

今天早上,他告訴我:「我覺得你們的系統做得很好」。「什麼系統?」我問道,一時之間會不過意來。他說,「就是你們那些 version 0.85、0.86 的系統啊」。

喔,原來是 THDL 的 prototype system 啊。如果我沒有記錯,這可是他第一次持肯定的語氣,稱讚這個「瑣碎問題叢生、費力費時」的系統呢。

有沒有搞錯啊,都已經四十歲了,還在乎、需要他人的肯定?

嗯... 我應該是沒有「那麼在乎」啦,但似乎也還是希望能獲得一些「關愛的眼神」。此外,從人性管理的角度來說,適時的鼓勵也應該能產生正面的效果。因此,我選擇這樣的回答:「謝謝。大家都很需要老師的鼓勵呢。」

對我來說,雖然最近對 THDL prototype 的熱忱與關心已漸漸淡去,但聽到項老師這「不知算不算遲來的」肯定,也真讓自己感到些許「終於有人識貨」的成就感。

或許,就如黑格爾所言,人都渴望得到他人的認同、肯定、支持、鼓勵、以及稱讚吧。

Blogger 的 Server Errors

剛剛第一次碰到「Google Blogger 正式版」上線後的 server errors。

起先,網頁收到的訊息是這樣的:


嗯,在 30 秒內重試?好吧,我就真的等了差不多 30 秒,結果還是一樣。有趣的是,繼續重試後,得到另一種錯誤訊息:


看來,Blogger 還有將服務中斷,分為不同的層級呢。

星期三, 1月 17, 2007

小傢伙的畫作:塗鴉

還沒有讓小傢伙上幼稚園。

雖然心裡有時也會有些擔心,沒有讓她早些接觸、接受社會規範下的教育,會不會妨礙到她未來的「競爭力」;但我隱隱覺得,在「接受比較正規的」教學前,小朋友是最天真可愛、最有自己想法與創意的。

所以,還是讓她去「雲門」學律動(就是讓她以運動肢體的方式玩),去「蘇荷」學畫畫(其實是去玩、讓她覺得畫畫很好玩)。

小朋友經常是需要鼓勵的。而我們這個小傢伙的個性,其實是很保守、很不願意嘗試新奇(因為很容易失敗或受到挫折)的事物,因此就更需要大人們(尤其是家長)的鼓勵。最近,她顯得相當喜歡畫畫。我有一次問她為什麼,她說:「因為你們說,我怎麼畫都很漂亮啊」。

比起我這個「什麼都不會」的老爸,她的畫作當然是充滿童心、創意十足。




上面這幾張圖,是小傢伙上個月的塗鴉之作。專家們可能會覺得這樣的童畫相當平凡;但或許是因為「敝帚自珍」的緣故,我倒是頗喜歡這些作品。將它們拍下來,作為她成長的紀念,回味起來也經常令人有股難言的感動。

星期日, 1月 14, 2007

又見學術抄襲

在中時電子報上,看到台大有醫生的論文,因抄襲而被退稿

坦白說,我現在是頗敬佩那些真有學術貢獻的學者。不是那些「每年可以生產上百篇垃圾論文」的學者,而是真有深厚學術根底、有創新的想法,又能付諸實現的那些人。

一個很重要的原因是,我發覺自己幾乎生產不出什麼像樣的學術論文。感覺起來,如果沒有與他人合作、沒有掛名,一年能夠寫出一兩篇「像樣的論文」就很不容易了。

然而,現在學術競爭激烈,因此為了「求生存」(我不知道「求高升」是否更合適 ...),教授們通常需要利用論文數量來彼此傾軋。但是,那有那麼多出色的人,能夠既有學術見地、又能撰寫出好論文、而且還能大量生產?

於是,即使是國科會主委、即使是台大醫院副院長(唉,兩人還都是中研院的院士耶),也都會利用「論文掛名」來競取權位。

雖說現實的競爭、乃至於利用假科學來評比績效,是相當大的推手。但我覺得「學者的學術倫理」,或許是更深層、更重要的問題。台大醫院的會議結論也妙:「傾向認定這事件是『無心之過而非惡意抄襲但考量到台大是台灣學術界表率,應該有更高標準 ...」

無心之過」(
非故意所造成的過錯)?聽起來論文的內容和別人一樣,就像是隨意走在路上,不小心「撞衫」 -- 碰到別人「也穿同樣的衣服」。真搞不懂,究竟是與會人士個個自危,還是他們太鄉愿了啊?

鄉愿 的意思是「外貌忠厚老實、討人喜歡,實際上卻不能明辨是非的人」。語出論語陽貨篇:「子曰:鄉原,德之賊也。」

星期三, 1月 10, 2007

改用 Yahoo! 的一些感想

大約一個多月前心血來潮,改用 Yahoo! 來作為預設的搜尋引擎。

忘記是什麼原因了。現在回想,很可能是因為使用 Google 已有頗長的時間,想要看看其他搜尋引擎是否有所長進。

結果還頗令我感到訝異。我發覺,Yahoo! 在中文搜尋方面,似乎已漸漸逼近 Google;有時 Yahoo! 的表現甚至比 Google 更好。例如,在中文搜尋的服務上,Yahoo! 比 Google 還要早提供「Related Search」的功能(例如,輸入『王建民』後,網頁最下方會有群組顯示「王建民桌布」、「王建民官方網站」、「王建民公仔」等),而這些群組的效果也相當不錯。

然而,或許是因為習慣簡潔的 Google 式 page layout,我對 Yahoo! 搜尋引擎的使用者介面倒是頗有意見。

首先,點選任一個搜尋結果的 hyperlink 後,Yahoo! 會開啟另一個新視窗來顯示那個網頁內容。我喜歡簡潔些、並不喜歡開啟一大堆視窗(即使是開啟在分頁的 tabs 中)。不過,Yahoo! 在約半個月前在 UI 上有了些調整,可以讓使用者選擇將連結內容開啟在原來的視窗或新視窗內,算是有照顧到使用者的使用習慣。

令我不解的是,Yahoo! 竟然常把「廣告連結」當作搜尋的前三筆資料呈現(雖然它有用淺藍色的底色做區隔,但佔據的版面位置相當於搜尋結果的前三筆)。我覺得 Yahoo! 在搜尋技術與市場上,應該還是落後 Google 的,怎麼會為了討好廣告商,而讓使用者必須「多花些力氣來跳過這些廣告連結」呢?

星期六, 1月 06, 2007

雜記:幾件感興趣的事

這一陣子,有幾件令自己還頗感興趣的事:
  • 很久以前,曾經 post 了一篇關於 pi 的小數計算程式。一個相當出色的數學系資訊系學弟(藍永倫,他有個網站在這兒),在前些日子的實驗室會議裡,曾大略講述那個程式背後所用到的數學原理。
  • 最近一直忙忙碌碌,被各類「比較有時間急迫性」的瑣事佔據時間,沒有能夠深入地了解(或直接向這位學弟請教)運算式推導程與實作考量。偶而想起來,還是會覺得有些可惜。
  • MPH 在幾天前的 post 中,提到「人物專訪產生器」。我也上去玩了一下,對這樣的程式頗感興趣。感興趣的原因,是覺得演算法應該不複雜(大致上,應該就是樣版套用、字串比對與取代 -- 雖然要做得更好,就不是那麼容易),但效果卻頗突出。
  • 事實上,我覺得背後隱隱還有「人的閱讀方式與文字魅力」這樣的大道理在,但可惜自己並沒有足夠能力來深究。如果有時間,自己是頗想寫一個這樣的程式來玩玩。
  • 覺得實驗室在理論與實際間的取捨饒富趣味。項老師的理論背景非常強,但卻一直希望實驗室能夠做出一些「實際有用的系統」。
  • 有趣的地方是,即使這樣的企圖已經持續了十年,即使實驗室有著優秀的資訊人才、即使實驗室在經費上一直供應無缺,但... 在陳必衷的「蝴蝶生態面面觀」之後,似乎就沒有生產出什麼像樣些的系統。(我覺得它至今也依然像是實驗性質的系統:許多蝴蝶只有圖檔與名稱,沒有更深入的介紹。)

  • 我目前是認為,許多開發效率上的問題,應該與流程有頗大的關係。而思考、感受理論與實際間的差異、並參考軟體工程的理念,一直都是我相當感興趣的主題。
只是,能不能找出時間來想想、做做這些事?自己卻實在沒有把握。然而,也正因為對「是否能夠更進一步去探究」沒有把握,所以就把先它們當作「隨手雜記」吧。

後記:我弄錯了,永倫是「資訊系」,非「數學系」的學弟。

星期三, 1月 03, 2007

胡適的「差不多先生」傳

還是覺得,語文能力(尤其是運用文字表達自己想法的能力)非常重要。

前些時日,和小妹談起自己年屆四十,才發覺自己從前讀書方法是錯誤的(或者說,有很大的缺陷)。記得貓好像曾說過,求學最基本(也最重要?)的訓練,是在於提升自己的語文和數理能力。年紀越大,越覺得自己的語文與數理能力都很差。

有趣的是,怎麼自己以前都沒有發覺?猜測起來,或許是因為自己缺乏合適的導引,又只顧著向前走,因而就疏忽、甚至習以為常了吧。

談著談著,小妹說,我對「用適當、精確的詞彙表達自己意思」的語文能力,看待得太過嚴肅了。我想,她說的是有道理,畢竟身邊多數人對詞彙的使用都只求大概,我們卻似乎仍能溝通。何必如此嚴肅地看待是否能精確使用詞彙呢?

然而,我不禁想起胡適的「差不多先生」傳。這位先生常說:「凡事只要差不多就好了。何必太精明呢?」

從前看這篇文章,並沒有什麼特別的感覺,甚至覺得作者諷喻太過:在真實世界裡,哪有這麼糊塗的人、哪有這麼多人,會認同如此誇張的「差不多」行為,甚至用「圓融」來稱讚?

不過啊,現在看的感覺又不一樣了。我覺得,胡適真的是有感而發,而他的語文寫作能力也是一級棒的。而雖然自己認為,取消最後一句「然而中國從此就成了一個懶人國了」或許更具有寓言的味道;但胡適把它寫出來,對於一般讀者卻更能有切身的棒喝作用。

星期一, 1月 01, 2007

新的一年

今天是元旦,2007 年的開始呢。

昨晚太太想出門用餐,而且希望是窗明几淨、有比較獨立空間的餐廳。麻煩的是,不管往南到台北、或是往北到基隆,停車都會是個大問題。排隊停車已經夠考驗耐心了,小傢伙們若心情不好,那氣氛就會更差了。

將近六點,還是找不到合意的所在,只好先出門再說。果然,台北處處都停滿了車,一位難求。不僅如此,稍微像樣的餐廳,生意都好得不得了,許多地方甚至要排隊一個多小時。帶著小傢伙們排隊一小時?別開玩笑了,想都不敢想呢。

開車繞來繞去,最後只好到大賣場的美食街草草吃過晚餐,然後讓小傢伙吃些冰淇淋,算是向 2006 年道別,並迎向嶄新的一年。

星期五, 12月 29, 2006

因果難辨

生活中許多事情,很難辨別哪些東西是原因、而哪些又是結果。

近日在早餐時段閱讀《柏拉圖靈丹》,覺得它有許多內容頗合自己的口味。例如,今早看到(作者在進行哲學諮商輔導的某個個案中,當事人得出的結論)「承諾並不是失去自由,反而是自由的實踐」這樣的話語後,就覺得頗有感觸。

曾聽人說起,結婚後就失去大半的個人自由;而有了小孩後,就更是處處受限,沒有自己的生活。這些話看起來是很合理的:因為在事實上,結婚、有小孩之後,一個人必須花費相當多的時間精力來維護家庭;如此一來,自己的個人時間自然減少,甚至感覺蠟燭兩頭燒,在時間分配的調控上捉襟見肘、怎樣也感覺不夠。

然而,換一個角度來看,其實也正是因為那個人希望信守婚姻與家庭的承諾,願意將時間與精力投注在婚姻與家庭中,所以他才無法分配更多的時間給自己。這樣的承諾,確實佔據了個人的時間,但這樣並不是失去自由,反而是自己「選擇把時間投注在家庭上」的自由實踐。

另一方面,這幾天也不知怎麼回事,一直沒有上網看好友們的 Blogs 文章。是因為忙碌,所以抽不出閱讀的時間;還是因為沒有抽出「這麼一點點」的時間,悠閒欣賞 Blogs 文章,所以才更加深忙碌的感覺?也或許,它們之間的交互作用其實相當複雜,甚至互為因果?

還好的是,雖然日子過得匆忙,但內心卻似乎還頗平和。不管怎麼說,能夠擁有不算短的早餐閱讀時間,就應該算是一種幸福吧。

星期一, 12月 25, 2006

小傢伙的畫作:爸爸和姑姑們

最近的時間,似乎總被各種生活瑣事所佔據。

工作上,光是處理繁瑣的 THDL 資料,就經常讓自己卻步。例如,最近學妹寄給我一份「岸裡大社」的詮釋資料 (metadata)。我寫程式處理一陣子後,才發現它們與文字檔案的對應間,存有許多完整性 (integrity) 的問題。自己的個性不喜歡將就問題隨便進行,但是又實在懶得寫程式去檢驗或更正,於是就只能先擱著,等自己心情好的時候再說。

感覺起來,小朋友的日常生活,雖然也可說是平凡瑣碎,但似乎就有趣得多。這是因為自己的童心比較重;還是因為自己的生活重心,其實已經擺在小孩的身上呢?

右邊的圖,看起來就頗具趣味性。它的題名是「爸爸和姑姑們」。

星期五, 12月 22, 2006

囫圇吞棗

用心與小朋友相處,經常可以發現自己的不足處。

小朋友很喜歡聽故事。自己沒有編故事的能力,只好在坊間挑了幾本彩色的故事書,在睡前講一兩則給她聽。有時,我並不會很喜歡某則故事,也很懷疑她是否聽得懂;但小朋友卻總是很入神地聽著,有時還會問一些問題。

昨天,當我講到「光榮」這個詞彙的時候,她就問我:「爸爸,光榮是什麼意思啊?」一時之間,我語塞了,不知道該怎樣解說。我只好跟她亂說一通,然後說,我會找時間查辭典,之後再向她說明。

剛剛上網查了一下,「光榮」的字義是「光采榮譽」或「光耀榮顯」的意思。可是,什麼是「榮譽」,到底「榮」是什麼意思?「」本身的字義有「富貴顯達」的意思,但光榮呢?「光耀、顯達」真的是合適的解釋嗎?

印象中,小傢伙問的詞彙,我幾乎有一半都回答不出來。不知道該怎樣向小孩子說明詞彙的意思,或許就暗示了,自己在語文類的求學與認知過程中,大概都是似懂非懂、含含糊糊地矇混過去,大概都是囫圇吞棗地用概括或想像去了解。

要能夠精準地掌握語彙的意義與使用方式,應該需要很深的語文功力吧。對我而言,這是相當困難、深具挑戰的一件事呢。

星期一, 12月 18, 2006

塞車

今早起得有些晚,高速公路又遇到罕見的大塞車,花了約平常三倍的時間,才到達學校。

或許是因為思緒靜不下來,也沒能好好地看些閒書。事實上,這幾個星期以來,似乎沒有閱讀什麼有益心靈的書,而幾乎都是在看技術相關的文章,想一些系統或者程式相關的東西。或許,也是因為這一陣子書看得少,覺得自己「面目可憎」,因而認為在時間的調配上「輕重不分」吧。

實驗室還是和半年前類似,空蕩蕩地。在網際網路普及後,研究生們出現在實驗室的時間,似乎比十年前少了許多(不過,許多研究生是下午或晚上才會到實驗室,因此我這樣說其實也是偏頗了些)。電腦們倒是都開著機。寒冷的天氣,襯托著嗡嗡的風扇聲,格外令人感覺孤單、甚至有些寂寞。

星期五, 12月 15, 2006

輕重不分

最近似乎花太多時間在 THDL(台灣歷史數位圖書館)的資料處理與系統開發上。

雖然說,自己原先設定的目標,就是寫一兩篇論文,並且開發 THDL 的雛形系統。雖然也知道,雛形系統會隨著時間演進,而且開發到某個地步後,就應該與現實接軌;但現實的狀況是,從上游接收到的資料一團亂,從編碼到儲存格式,什麼奇怪的狀況都有。為了讓系統能夠像個樣子,自己通常得一邊寫程式來做 integrity check,一邊修正系統的 bugs。

自己寫程式有個毛病,那就是常常覺得「只差臨門一腳就完成了」。從事後的角度來分析,只差「一腳」的情況不是沒有,但一般說來都「需要很多腳」:修完了這個部分,就發現另一個問題;解決這個問題後,又發現另一個有趣的嘗試。結果就是,整天都在寫程式,弄得身心俱疲。

看起來,自己是有些輕重不分,甚至本末倒置了。許多事情,急也急不來,甚至也不是自己該去著急的(皇帝不急,卻急死太監?)。是該讓自己多休息,並且將時間精力多投注在「應該在意」的事情上才好。

星期一, 12月 11, 2006

馬齒徒長

什麼是理想,什麼是抱負?

前些時日,MPH 在他的 Blog 中提到他對「有志青年」的一些看法與建議。不過,在後續的討論中,感覺他所說的「有志青年」似乎並不是「有理想、有抱負的時代青年」,而是比較保守的「有為青年」。

覺得自己是在「沒有什麼特定理想與抱負」的狀況下度過四十寒暑。回顧起來,「若是歲月可以倒流」,我會希望自己做些什麼呢?

很可惜,自己從來都沒有認真地思考過這個問題;因此,就算時光可以倒流,自己仍然擁有年輕的歲月與活力,但若要談理想、說抱負,得到的恐怕依舊是缺乏創意主見的庸碌之言。

有番大事業、賺很多錢?自己似乎從來都不曾強烈地有這種念頭。前些年有段時日,還真想賺多一點錢;然而,現實殘酷、時機不對、歷練不足、加上努力或許也嫌不夠,賺錢似乎就變成貓所說的「為五斗米折腰的工作」了。

那麼,難道世界上真的不存在「理想與實踐」這檔事嗎?不,當然不是。聽說過馬文仲與希望小學的故事嗎?另外,看看這一期的商業周刊,提到 2006 年諾貝爾和平獎得主尤努斯,為了讓祖國孟加拉的一般民眾脫離貧窮,而成立窮人銀行的故事。我覺得,這些就是能夠實踐的理想與抱負。

只是,不管怎麼說,遠離了輕狂的歲月,自己應該已經沒有多少的幻想了。在還沒有找回自己的理想前,就只能踏實地緩步前行,順著自性去發展,並於途中多看些他人的成長故事,多思考自己的人生價值意義。

此外,總還是希望能夠在家庭與工作間,取得令自己感覺舒適的平衡區。也祝福大家,在人生的道路上,旅途愉快且滿足。

星期六, 12月 09, 2006

小傢伙的頭足人

小朋友的繪畫,通常都頗有其趣味性。

據說小朋友畫畫,一開始的人長得都是頭大大,身體只有手腳的「頭足人」。由一個大圓圈代表頭,二條直線連接在此圓圈下面象徵雙腳。

據說,小孩子是很有創意的,而且他們具有「一般成人所欠缺」的大膽作風。小傢伙畫人物,就是這樣畫:一個圓圈畫頭,再畫一個 W 形的身體與雙腳,然後是雙眼與笑彎的嘴巴,再加上兩條雙手細線,就算是完成了。

 

上面這兩張圖,左邊的題名是「兔子」,右邊是「很多住在泡泡裡的人」。

星期三, 12月 06, 2006

資料處理的取捨

生活中時常需要選擇,選擇就免不了得做取捨。

就拿「淡新檔案」的資料處理來說吧。明知道人工處理的步驟很容易出差錯、也的確在許多地方發現資料整合的問題,但面臨的選擇是:自己究竟該投入多少時間精力,又該將它們投注在什麼地方?

貓說的是有道理:「有錯就改,怎麼可以矇上眼睛假裝看不到」、「有辦法寫程式去修改,沒辦法就花錢找人去修改」、「不然你自己一筆一筆慢慢改」。問題是,自己不想假裝看不到、有寫程式去偵測一些錯誤、卻沒有足夠的資源請專家常常修改。此外,許多地方自己雖然知道有錯誤,卻不知道正確的結果應該是什麼啊!

於是,必須先做些取捨、對現實妥協。我採用的做法是,暫時把有錯誤的部分擱在一旁,並取出正確的部分來構成出初期的系統內容。這樣的「有缺陷的系統」當然不夠實用,但把目標設定在 prototype,拿這個雛形作為系統發展中的溝通工具,卻應該有相當好處的。

事實上,當我整合全文檢索、文字內容、詮釋資料與照片圖檔後,自己真還覺得「似乎完成」一個重要的階段任務呢。(至少,自己認為這樣的系統應該比目前「淡新檔案網路資料庫」的檢索系統實用得多。)

只是,整合的過程,充滿了「資料格式轉換」與「中文編碼」的問題,也時時得留意資料的完整性 (data integrity)問題。回想起來,資料處理還真的充滿瑣碎的步驟、真的需要有放下身段,保持耐心,一步一步地前行呢。

星期六, 12月 02, 2006

欲速則不達

說的總是比做的容易,說的總是比做的多。

想在資料庫裡先行計算出統計資訊。由於關聯式資料庫在處理樹狀結構上並不在行,SQL 語法也沒能處理類似 transitivity closure 的問題,自己必須先建構許多「輔助」的表格,然後慢慢地把想要的資訊計算出來。

但是,程式寫著寫著,就會想省下幾個步驟,想要「精簡」地把結果計算出來。然而,缺乏事先周密的思考,貿然貪快的結果,就是最後計算出錯誤的資訊,必須重新來過。

按耐煩躁的心,多花些時間思考到底需要那些步驟、每個步驟的目的和結果又是什麼。如此一步一步前行,終於取得一些初步的結果。

我想,或許僅是為了節省時間,或許是因為低估了問題的複雜性與困難度,人就是會有衝動,想一次處理掉很多事情。只是,欲速則不達,貪快通常只會讓自己學到另一次失敗的經驗。

星期三, 11月 29, 2006

資料處理的完整性問題

莫非定律中,有一條是這麼說:凡是可能出錯的事,準會出錯。

在資料處理的流程中,有人力介入的地方,就可能會出錯 -- 而且通常都真的會出錯。例如說,用人力處理資料時,就很難維護資料的完整性(Data Integrity,或譯為資料的整合性)。

資料的完整性並不等同於資料的完備性(Completeness)。用 Google 可以在網路上找到許多不同的解釋,而我在此是想用這個詞彙來強調「資料物件之間的連結正確無誤」的特性。

例如說,網頁有個圖檔的連結,但是這個連結在點選後卻找不到正確的內容,這就是完整性出了問題。或者,應該以某種規則來指定檔案的名稱,但是卻發現了例外。又或者,資料庫的某特定欄位應該儲存「地理」資訊,事後卻發現它含有「年齡」的資料。

要檢驗資料物件之間,是否連結完整並正確,通常需要很高的人力成本。然而,如果系統從設計規劃時,就開始重視資料的完整性,我們就可以利用電腦工具來檢驗、防止錯誤,從而降低維護的成本。

沒有控管資料完整性,會增加後續處理的困難。例如,目前處理「淡新檔案」的詮釋資料,就有發現某個欄位填寫有誤(連結所提供的資訊不正確)。碰到這樣的狀況,自己是該假裝沒看見,放任它繼續出錯,還是自行將它更正?如果自己只知道它出錯,卻沒有能力更正,那又該怎麼辦呢?若要有效率地利用流程更正錯誤,或許該「彙整可疑的狀況」批次處理。只是,自己真有興趣、真有時間精力去做這件事情嗎?

資料間缺乏完整性,最終也會破壞系統所能提供的服務品質。

星期一, 11月 27, 2006

大量資料的呈現難題

自己一直都很關心「大量資料該如何呈現」的問題。

以文件檢索來說,就是將這些資料以「文件」作為單位,得到檢索結果後,該如何呈現文件、以及文件內容的問題。而「大量資料的呈現問題」在此就可以說是「大量文件的呈現問題」。

傳統的人機介面(Human-Computer Interface,HCI)對此似乎沒有多少著墨。不過,如何緩解超量資訊所造成的過載,似乎也是因為近幾年來 Web content 大量湧現,才顯得更為迫切。或許在幾年前,大量資料的呈現,也根本算不上是什麼重要的問題呢。

但我覺得這個問題並沒有乍看之下那麼容易。它牽涉到如何用較低的成本,來展示資料並提供互動,更關係到人類注意力有限的先天事實。

一個常見的處理方式,是將資訊分層別類地組織起來,然後提供一個瀏覽環境來讓使用者由上而下地找出想找的文件。例如,我們可以將 Windows 下的每個檔案視為一份文件,而「檔案總管」就是一個這樣的瀏覽環境。

接下來,就是提供「全文檢索」或類似的工具,讓使用者輸入關鍵字詞、指定檔案大小或最後存取的時間,然後系統將符合的文件「列表」出來。

那麼,還有沒有其他「或許更好」的方式?

合併分類瀏覽與查詢,提供「多維度」的檢索方式,曾經是我想探究的一個主題。不過,理論上說起來容易,在實作上,就經常碰到實際的問題:如何有效率地歸類或分群,如何快速地統計、過濾、彙整、計算出所需的資訊?此外,螢幕的解析度就這麼大,該怎麼把計算出的結果,有系統、有組織、易理解、易操作地呈現出來呢?

星期五, 11月 24, 2006

再談淡新檔案的文件檢索

約莫三個星期前,我提到了一個關於「淡新檔案」的檢索問題

試著重述一下手頭有的東西。首先,台大圖書館有具歷史意義與價值的「淡新檔案」資料。希望利用電腦來處理這些資訊,前提是這些資訊必須數位化。於是,經過繁複的數位化處理後,我們將那些資料以「件」的方式來儲存(通常一個「件」就是一份公文,儲存為一個檔案)。

現在問題來了:歷史學者並非獨立地看待每個「件」。解讀歷史,必須鑑古識今,參考時代的脈絡與環境,才能得出有價值的解析。淡新檔案中,其實是以「案」來作為「有價值資訊」的單位,每個「案」是由多個「件」所組成,而時間則可能貫穿數十年之久。

套用流行的資訊檢索方式,是可以將「件」視為檢索的文件單位。使用者輸入查詢後,檢索結果是符合查詢條件的所有「件」的列表。

是可以用後處理(Post-Query Processing)的方式,將檢索結果分類(例如,利用阿尼說的「文件夾」概念,或者我從前論文所建議的 multi-dimensional spotlights),然後將「同個案之下的相關件」彙整在一起。但是,既然「案」才是有意義的解讀單位,而且每一個「件」其實都沒有多少(通常只有幾百)個字;那麼把「案」視為文件單位,是不是更為自然、而且便利呢?

於是,寫了一些程式,粗略地實作了將「案」視為文件單位的想法。除了因為淡新檔案裡只有一千多個「案」,彰顯不出系統的威力(從大量文件中,快速地搜尋出符合條件子集的能力)外,初步的感覺還不錯。

只是,如果真的把「案」視為文件單位,那麼如何組織與呈現一個「案」下的所有「件」,甚至整合每個「件」的「詮釋資料」(metadata),就帶出更多有待探討與解決的問題了。或許,這也是一個值得關注、思考的研究主題呢。

星期三, 11月 22, 2006

從兒童繪畫,到美術欣賞

帶小朋友到「蘇荷」學畫畫。

最初是太太的朋友介紹,我只是想讓小傢伙在尚未接受正規教育之前,有段愉快的學畫經驗。然而,上過幾次課後,我發覺除了小朋友樂在其中(我們是上晚上的課程,小傢伙一早醒來就會很期待去學畫),自己其實也頗認同蘇荷的一些教育理念與實踐方式。

或許,是因為在自己的經驗裡,總覺得台灣的教育方式太過僵化死板。教給學生的內容相當充實豐富,但重點卻似乎是在強調快速地讓學生「學」到經過組織的資訊與技巧,而不是給學生充裕的時間去感覺、摸索、嘗試、乃至領悟。此外,對於學生或小孩,我們似乎也很少給予發自內心的讚賞與與鼓勵。

有意思的是,小朋友在教室裡玩耍、學著用各式各樣的材料和色彩發揮想像,蘇荷教室也為家長們安排了藝術欣賞的課程。在一系列的幻燈片講解中,我似乎漸漸明白繪畫美學的一些原理,也似乎漸漸能夠欣賞一些看不懂得現代藝術畫。

欣賞的課程中,有時我會對人類如何表達生的喜悅而感到驚喜與震撼。有些時候,我似乎也能感受到,藉著各種嘗試與創新,藝術家試圖超越人類極限的掙扎與努力。

我很喜歡這樣的課程。

星期六, 11月 18, 2006

告狀的時間

伴小朋友成長,每個階段都有不同的樂趣。

雖然我放在小傢伙的心思並不算太多,自己還是經常陶醉在陪伴小孩的甜蜜時光裡。我應該沒有什麼「炫耀」的用意(或許貓真人會說,我潛意識裡是這麼想 :p);主要還是想趁著記憶猶新,把一些有趣、純真的日常瑣事記錄下來。

 告狀的時間 
前幾個月,小傢伙還不會自己上廁所尿尿,需要有大人抱著她到洗手間小解。我在家裡的時候,若她尿急,就會看到她以很著急的語氣說:「尿尿、尿尿、我要尿尿!」

然後,我就趕緊放下手邊的事情,衝過去帶她去小解。之後,我幫她穿好褲子,她會很高興地跑到太太那兒,說:「告狀的時間到了!」

原來,我幫她穿衣服褲子,經常穿得不甚整齊,需要她媽媽再幫她整理一次。看著她那麼興奮地跑去「告狀」,那麼天真的模樣,有時真會有一種難以形容的感動。

最近她漸漸學會自己去上廁所、自己穿褲子了。我想,這樣的有趣時光,或許很快地就會遠離,而被另一種成長喜悅所取代。

 我冷得發抖了啦~ 
前兩天的一個傍晚,我在家裡,小傢伙在不遠處的外婆家。

接到一通電話,是小傢伙撥來的。在電話裡,她說:「爸爸你快點拿外套來給我」。我問怎麼回事,她說:「你快點來啦,我冷得發抖了啦~」

聽到她這樣說,我趕忙拿了一件外套,小跑步到岳母家,卻發現她已經穿了好幾件衣服,不應該會覺得冷。我說,妳穿這麼多,還會冷得發抖?小傢伙說:「我是跟你開玩笑的啦。」

原來,她就是想要快點看見爸爸,所以就編織了這樣的一個理由。告訴她不可以騙人(雖然現今的政治處處可見自欺欺人的行為),告誡她「放羊的小孩」故事,卻也不禁為四歲小娃娃的聰明伶俐感到讚嘆。

星期二, 11月 14, 2006

推卻一個工作機會

經過一番內心交戰,傍晚打電話推卻一個「天上掉下來的工作機會」。

起因是這樣的。大約半年前,項老師說某家公司急缺技術人員的頭頭,要我到那家公司談談。我和對方約好見面,談得也算愉快,但回家後就一直沒有收到對方的通知。項老師後來問起,我說,對方可能並不是真的很急吧。

誰知道,上週四接到一通行動電話,約我週五過去吃頓午餐。席間,他們表示公司經過一番整頓,希望邀請我擔任產品研發主管。遊說的人是總經理特助,業務出身。緊迫盯人的言談,讓我不知該如何應對,就只好回答說,看看該公司能夠提供怎樣的薪資福利吧。

由於時間上,也差不多該找下一份工作了,因此我本來是有些心動的。然而,今天夜半醒來,竟然再也睡不著覺,腦袋裡盡是關於是否該到該公司工作的考量。最後,我決定推掉這份工作,原因是:
  • 太太憑直覺,認為我接下那份工作會很辛苦、吃力不討好。
  • 他們提供的薪資福利與配套,其實也不突出。
  • 他們希望我馬上就可以去上班,如此倉促讓我覺得事有蹊蹺(更何況,半年前的經驗,讓我覺得不怎麼舒服)。
  • 該公司將產品研發部門定位為利潤中心,但企畫及業務都是由其他部門負責 -- 這相當於產品的上下游都由其他部門負責,如此將很難訂定合適的績效評估方式。
  • 若去那兒任職,短期內的狀況,恐怕就是在收拾一個爛攤子。該公司似乎是採用傳統的瀑布式流程開發,而 top managers 卻覺得這樣的開發模式非常好(但... 許多模組都只安排一個星期的 coding 時間耶。更何況,該部門的人員,看起來程式設計與寫作的能力都不夠呢。那麼,程式出 bugs 時怎麼辦?)。
決定推辭這個工作機會之後,心情突然輕鬆許多,有種如釋重負的感覺。

星期一, 11月 13, 2006

珍惜得之不易的悠閒

差不多一個月前,就很希望能夠痛快地悠閒一下

說起來似乎不困難:就我目前的 post doctor 工作而言,自己能調控的時間相當有彈性,項老師(老闆)也沒有施加額外的壓力。不過那篇 post 寫後沒幾天,我就發覺要想痛快地睡午覺,其實也沒有想像中那麼容易。

怎麼會這樣呢?首先,需要的時間遠比想像來得多(要想舒服地睡個一小時,大概需要三個小時的空檔)。要想舒服地躺在牀上睡午覺,我最好趕在下午兩點半之前就回到家裡,簡單盥洗之後入睡才舒服。然而,若為了避開人潮,通常午餐後就已經一點半,回實驗室後處理一下雜務,通常就已經兩點多了。

接下來,就是個人的的生活習性不易調整。即使告訴自己,不要老是惦念著系統有那些地方該加強,不要一直在那邊斟酌各種模型的優缺點;但一旦有多餘的時間,自己就是會忍不住開始把玩起來。結果就是,雖然對系統與程式又多認識了一些,卻錯失了好好睡覺的機會。

最後,有了時間,通常自己還會想做些其他的事情:到書店晃晃、幫小朋友買買文具或讀物、到賣場添購家用品,或是待在家裡整理一下房間、把書籍分類整理一番。

結果,一個月下來,我沒有一天能夠睡到那麼痛快的午覺。於是自己也了解到:即使是時間有彈性,要真能享受悠閒時光,依舊是說來容易做來難。

然而,或許也正是因為如此,昨天早上有機會睡個回籠覺,醒來後的感覺竟也如此舒暢;下午找時間帶小朋友到大安森林公園,遊玩之間也更加感覺幸福。

星期五, 11月 10, 2006

「瞎子摸象」的故事

發覺自己的表達能力不佳之後,有時心裡會浮現一些小時候就聽過的成語。

「瞎子摸象」就是其中的一個。它的故事內容是什麼呢?
從前印度有六個瞎子。有一天,他們坐在路旁休息,正好有人牽著一隻象走過來。他們聽說是隻象,就都站起來,齊聲嚷著請求牽象的人停住,讓他們摸摸這隻象,好知道是什麼樣子。

第一個瞎子摸到象的身子,他說:「喔!象像一堵牆。」第二個瞎子摸到象的牙,他嚷著說:「你錯了!象又圓又尖的,像一支槍。」第三個瞎子摸到象的鼻子,他叫著說:「你們都錯了!象簡直像一條蛇。」第四個瞎子抱住了象腿,他說:「啊!象明明像一棵樹。」第五個瞎子個子高,剛巧摸到象的耳朵,他哼了一聲,說:「你們說的都不對!象的的確確像一把扇子。」第六個瞎子恰好摸到象的尾巴,他笑了一聲,喊著說;「你們這些笨瓜!象其實像是一根繩子。」

象牽走以後,他們仍舊在那兒爭論,每個人都覺得自己的意見是最正確的。

(文轉載自國語日報社出版「三百字故事」)

細細品味這個故事,總會讓我感覺若有所悟(主要是「若有」的感覺,其實離「悟」還差得遠啦)。瞎子們應該都是聰明人(因此能夠根據經驗推理、以具象的實物來類比,也有與他人辯論的能力),但從「明眼人」(這裡就是指看故事的讀者吧?)的角度來觀看,他們都有「以偏蓋全」的毛病啊。

據說,這個故事出自於《大般涅槃經.卷32》。我覺得這個故事另外還有個有趣的地方:「象牽走以後,他們仍舊在那兒爭論」。想出這個故事的人,好像隱隱還想告訴聽者許多人生智慧,只可惜我自己慧根與歷練都不夠,還無法感悟其中的奧妙。

人生中的許多事,都沒有標準答案、都可以有多種思考方向。每個人都可以有自己的觀點和角度,但很可能大家都沒有「對」的答案。

星期一, 11月 06, 2006

重新認識人生

即使可能只是一場夢,仍覺得自己似乎正在重新認識人生。

說「可能是場夢」,是懷疑它或許只是「自我催眠」的結果。不過,就好似某人說的,人生之所以有趣,部分也在於當你認為洞澈它時,一個全新的體驗,卻又讓你捉摸不透。因而,能夠放下從前的自我,學習從更開闊的角度觀看世界,總是有趣的人生成長歷程。

嗯,回想一下,是從什麼時候,開始感受到自己的心境,起了微妙的變化呢?

其實,工作了數年後,每隔一陣子,心裡就會有股強烈的「自我失落感」。一年多前,前任公司急速縮編,加上自己已年近四十,更讓這些問題浮上枱面:為什麼要工作得如此疲憊?我究竟想要什麼、想做些什麼?

於是,離職後,找了個壓力比較小的 post doctor 工作,希望能夠整理出曾經吸引我的一些有趣主題、希望能夠寫些文章。不過,這個工作做了一陣子,就發現有兩件「對自己算有趣、也頗有意義」的事情可做:開發 THDL prototype,以及完成一篇多年前起意的論文。只是,自己分身乏術、處理事情的能力也不怎麼樣,因此只好「頗有遺憾」地暫且擱下寫文章的想法。

轉眼間,這份 post doctor 工作也經歷一年了。這段期間閱讀了一些書籍,深深地感覺到自己這十年(或者,這二十年吧)來,除了追逐網路科技的新技術、除了工作經驗有所增加外,似乎沒有什麼長進。

那麼,這一年我得到了什麼呢?自己其實也說不清楚。大致上,應該都是些老生常談,都是些生活與實踐相關的感觸。或許比較強烈的一些字眼,是「藝術是個動詞」、「愛,是個動詞」、乃至「生活,也是個動詞」。動詞,指的就是必須在生活中去實踐,而不僅是表面的感覺、不僅是存於腦袋中的思考。

或許,人生本就是一場修行的歷程。誠摯地希望自己,能夠放開心胸,「活在當下」地觀看時空的深邃奧妙、感受生命的活潑躍動,進而深深地被感動、並逐漸地將感悟融入日常生活來實踐。

星期四, 11月 02, 2006

一個淡新檔案檢索問題

最近又回頭檢視古文書檢索的一些問題。

檢索的基本單位是「文件」。也就是說,檢索系統會將一份文件視為一個獨立的單位,而我們可將檢索的結果視為「多份文件的列表」。

那麼,到底什麼是「一份文件」呢?在 Web 上,通常是將一個網頁視為一份獨立的文件(來加以做索引處理)。例如,若把一本書的每一頁內容,都獨立地賦予一個 URL 來存取;那麼這本書如果有 100 頁,檢索系統就會將其視為 100 篇獨立的「小文件」。

但是這樣一來,檢索出來的前幾份文件,就有可能通通都是這本書的各個頁面。這時,如果使用者想要的,其實是另外一本書,他就很可能會覺得這樣的檢索結果「重覆太多」,認為檢索的效果不佳。

一種解決的方式,是把「具有某些共同索引特徵」(例如,同個網站的某個相同目錄)的頁面,整合起來視為一個群聚 (cluster)。檢索結果若含有多份屬於一個群聚的文件,系統可以只呈現出其中的一份。(我想,許多使用中的應用系統,都應該處理過類似的問題吧。)

最近處理古文書的檢索,也遇到 granularity 的問題。一篇很長的文章,或者一本厚厚的書,應該被切分到怎樣的程度,才算是「一份文件」?文章太長或太短,似乎都不好 -- 那麼,是不是有怎樣的準則,來判定文件合適的大小與段落?

一個例子是關於「淡新檔案」的檢索。淡新檔案的內容,是清代地方衙門裡的經年累積所成的公文卷宗,總共有1143「案」,19281「件」。因此,至少在理論上,合適的最小文件單位應該是「件」,而由多件來組成一個「案」。

問題是,歷史學者檢視淡新檔案的內容,需要看的通常不是「件」,而是一整個「案」-- 因為這樣子才有機會完整地了解分析事件的來龍去脈。想想看,當我們檢索到某本書的某一頁內容後,是不是也會想看到這本書的整體結構呢?於是,在檢索上,以「案」來做為文件單位,會不會反而比較合適呢?

不過,在基礎的資料的建構上,我覺得以「件」為單位應該是好事。或許,日後會有人嘗試運用自動的方法,尋找「件」與「件」之間的關連。例如說,以現在的「案」與「件」之間的階層關係作為標準答案,來探討把相關的「件」組合成「案」的演算法,那或許也會是一項有趣的研究呢。

星期一, 10月 30, 2006

皺眉頭妹妹

昨晚小小傢伙喝了幾口奶,就停下來不吃了。


她看著媽媽,嘴裡發出伊伊呀呀的聲音,眉頭卻皺著,好似想吐露內心的不滿(就像她姊姊常說的:「都沒有人陪我玩」;小小傢伙可能是想說:「都沒有人陪我說話」吧?)。

我想起多年前,項藍(項老師的女兒)曾稱呼我「皺眉頭叔叔」,意思大概是說,看見我的多半場合,我都皺著眉頭,看起來一副愁眉苦臉的樣子吧。現在小小傢伙會皺眉,我有時笑著稱呼她「皺眉頭妹妹」。

小小傢伙似乎天生就會皺眉 -- 她姊姊可從來不會這樣子呢。不知道「皺眉」是不是真的會遺傳;而我會被稱呼為「皺眉頭叔叔」,會不會也是因為基因遺傳的緣故啊!

星期四, 10月 26, 2006

清晨的甜蜜負擔

清晨六點,發現小傢伙緊緊抓著我的手臂。

怎麼了呢?「爸爸不要去上班,我要爸爸在家陪我。」

「不行,跟爸爸說 bye bye。」一旁的媽媽說。小傢伙不依,很快地就流出了眼淚。

坦白說,很難招架女兒的這種柔情攻勢,很想多抱抱她,答應她的請求。但雖然今天自己是可以選擇陪她一個早上,卻有些擔心她會逐漸養成「想要,不然就哭」的習慣,所以我沒有答應(其實,我心裡是有些動心,自己也想再多睡一陣子呢)。

在媽媽扮演黑臉的狀況下,最後小傢伙只得噙著眼淚說,「爸爸你要打電話給我,你要想我喔~」

再過數年,小傢伙漸漸長大後,應該就不會這麼黏人了罷。然而,說不定我那時候,反而會懷念這種甜蜜的負擔呢。假使能夠,我真的希望能好好地珍惜保存這份令人心動的美好回憶。

星期一, 10月 23, 2006

三談資料模型的架構圖

最近發現先前的「資料模型架構圖」,在釐清觀念的溝通上,確實頗有幫助。

或許先前許多溝通上的困難,扣除掉(其實是最重要的)情感因素後,大致可說是:每個人關心的子問題與重點各有不同,理解的深度與焦距也不一樣,但卻使用類似的詞彙或語言。大家都使用自己所認知的詞彙,卻沒有注意到討論很可能是「雞同鴨講」,以致結果類似於「一個中國、各自表述」。

討論後,隱隱覺得先前的架構圖中,好像還漏了些什麼,使用的詞彙也不怎麼好(哎,對目前使用的詞彙,其實也仍然不滿意啦)。修正了一下,新的架構圖長得像這樣:


有了資料模型的架構圖,對於每個人的提問與質疑,可以藉著定位(將問題大致歸屬於某個區塊)來釐清重點。例如,當討論的重心是在「抽象模型」時,其實我們不必太在意資料建構或實作時,一定會碰到的成本或效率問題。而當討論的重心是在「資料建構模型」或「實作模型」時,就必須考慮現實面的可行性。

此外,也可以將項老師所關心的「模型、語言、推理機制」,用這張架構圖來說明它們的位置。例如:
  • 「模型」應該可以對應到這裡的「問題抽象模型」,但最後應該可以有簡潔漂亮的數學或邏輯表達方式。

  • 「語言」與「推理機制」,在思考或討論時,都運作在抽象模型上。但是,因為我們希望最後實作出「實際可用」的東西,因此可以將「語言」視為「使用者介面模型」的一種,將「推理機制」視為「實作模型」中必備的功能區塊。

  • 每個模型中,都還可能有不同層次的模型。例如,即使是「抽象模型」,也依然可以區分為「理想中的抽象模型」(例如,假設每個歷史事件的日期都應該是明確的)與「現實環境下的抽象模型」(實際上,取得的時間描述通常有其模糊性)。

註:為了自己參考方便,整理一些相關的先前 posts:
資料模型的溝通再談資料模型官職表:行政組織與任職人員官職表的模型問題來自史料的想像

星期四, 10月 19, 2006

讓自己悠閒幾天

昨天交出論文的初稿後,我打算讓自己悠閒幾天。

今天提早離開實驗室,到街上逛了逛。買了些閒書,也買了些幼教光碟。然後,拎著一個大袋子到咖啡廳喝咖啡、看書聽音樂。最後,則是開車回家,舒服地睡了一覺。

就像幾天前的 post,我發覺自己若能悠閒地在家睡個午覺,醒後就會很有飽足感,就會有點幸福的感覺。

真想讓自己多擁有幾個這樣悠閒的日子!要達到這個目的,應該不會太困難吧?

星期三, 10月 18, 2006

得意忘形

今天有些得意忘形,以致於又流露出積習難改的一些毛病。

雖然今天達成了幾件頗值得高興的事:寫好論文初稿、大致確認項老師的「歷史資訊學初步模型」與自己所想的差不多、也多少讓項老師同意「資料模型的架構圖」有助於溝通與焦點定位;但興奮過度,甚至得意忘形,就值得警惕了。

感謝學弟妹的提醒。

論文難寫

寫論文,對我來說還真是一件困難事。

經過兩個多月的努力與掙扎,終於將論文的初稿完成,在今天拿給項老師審閱。看看自己最後決定的論文標題,與多年前投稿失敗的那一篇,相似度高到只差了幾個用字有了改變(而自己甚至還在斟酌是否先前的用字才更恰當)。那麼,為什麼還會需要這麼長的時間?

表面上的差異,或許是在於多舉了幾個例子,重組了論述的條理,並且修改英文的語句。但重寫論文期間,苦思該如何表達自己的想法與意見,卻也真的讓自己更能釐清想說的重點。

當然啦,自己也還是知道,許多地方論述似乎仍然不是那麼自然有力。此外,在英文語句的表達、以及去除冗餘的說理與造句上,這篇論文也應該還有「很多」的問題。我甚至預計,之後還會至少需要一次「大改」、以及數次的「小改」呢。

而說「論文難寫」,是在於自己雖然已經知道要述說的內容,也很努力地去寫,但平均每天生產的數量,竟然連半頁都不到。只是,每個人認為困難的事,真的都不一樣。我覺得寫論文難,有人覺得生小孩難,也有人覺得養小孩更難。

事後回顧,寫論文之所以如此困難,或許是因為自己年輕時並沒有接受足夠的訓練、沒有足夠好的英文表達能力、同時也並沒能釐清許多觀念之間的條理關係。但不管怎樣,寫完初稿總也算達到一個階段性目標,總也是令人感到高興的一件事。

星期日, 10月 15, 2006

笨蛋,就是溝通的問題!

前兩天項老師找我和學妹討論「歷史資訊學」(hisinformatics) 中的模型、語言、以及推理機制。

學妹跟老師說,她和我對老師所說的「語言」,聽到的重點與理解上都有差異。由於「語言」必須具有足夠的表達能力,她似乎傾向於往 meta-language 的角度思考。然而,我卻覺得,若是把重點擺在 meta-language,那麼做出來的結果,很可能是 too general to be useful,這應該不是老師所想要的。

於是,老師試著把他的想法,說得更清楚些。他一邊解釋、一邊思考,最後很高興地說,「啊,這樣我們就有歷史資訊學了。」學妹對老師的興奮感到不解,但其實項老師這幾年忙著行政工作,很難有時間好好地思考「歷史資訊學」該建構於怎樣的理論模型上。能夠看見理論模型的曙光,我的回答又是「非常同意」,老師當然很高興。

老師說,我從前都沒有說過「非常同意」這樣的話。我事後想了想,我的理解其實和從前幾乎沒有什麼不同。只是,在從前,看到的是不一樣的地方;但現在,重視的卻是意見相同之處。因此,以前會急著強調自己與老師想法不同之處(甚至想表現出,自己想法應該比較好),但現在卻對相同的想法給予掌聲。至於想法不同的地方怎麼辦?以後「自然」會有機會表達啊。

所以,這其實應該就是溝通上的問題。就像前一篇 post 所說的,不管自己的想法有多獨特,在溝通時也不應讓別人覺得他是被強迫接受的。而從這樣的角度觀看,多給他人肯定,其實也是對自己有信心的表現呢。

星期五, 10月 13, 2006

一本談溝通的小書

最近對於薄薄的小書特別感興趣。

不知道是不是為了擴充版面賺稿費,現在的書籍大半都是厚厚的一大本。如果是經典著作,那也就算了;但是我總覺得很多書籍的內容,其實並沒有豐富到需要那麼多頁面來說明與闡釋。

前些時日在書店看到一本講溝通的小書:「五座燈塔教我的事」。全書只有 109 頁,字體字距都不小,中間還有一些不錯的插圖。心想這一陣子自己似乎頗關心溝通問題,看看專業的書籍或許會有幫助吧。

書中嘗試以第一人稱的故事,敘述他從五座燈塔裡思考體悟到的五項溝通關鍵:
  1. 傳遞的訊息要強而有力
  2. 善用譬喻讓人印象深刻
  3. 使用聽者聽得懂得語言
  4. 常注意聽者的各種反應
  5. 以邀請來代替強迫信服
這些要領,乍看下還真都像老生常談呢。這說明了我對於這類條理敘述的方式,感知其實已經麻木了。或許,重點是在於切身去實踐,並從實踐中體悟到溝通的要領或真理吧。

書中有一句話,倒是頗令人回味:生活是與心靈共生,而不是與腦袋共存。似乎在很久的從前,就有某些人曾經提醒過這句話。只可惜,當時的自己似乎太重視道理的論辯,因而忽略生活是有溫暖與情感的。

註: 隔天後,我覺得這本書的主旨,應該是「演講、演說」的五項關鍵,而非「溝通」的五項關鍵(不知道是不是自己的感覺有偏差,還是翻譯的人弄錯了)。只是,閱讀時自己還是一直被譯文帶著走,也分不清「溝通」、「演說」之間,應該是有相當差異的。

星期一, 10月 09, 2006

睡午覺

相信許多人都度過一個愉快的五天假期吧。

從某種角度來說,放不放假對我而言並沒有什麼差異。由於項老師並不會要求我每天都出席,做 post doctor 工作其實跟唸博士班差不了太多。寫論文這回事,其實多半都是自己內心的要求,放不放假影響應該不會太大。

但這兩天我是真有覺得享受,原因是「能夠在家裡,舒舒服服地睡午覺」。

小朋友長大,漸漸懂事了。雖然她自己不想睡午覺,卻也會說,「爸爸睡覺,我在旁邊看書、玩玩具」。我看著她可愛的臉龐,心裡有著幾分感動。

曾幾何時,能夠舒適慵懶地睡午覺、睡到自然醒,感覺竟然也如此幸福美妙。

星期四, 10月 05, 2006

可愛的貓造型圖片

昨天實驗室會議,無意間瀏覽到五年前存下來的一些圖檔。

貓咪造型的電話?看了就覺得很可愛。

貓咪伸懶腰造型的烤麵包機,很有一副慵懶的味道。右邊這個是貓咪造型的郵筒嗎?被小狗一口咬住尾巴,應該很痛吧,眼睛瞪大得像銅鈴。

在疲倦忙碌的日子裡,撥出些時間看看這些可愛逗趣的圖片,有時還真有調劑心情的功效呢。

星期二, 10月 03, 2006

小天使

小傢伙已經四歲,講話也充滿了童趣。

昨天晚餐時,她問說,「爸爸你一百歲就要到天上當小天使了,對不對?」

然後,她又說,「你到天上當小天使,那我就看不到你了,嗚嗚嗚...」

我說,爸爸就算到天上當小天使,她也可以在夢裡跟爸爸見面說話啊。

她想了想,問說,「爸爸,天上的電話號碼是幾號啊?」

又遇編碼問題

原本以為對文字編碼問題已經相當了解,沒想到最近又碰上一個狀況。

一直以為,Unicode 比 Big5 收錄更多的中文字元,因此從 Unicode 轉碼到 Big5,可能有部分字集無法轉換;但從 Big 轉碼到 Unicode,則不應該會碰到轉碼失敗的狀況。

但上週試圖從 Big5 編碼的網頁擷取內容時,PHP 的 iconv() 函式卻回報轉碼失敗的警告訊息。比較轉碼前後的檔案,發現原來是「恒春」的「恒」轉碼失敗了。

啊,怎麼會這樣?這下子怎麼辦呢?

想不出什麼好方法,只好先用 Windows VBScripting 將儲存下來的檔案,從 Big5 編碼轉成 Unicode,然後直接用 PHP 來讀取 Unicode 檔。比較耐人尋思的是,或許是因為資料處理的流程發生改變,即使是如此簡單的修改,也讓自己著實花了好一番工夫才完成。

事後,我試了一下,Java 程式也可以正確地轉換「恒」的文字編碼。那麼,為什麼 PHP 就不行呢?查閱相關文件,PHP 的 iconv() 好像是採用 GNU 的 libiconv 來執行編碼轉換的。下載 libiconv 來試試,它真的沒有辦法成功轉換「恒」這個字!

唉,看來連 GNU 的軟體,在中文處理上的可信賴度都沒有想像來的高呢。真是只能用嘆氣來形容自己的感覺了。

星期六, 9月 30, 2006

回鍋週年雜感

很快地,回鍋到實驗室擔任博士後研究,已經滿一年了。

這一年中,經歷了不少心情的起伏,也漸漸地了解感受,每個人都有每個人精彩的人生要奮鬥。起初,是由於公司未來走向不明,趁著縮編的機會求去;接下來,是思考自己是怎樣特色的一個人,究竟想要做些什麼事;然後,在看了許多書、在想找回自我的途中,因緣際會地漸漸懂得欣賞人生。

此外,第二個寶寶出生後,似乎更可以感受到,自己並不很想將時間都放在工作上。然而,有許多工作,其實是需要投注相當的時間精力,才能夠獲致比較良好的進展,因此經常還是感覺力不從心。

接下來,寫好論文之後,應該就得找尋下一份、「希望是自己喜歡」的工作吧。只是,年紀已經接近四十,很多產業都只想找年輕的小伙子呢。看來,競爭力不夠,是很難在產業界生存的。

這應該算是幸福的一年。真的十分感謝,這一年來太太與家人的支持。

星期四, 9月 28, 2006

再談資料模型

早上突然又對「資料模型」有了些「或許更加清晰」的感覺。

或許是因為昨天的實驗室會議後,我覺得將資料模型做這些分類,真的對溝通有幫助。雖然學弟仍然被老師數說了一頓(因為他在一些沒有想清楚的地方硬拗),但將資料模型分成幾類,因為可以縮小溝通的範疇,在我看來確實有助於「寫投影片內容者」與「看投影片思考者」之間的討論。

於是,對原先的資料模型做了些修改。新的圖長得像這樣:


「數學世界」提供了抽象模型的描述基礎,而「物理世界的問題」則對抽象模型該有哪些特性提供來源。一個好的抽象模型,應該可以解決一群性質類似的問題(稍微差的模型,通用性就比較弱)。

例如,物理世界所關心的問題,用抽象模型代表後,其模型中具有某些特性的元素,其間可能有代數系統的關係(例如,彼此間有 transitivity 的性質),或可能形成一個樹狀的階層結構。

而這些性質與結構如何被實作,在討論抽象層的通用性時,通常不是那麼重要。但對抽象模型有了清楚的認知後,對於「實作模型」的設計、「建構模型」該提供那些不可或缺的材料、以及「應用模型」的限制,都能夠提供具有建設性的觀點。

星期二, 9月 26, 2006

太過抽象

早上在麥當勞遇到 Ankh,聊了些最近的情形。

聊什麼呢?他說,我昨天的 post,講得太抽象啦。看到我那樣的句子,他會直接聯想到波柏(Karl Popper)與孔恩(Thomas Kuhn)關於科學哲學的論辯。然後,他說,我寫這樣的 post,沒有人會回應的 --- 因為沒有人知道該怎樣回應。

我說,我沒有那種偉大的企圖啦。但... 他說的也有相當部分是實情。大概是思考或者溝通上的「壞習慣」,我總是想要追溯一些「比較形而上」的東西。想探究這些起源或背後原因,應該不是件壞事,但壞就壞在自己其實沒有能力去「清楚地說明這些東西是什麼」。如此一來,就只是片面地企盼聽眾能夠「了解、領會」,溝通當然不容易成功了。

不過,後來談論到前些日子的 post「資料模型的溝通」,他倒是相當有興趣去釐清我說的「資料的抽象模型」與「數學模型」、「物件導向模型」之間的差異。我說,我其實也只是有一些直覺或感覺;我或許可以整理出一些自己認為的差異點,但聽眾卻不見得能夠認同我所說的差異。

Ankh 說,這或許是因為「缺乏適當語言」的緣故。討論「數學模型」時,可以使用數學的語言;討論「物件導向模型」時,可以用實作上所通用的語言。但是「資料的抽象模型」呢?大家都好像只有模模糊糊的感覺,卻找不到合適的例子或類比呢。

不得不佩服 Ankh 的博學、觀察、與評論。他就是能夠看到、說出一些我看不到、說不出的東西。或許,這也正是他特有的天賦才能吧。

星期一, 9月 25, 2006

搬弄論文的英文造句

必須承認,自己很不會寫論文;或者說,很不會用論文形式來表達自己的想法。

這兩個月來,項老師已經多次詢問,我論文寫的進度如何。我猜項老師也不想嘮叨地問,他的詢問其實是表達他的關心;但我的進度實在太遲緩,弄得連自己都覺得很不舒服。

從內容來看,論文想陳述的主題與結果,三分之二都是多年前做博士研究時,就已經獲得的。上個月去西雅圖參加研討會,發表的會議論文其實大致也就是這些內容。那麼,到底是什麼問題,讓我一直寫不出完整的論文?

一個原因是,自己不但英文不好,論述的組織與造句能力也都不佳。但更深層的原因,或許是因為自己其實並沒有「真的」弄清楚自己想要表達些什麼。

例如說,經過了幾天的醞釀,我重新組織了一些論述的順序,並想用一句「過去一些合理的假設,今日並不見得合理」來連結兩個段落。起初,我寫出來的英文句子像這樣:

Reasonable assumptions made in the past may not be so reasonable today.

幾天後,想想覺得不對勁,「合理的假設」怎麼會隨時間變得不合理呢?應該是「過去看似合理的假設,今日不見得合理」吧?於是,把句子改成:

Assumptions plausible in the past may not be so reasonable today.

今天早上,想想還是覺得不對勁。這個句子的內容太具有一般性了,套在那兒都說得通;加上這個句子,對於了解論文內容其實並沒有什麼幫助(也就是說,它是一句「廢話」)。於是,又修改了一下:

These assumptions are plausible in simplified cases, but they may not be so reasonable in practice...

翻譯成中文是:「這些假設,在簡化的狀況下看似合理,但實際上卻可能並非如此。」但它真的就是我想說的嗎?連自己都不敢百分百地確定啊。(想到日後重整文章的段落時,很可能還會刪去這些「醞釀苦思許久」的文句,就更覺得悲情。)

對我來說,寫論文真的是件耗費時間精力的事。明明內容與結果都有了,想不到「把它們清楚地說出來、寫出來」竟也是如此困難。有時,甚至會覺得自己像是在搬弄英文造句的小丑呢。

但不管怎樣,總是認為自己應該「盡力去寫好一篇論文」。雖然就目前的狀況來看,終究還是寫不出怎樣的好論文;但能夠感受到寫論文的困難,對於日後欣賞好的論文,並敬佩能夠寫出好論文的人,應該都有相當幫助吧。

星期四, 9月 21, 2006

只看見自己想看的

曾經多次聽到「人只看得見自己想看的」。

這句話本身就很耐人尋味。從理論的角度來看,這句話「當然」是對的。自己不想看見的,雖然可以出現在眼簾;但因為不想看見,人卻可以「有意無意地」忽略它的存在。

但將這句話引入生活,卻經常可以令自己有煥然一新的不同感受。半年前也曾片段地提到,紐約時報的一篇報導裡,兩個人之間的對話:「You see what you want to see」與「You don't see what you don't want to see」。人與人之間溝通的困難,或許有一大部分就是在於,「只看得見自己想看的、看不見自己不想看的」。

最近從書櫃裡找出一本書「名牌得很厲害」。不曉得是否因為自己最近就是想看這類東西,雖然連前三章都還沒看完,我對作者的一些話語,卻頗能產生聯想與共鳴:
  • 如果是新開發的品牌,就必須構思出確切的定位;如果是現有品牌,則必須了解原有的定位,並且抓出未來的走向。

  • 「為新品牌憑空創造一句響亮的廣告詞」,或者「重新塑造既有品牌的形象」,那一件事比較困難?真要爭論的話,給你一千年也辯不完 ...
先有雞還是先有蛋?即使用一千年的時間去爭辯,這個問題可能也依然無解。而若將「品牌」換成「產品」或「模型」,以上的兩句話似乎也都說得通呢。這是不是表示,這類的情事即使有不同的表象,核心深處也依然存有某些類似、重要的共通性呢?

星期一, 9月 18, 2006

資料模型的溝通

必須承認,自己在溝通方面的表現實在很差勁。

早在幾個月前,我就曾談過了一些自己對於「官職表資料模型」的看法(可參考 官職表:行政組織與任職人員官職表的模型問題)。我也曾嘗試與老師、實驗室成員溝通自己的想法,但很可惜地都不怎麼成功。

隨著時間的流逝,慢慢地實驗室終於有人必須面對資料模型的問題。八月底的實驗室會議,學弟被老師罵到臭頭,在我看來也是因為溝通不良的緣故。

溝通本來就不是一件容易的事。但是為什麼連學術殿堂上的專業溝通,都顯得如此吃力呢?我漸漸地認為,一個頗重要的原因,是在於「溝通者所關注的焦點不同,卻使用類似的語彙」。

什麼意思呢?且讓我嘗試用以下的圖來解釋(這裡套用的詞彙,是自己左思右想後,覺得比較合適的。雖然我覺得,應該早就存在類似的圖表來解說 data modeling 的問題,但手頭實在也找不到這樣的資訊,就先誇大地說是自己的發現吧)。


項老師在理論方面(Abstract Model 的部分)非常拿手。在主導 THDL(台灣歷史數位圖書館)計畫多年後,他也明瞭資料建構的困難(人工建置、修訂 metadata 的成本極高)。但麻煩出在,即使有了抽象模型,也建構了適當的基礎資料;但一碰上實作,還是會產生很多系統開發、效能、以及後續維護改進的問題。

學弟挨罵的原因,是因為資料庫儲存地名資訊的每一列,id 都是用 a.b.c.d 這樣的編碼方式,來表示地名間的階層關係。老師認為,將階層關係直接寫在資料庫裡,將會失去資料建構的彈性:如果以後發現在節點 b 與 c 之間,還有一個節點 x,那麼不是整個資料表都需要重新建置嗎?

換句話說,項老師以為,資料表是由 Excel 之類人工建立的表單(contruction model)直接對應產生。因此,「將階層資訊編碼在 id 欄位」,就表示在 Excel 的表單裡,每一列都需要人工建置這樣的階層編碼。

但其實,階層編碼不必然都是由人工所產生的。如果有良好的建構模型,我們可以寫程式(上圖齒輪的部分),在彙整建構模型所提供的資訊時,自動產生這樣的編碼。

此外,實作上用關聯式資料庫來處理階層資訊,有時反而必須在效率上付出代價。因此若階層資訊是靜態的,深度也並不大,直接把階層資訊編碼在欄位裡,或許反而是合宜的處理方式呢。

於是,結果是溝通時大家關心不同的地方,但都用同樣的「模型」一詞(沒有區分各種模型),以致類似「雞同鴨講」了。老師關心資料建構的問題,但學弟只展示系統的運作方式 (application model),以及秀出資料庫的資料表 (implementation model),卻並沒有好好地說明建構的模型(原始資料該用什麼格式儲存有什麼欄位、該如何將這些資訊彙整入資料庫)!

上星期五我花了許多時間,利用上面的圖表,向兩位學弟說明「官職表」與「地名沿革」的資料模型問題。最後,他們表示同意我的想法與觀點。最近對於自己的溝通能力已經沮喪到不行,能夠得到一些正面的回應,還真很令人感到高興呢。

星期五, 9月 15, 2006

Internal Server Error?

怪怪,怎麼都連不上 MPH、貓、與 LYR 的 Blog 網頁?

得到的訊息都是 HTTP 500 (Internal Server Error)。是因為自己太疲倦,連 Computer + Networks 都想欺負,還是 Blogger beta 真的有太多 bugs?

更怪的是,自己的 Blogger site 竟然還可以連線,還可以寫這篇 post...

星期四, 9月 14, 2006

即將跨入另一個階段

小寶寶即將滿月。今天太太就要離開月子中心,而生活也將跨入另一個階段了。

佩服施明德的勇氣與毅力,也佩服 Ankh 仍然有勇氣「想做出讓人感動的東西」。自己呢?除了變得比較樂觀、除了努力照顧小朋友之外,有沒有勇氣探尋其他有價值、有意義的人生目標?

說的還是比做的多,說易行難。現實面是,論文進度依然遲緩。雖然自己也明白,回鍋做 post doctor 已經快滿一年,應該想想下一份工作是什麼;但我最近似乎越來越關心實驗室的進度,與學弟妹們討論問題時,也經常越講越激動。

是怎麼回事呢?

星期二, 9月 12, 2006

在困難中找尋機會

日子過得快,從西雅圖回來也將近一個月了。

第二個寶寶的出生,讓自己的日常生活顯得十分忙碌。也因親身體驗,心裡著實佩服那些能夠自己帶寶寶、照顧好家庭、又能在工作上發揮才能的人。

貓說,選擇當個好爸爸的同時,也就放棄了許多東西;他也多次建議,嘗試雇個保母來帶小朋友。這樣可以讓我擁有更多自由的時間,而工作上也就比較能夠有進展。然而,我總覺得,現在應該還不到需要找保母的時候。

能夠自己帶寶寶是一種幸福。時下許多父母因為工作忙碌而無法親自帶小孩,其實是很可惜的。看著大寶寶在一個月內,不論是講話或者玩耍,都成長了許多,心裡真的有股難言的感動。幸福,或許是在持續地對他人付出關愛後,才能成長、才能獲得的。

今天在轉寄來的信件裡,看到一句黑幼龍講的話:「不成熟的人在機會中找困難,成熟的人在困難中找機會」。過去會覺得這類的話是在搬弄文采,是老生常談;但現在卻對此頗有感觸。能夠放開心胸,用不同的角度來看待問題,就真的能有不一樣的想法與行動。

即使認為自己有所成長、認為自己變得比較樂觀,現實卻不會因不同觀點而改變。家家都依然有本難唸的經,而生活中也依然處處充滿了困難與挑戰。這一個月的工作進度遲緩,應該就是接下來該面對的問題與挑戰。

星期五, 9月 08, 2006

忙碌但幾乎沒有產能

最近或許因為睡眠不太夠,比較容易感到不耐煩。

照顧寶寶,本來就很難空出一段比較長的時間。通常,是在她睡覺後、起床前,才能夠做些自己的事情。而有些時候,會找不到合適的親人來帶,只好自己在家裡陪她玩耍。

工作上,應該也算是遇到些許困難:論文「寫不太出來」。不是想不出內容,內容主體很早就已經知道,甚至寫得差不多了。主要是不知道該如何組織好文章段落,適度地「添加說明、表達想法、引徵論證」,並用英文寫出來。這是不是因為「腹笥甚窘」的緣故呢?

此外,Blogger 的 beta 升級版又弄得很爛,經常搞得自己火氣大。登入時,需要鍵入好幾次密碼,這也就算了。回應別人時會遇到困難(上回已經吐槽一次了,但今早還是遇到一樣的問題)、「應該是成功回應」後訊息竟然還會不見,就更令人感到不舒服了。

我想,貓說得對:整合真的不是一件簡單的事。軟體系統的整合不容易,日常生活的整合也是如此。

星期一, 9月 04, 2006

令人煩躁的 Blogger 改版

最近真的被 Blogger 的「升級版」弄煩了。

不曉得是不是只有我才遇到這樣的怪狀況。現在登入 Blogger,或者要回應別人的文章,手續都非常麻煩(要登入好幾次,有時網頁會被轉來導去,最後還是無法回應);雖然也有嘗試要把舊的 Profile 轉移到新版 (beta),但試了幾次都只收到「轉移失敗」的訊息,煩都煩死了。

也不知道 Google 是怎麼想的。我總是覺得,要有好的產品與服務,除了需要好的開發(軟體)人才,也應該有關心使用者感受的人才。如果因為軟體沒有寫好,無法讓使用者順利轉移到新版上,也應讓使用者能夠繼續使用舊版軟體(服務)才是。前幾天經過冗長的登入手續,我還能回應別人的 posts,但怎麼今天一直失敗呢?

浪費了許多時間後,實在很想講些氣話:只用一個「beta」的訊息,就想將所有問題推給使用者,這樣似乎是太小看使用者、也太沒有大企業風範了。

:登入 Blogger 過程中,可以看到這樣的訊息:
Unfortunately, you cannot post a comment on a non-beta blog or claim a mobile blog using your Google Account. These features are coming soon.
這樣的訊息,是不是就是針對我所遇到的狀況?

星期五, 9月 01, 2006

巧事不巧

我出席實驗室的頻率應該算頗高的了,但似乎經常碰到老朋友想找我,卻找不到的情況。

之前 MPH 回系所辦事,順道來找我,就似乎有過幾次這樣的經驗。今天 LYR 遠從台中來,想找我聚一聚,打手機和我聯絡,卻發現我在照顧寶寶,沒能到實驗室。

我原本是打算請家人代為照顧小傢伙的,但不巧大家都有要事在身,最後只好自己在家帶小朋友。此外,據說素瑜今天也有到實驗室找我。這麼多巧事發生在同一天,還真是不巧呢。

後記:原本我的標題很短:「不巧」。但 Ankh 反應,他多次把「不巧」看成「不朽」了。想想這兩個字型的確太像,還是加上幾個字,改為「巧事不巧」好了。