一個學期又接近尾聲,明天就是兩個小朋友這學期的休業式了。
原本一個星期前就打算稍稍回顧一下這個學期的生活記憶,但上週報告自己如何從《宋會要》全文擷取人名的技術後,知道其實還有許多可以改進的地方。回家後越想心越癢,就連著數日晚上修改程式、並實驗修改後是否真有改進的效果。忙著忙著就忘記應該寫寫雜記了。
嗯... 大概是有些年紀了,怎麼腦子裡卻想不起這學期有些什麼比較特別的回憶?只好翻出每日的小記事本,查看一下除了每晚固定的帶小朋友讀經之外,自己究竟把時間耗在哪兒。
工作上,應該就是忙著處理《宋會要》的系統吧。忙著把從哈佛大學拿到的 Excel 檔轉到 THDL-based 資料庫,從 CBDB (哈佛和北京大學合作建置的「中國歷代人物傳記資料庫」)把宋代的人名、地名與官名鑲進全文的內容,並且構思與實驗 text mining 技術來從《宋會要》全文抓取 CBDB 所沒有列出的可能人名。
看起來沒有什麼,但過程中經常為了改善 mining 的結果,必須反覆地實驗數回,並且重新建構資料庫來把採礦的結果放進去,因此就需要耗費頗多時間了。上上個週四中午,向《宋會要》讀書會的一些研究者展示如何使用系統,他們的反應比我預期的還要熱烈。或許他們真的認為這個系統能夠對研究有不少幫助呢。
喔,對了,這個可能頗值得一記。開學前幾個月比較有閒,練唱了幾次歌:一次是和實驗室學弟們去錢櫃,一次是和媽媽、大姊到星聚點唱,更特別的是自己竟然兩度到地下一樓的視聽室練唱了兩個小時的台語歌,想來也算是頗有意思。
1 則留言:
讚啊!我應該比你久 (得多) 沒唱歌了吧(哭)
張貼留言