2006年12月29日 星期五

組字示範程式創世紀歷程

1/17/2007更新
我整理一下組字教學程式的施作歷程如下:

第一天 一片虛無

第二天 九宮星系

第三天 日光東來

第三點五天 弦月初造

第四天 柔月再生

第四點二天 日月冉昇

第五天 日月生明

第六天 明萌萬物

第六點五天 超萌體

第六點七天 立女立男的趣味?

第六點八天 艱苦的登頂

第六點九天 OK土?

第七天 里程碑:招財進寶

第七點一天

招orz進寶

累到orz



組字教學程式的第六點七天:小老公

我已經開始作全自動組字了,今天先驗證簡單的組字。

中國歷史上有發展出代表小老婆 的字:


















對沒錯,就是

那小老公呢?

電視節目,全民大悶鍋曾經有過一個單元:哈佛沒有教的字,志在革除所有男女不平等的現狀。他們創了一個很有趣的字,我的程式可以把它搞出來了:


















真是可憐被壓扁的小老公@_@

組字教學程式的第六點五天:超萌!

之前的版本有個bug,就是在遞迴組字時,超過一層以後的遞迴,部件的尺寸會縮的很奇怪/_
再跟yap師父請益後,才知道我之前只有對末級部件取MBF(Minimun Bound Frame 最小外包框),卻漏了對其他部件取。

今天凌晨終於修正成功,在加上自己搞了個超圓體的字形(不是超萌體啦XD),給大家看看,這也表示離第七天的終極目標越來越近了。

2006年12月26日 星期二

他國的漢文文學

今天到中壢逛書局。

在國學書籍的架子發現很有趣的東西,是日本漢文小說叢集,顧名思義,是日本人本土寫的漢文文學(還很文言文哩),這是日本古代的漢文小說創作總共有六大冊,一個假名(頂多拿來注音)也沒有,如果不是看到其中有日本人名、地名,又是兮又是焉的,很難看的出這是日本人寫的。

其實這也應証了古代的常態,漢字並非只服務現在狹義的華人,是中、日、韓、越等國同享的文化成果,甚至可透過文章互相理解,所謂書同文是也。但是近代各國政治往民族國家的方向發展,有民族特色的文字興起,日本國內這種不是國外輸入也不算國學,很尷尬的本土(日本)漢文學就漸漸很難繼續發展了。

2006年12月22日 星期五

漫畫拉麵王:從產品到整個經營

這一陣子我很喜歡看一部漫畫,叫作拉麵王,日文原名是拉麵發見傳(跟八犬傳諧音)。目前出到第17集,這一部漫畫乍看之下是與尋常料理漫畫無異,其實這部深度很構,不只講拉麵,還講到後面整個經營體系,幾乎可以說是企管漫畫。

這部漫畫的主人翁白天是一間企業上班,但其實是個超級拉麵迷,晚上瞞著公司在外擺攤賣拉麵自我修練,作拉麵技術好到厲害到常常應邀幫忙改善店家的拉麵。

今天我看到了第十七集的一話,這一話非常的有意思,是有一家拉麵店新老闆娘來求救,這個新老闆娘是個新手,公公、丈夫相繼去世,原來經營的拉麵店就得轉由這個老闆娘來接了。沒想到這店經營不善,老闆娘可以說是撿到燙手山芋。

主角接受下委託以後,私下突擊檢查,去調查經營不好的原因,原來是原來的老店員(一些歐八喪、阿機喪)請了一堆(8人),看報紙的看報紙、抬槓的抬槓、還有跟客人聊的哩,很散漫,麵又很難吃。

後來主角偕同老闆娘前去示範拉麵的煮法,可是沒想到最後那些老員工聲淚俱下,說老店長在天之靈看到不過大學剛畢業剛進社會的老闆娘這樣亂搞變革,一定會失望。也就是老員工欺主年幼,爬到人家頭上去了。但是「工程師」出身的主角還在想,一定可以循循善誘的方式?沒想到對方竟然接著摔了他煮的麵,而完全破裂。

後來該老闆娘改請主角的一個對手,一間有名拉麵聯鎖店的老闆,來協助整頓,沒想到整頓的很成功。在一次高明的手腕下,這些尸位素餐只為自己好,最好還不要有很多客人!這些老員工就是拿著公公的神主牌吃定了小老闆娘,反正不想好好為店面打拼的就是了。沒想到栽在這個新顧問設計的好的一個局:「五十周年慶」。在特意製造暴增的客人裡,那些老員工的無能徹底曝露,後來又找可欺的老闆娘哭訴,不過這次老闆娘沒那好欺負了,所以這些人只好識相的辭職了。

我覺得這個故事很有意思,對照之前benq收購的西門子手機部門到後來整頓不成功,兩面不是人的新聞,我益發的覺得有些事情,科技可以解決,有些更廣層面的,還是要回歸人文的角度。一個企業的經營像主角那樣以為只靠非常非常獨特、厲害的產品公司就可以營運,真的是太天真了,那個敵對的顧問有著的厚黑手腕是很值得學習的。

穿越時空隧道:某神祕IT雜誌編輯部奇遇記

昨天代表某一個團體,前往一間IT雜誌社洽談事情,發生很有趣過程。

首先是到這門禁好像有些森嚴的大樓一樓時,打了兩三通手機問聯絡的編輯有沒有在聯絡不到,又不確定他的位置在哪一樓,費了幾分鐘,只好 拜託總機轉接該機構,知道幾樓以後,就上去。

到了以後,在那樓的總機問,然後總機call那位聯絡的編輯還有這次要見面的總編發現的分機一直沒人接(唉我兩天前一直打也是這樣說^^!!),都沒有人@_@,可是確定約好的時間就是下午4點阿(唉雖有提早到,但卻因為之前的那些遲到了一點)。又蘆了一下,對方還懷疑我們是不是沒約@_@,我就建議說那他們編輯部的其他編輯也許在座位上,他應該知道(我隨手拿起櫃台上的雜誌指人名給他),果然這招有效,終於進去了。

首先見到瓜子編輯,是個像是1980年代風格的,某種事務所的職員的味道,隨手必拿個有錄音功能的隨身聽,是用錄音帶的喔,好神奇!她把我領到總邊的房間,我就在那邊等。等了快10分鐘吧,哇哇,覺得有一種奇怪的感覺(難怪前幾天我打電話來都沒人接orz,他們櫃台也找沒人^^!!)等了好久,神祕的總編終於出現了。他問了我個人資料的一些問題,我想這還算基本禮貌應該還好也就回答,沒想到後來他問好深喔,還想知道我是在作什麼的、待過哪裡。到這我嚇了一跳,他以為我來應徵的嗎?^^!!!!!!!!!!!!!!!!!,我趕忙說今天我是代表團體來談事情,我想應該先談,然後他就打斷我,說之後一定會談的(喔,那就好,他沒搞錯,而且之前他的確透過瓜子編輯表示過想多了解我),然後好吧,略題一點,提到我在作漢字研究,然後他眼睛就大了起來,又追問了一小段,就跑出去了@_@

又過了20多分鐘,他又跑進來,這次說他們要去某個地方,要我跟他走@_@what??還叫我不要問那麼多,去了就知道@_@,然後要瓜子準備我的履歷(@_@之前是面試??),說坐車時會討論我們團體的事情(好吧),然後披上偵探式風衣領我跟瓜子出去(不會吧?這個編輯社怎麼好像偵探社?火曜日劇場??),然後就在計程車上面談了,結果其實只談了1分鐘多@_@(唉回來罪惡感好重)

到了他們的下一個地點,原來是一個建設公司(還好不是什麼金錢豹、辣妹招待所、三井^^!!),來到一個會議室,跟大概是他的友人吧開始meeting(也把我拉進去,不知什麼主意??),這位總編像對方說到這個有趣的漢字組字,所以希望我可以demo一下,有任何介紹漢字組字的觀念的機會我是很樂意的,在等我開機時,他們就聊了最近在推的一支機器恐龍的事,還說要請國外公司弄一隻超級大的應該很炫之類的@_@。然後就是我來demo了,那我主要是demo前易符版本的組字程式(因為我重作的版本還沒完全好),當然他們看的一愣一愣,因為我組了orz、我的印章、還有哈佛沒教的字(有看過大悶鍋的應該知道是什麼)。

隨後他們就開始談這個可能很有商機,很棒之類的,不過我一直是強調不算新技術,就是因為一些人文的問題,所以到現在好一些人不樂見這種東西的成熟。過度狹隘的商業會是有害的。後來又問到我做玩這個誰僱用我,我說我作良心的opensource,他們還一副像外星人不敢置信的樣子(咦他們不是在推webX.0,怎麼會不知道開源扮演的力量呢???)後來又問我怎麼活之類的,又說可不可能有合作...,不過我也實話說了,我將接受XXX的贊助來執行。不過這個計劃將會有十數個延伸計劃,有很多仍然是可以有人來認領的,講到這裡就送我出去了(ok終於結束了)。

之後瓜子請我喝咖啡,然後哇,那個隨身聽放桌上,拿出一筆記本開始調查我的資料,(真的好像日劇裏面的偵探)原來準備履歷是這個意思(我還在想要我寫履歷?喔好累喔),不用自己寫也好啦,就給他問囉。問了就是真名、哪裡畢業等等很多很多,然後突然瓜子冒出一個奇怪的問題:「你的血統是什麼?」what?我的血統??這個問題好奇特喔。不曉得對方是認真的還是開玩笑的,我就說我是天可汗的後代,我是鮮卑人的後裔。祖先是偉大的胡人^++++^,我是說的很誇張啦,可是這也真的是事實阿,我的阿嬤的確是隴西堂李姓,祖先可以上追到李唐皇室,(嗚嗚遙想先祖唐末辛苦巡運河逃難南下最後在閩南落腳/_\,逃不出去的宗親就不好意思了)。對方好像不滿足,好像懷疑我是不是混血兒@@,ㄟ,好啦我承認了,我媽娘家那邊可能有荷蘭的血統,外祖公等人的確是紅頭髮、高鼻,應該是300年前荷蘭人留下的種吧?然後我身上同時又還有漢人與平埔族明顯特徵,ok我不曉得這樣是不是所謂的混血兒?還好吧?台灣應該70%以上都有各種混血,我父母不是外國人,但大家如果努力尋根,應該都可以找到自己是混血兒的線索吧?台灣不過就是到處逃命人的最終落腳處。後來「偵訊」結束,瓜子就送我去捷運站了。

今天的面試、調查、偵訊、創投demo,這個IT偵探社的機遇不知道該說是詭異還是有趣
~~@_@~~

2006年12月14日 星期四

組字教學程式的第六天:萌了!

有了明亮的光,萬物就起來了。


這是驗證recursive組字,藉此,漢字在電腦裏面的資料表示,可以跟過去一字一圖的舊狀說881,取代的是極有效率的recursive表示:複雜的字有數個簡單的字構成,簡單的字又是用更簡單的基本部件構成。

當然更重要的是,能否依六書原則,依照我們的需要,自己造字呢?

2006年12月13日 星期三

組字教學程式的第五天

有了日光、有了月光,就誕生了光明(說日月神教也是啦^^!!),這個明並非傳統的一個字碼對應一張圖(點陣圖或是向量圖)的作法,而是應用構字理論,明為更基本的字母,日跟月來合成,漢字以組字法描畫,同時大幅降低過去對記憶體的巨大耗用、又承載自動化的概念組織,這是電腦漢字處理的一大突破。

今天終於組出字來了(PM10:23),好興奮!以前嚮往已久,覺得很遙遠的的傳奇科技,沒想到有這麼個機緣能親手寫出來,真的是很興奮。


今天是爱德華·蒙克誕辰

google許久不見的特色banner又出現囉,去google看看!

1:1比例的裝甲騎兵機器人!

這是個以鋼鐵為主(不是保利龍喔)作創作的一個日本藝術工作室作的,monkey_farm
工作室作的,展覽時,有2000多人排隊要看呢,科幻動畫的機器人能做出實體來,實在是太fantasic了,不知道可不可以操作?@_@

2006年12月12日 星期二

在IT雜誌上寫作

從這個月開始,我開始為Intelligent Times(電腦與資訊)雜誌撰稿。以後我會主持一定期專欄,以及數個新技術帶來的文化觀察。

本期十二月號,我首打了關於eyeOS、writely的兩篇文章,這裡歡迎大家的指教。

此外,我的「你所不知道的鄭成功賣場」已加入paypal的支援,香港與其他台灣以外的朋友,可以安心消費了。^^

2006年12月6日 星期三

佛教界的虛偽,「師兄」!

上個月初,經過一位朋友的介紹,有一個大X佛教出版社的編輯來信求救,因為他們的網頁主機被駭客攻陷了,又原有的網管離職,希望我幫他們重新架好站,且維護之,雖然這個要求很怪(MIS外包??)。

一開始該李姓編輯,師兄長、師兄短的稱呼我,我是會Linux架站沒錯,但畢竟人外有人,我也自認不是頂尖的,既然是朋友的朋友,又是佛教界的人,後來就答應幫忙看看。在一次實地訪談了解後,價錢也講了,建議他們採購什麼都說了。

但過了將近一個月,幾乎沒什麼聯絡(除了對方好奇我的書,買了一本:)),昨日赫然發現,對方網站已經恢復。

我於是詢問李編。我是很介意一個禮節的問題,我並不是認為對方必然要讓我接案,對方當然有選擇的自由,搞不好同時「面試」很多人。這都是可以想得到的,但是,不善告拒絕對方的訊息,這是很失禮的事。大家一定都有面試過的經驗,面試不通過,幾天後會收到告知函。這是很冷酷,但企業體也是好心提醒你,不用在浪費時間在本公司了,趕快去下一個需要你的公司面試,這是主僱之間一個基本的禮節。

在我的詢問下,對方坦承找了另一位中國佛教什麼會的師兄來接,還一改之前師兄長,師兄短,改口「我們那時候只是請你來評估而已」、「自己學藝不精」、「我們沒有義務告知你」等等,看來有別的師兄,我就不是師兄了,臉轉的真快。這的確沒有什麼應不應該,給誰接當然是他們的決定。但我只在意一個基本禮貌。

這件事,對方誠懇請我去,又這樣一聲不響的把我丟掉,這讓我對佛教界師兄師兄的這種前恭後倨的工夫有了有了極大的印象。吹捧在先,失禮在後,比所謂的「好人主義」還不如。奉勸大家,以後跟這種佛言佛語面貌的人談,千萬不要被他們那種虛偽的誠心誠意欺騙了。

附錄:事後連上他們網站看,系統換成centOS、增加防火牆擋幾個port、apache升級到2.0,但我還發現一些目錄還可以自由的瀏覽的哩,看來還是張開雙臂歡迎劊客的阿,唉我幹嘛講那麼多,真是「好人」作久變爛好人。

2006年12月5日 星期二

國際賣場順延

香港以及其他海外的朋友抱歉,我問銀行paypal處理的問題有些狀況,應該明天我才能弄好/_真抱歉,請再等一下

2006年12月4日 星期一

讓人失望的中推會研討會

後記,這篇文章我發的實在太刻薄,太罪過造口業了,直接消去又似乎不夠負責任,故在此發啟事但保留原文,中推會的諸位前輩,真是抱歉XO 1/7/2007
中央研究院的朋友推薦我去參加今天
中推會(這是國內電腦中文標準的推動組織)在文化大學辦的研討會。

這個會說是研討會其實不太名符其實,實際上應該算「演講會」。今天總共分三場次,分別由中研院計算中心的高級分析師曾士熊講的CNS14649標準、中推會魏林梅的中文資訊標準之應用、以及行政院主計電子中心研訓組潘城武的中文資訊標準對產業的助益,當然我特別留意的,是魏林梅場次提到的漢字基本部件。

今天前兩個都講的還不錯,但是第3個
潘先生講的部份實在是..!@!^%#@$.!,jack,這實在是太神奇了!
  • (摘錄)有效利用各種符號(例如語言、文字、聲音、動作、圖像或藝術等)和工具....
原來動作也可以是一種符號(用身體擺成英文字母?)藝術當然更可以是符號囉(梵古的名畫向日葵原來是一種高深的符號阿)

應用議題(一)裡的對照表也要標準化!詞也得設立標準,真是前所未見的高見!只要流行夠廣,夠多人用,就要收起來。太好了,以後X你娘、機車咧就醬子等等廣為流傳的詞,都可以標準化了,免於有人連這種基本詞語都會用錯。

應用議題(二)的圖裡,在一堆中文輸入元件、中文顯示元件裏面,突冒出一個不同層次的load balanced技術@_@,load banalced是大型web網站必用的一種分流技術,蠻奇特的特別提出來(雖然該圖表有用到web server,但該圖表在講的核心是中文處理,哎呀,原來是不秀一下這種基本技術名詞,誰知道這張圖專不專業呢?高招!),這就好像某個生物課,一個怪老師講到世界人種有哪些呢?有白種人、黑種人、黃種人、台灣人,這就是愛台灣嘛。

曾先生提到web2.0時,說所謂的web2.0是以物件識別管理為核心,這是今天聽到最空前的論述!還是web2.0的發起提倡者Tim O'Reilly都想不到的。沒想到web2.0除共創、分享、無中心以外,還有物件識別管理這深層的含意,我對曾先生的景仰真是如黃河之水滔滔不絕。

會後有一個短短的發問時間,很多與會者詢問了缺字的問題,大致上是造字空間用完了,個別造的字如何交換的老問題,然後我提了問題,就是問魏女士既然提到CNS 11643-2的基本漢字部件既然有了,那是否有定好交換碼可以用?她的答案竟然是沒有!這,太誇張了,這個漢字基礎部件本來就是中研院缺字整理小組研究好釜底抽薪解決缺字問題的方案阿,怎麼會沒作進CNS國家標準了?難道大家的稅金給缺字小組那些文字專家作了那麼多年,到頭來還是得讓各個苦主繼續用傳統一字一碼的方式苦苦去求unicode組織、作業系統廠商擠更多造字區....看外國人臉色年年擠新字進去。

其實只要cns標準定好漢字基本字母(既部件)的碼,加上作業系統實做好IDS rendering(以二維方式組合描繪中文字母於一方塊內),過去數十年痛苦的缺字問題,甚至潛在的「新字」問題,可以用IDS良好的解決(不再需要訂新的字碼,IDS是不需要新字碼的技術)。缺字問題超嚴重的康熙大字典,民間都已有廠商用unicode IDS快做完了,魏女士居然說中研院 IDS不夠完整,所以編部件碼進CNS標準的會議上無法通過(其實中研院缺字描述法叫IDC,unicode的是IDS,技術上有些不一樣)。這真的很怪,各方廠商、政府機關的苦主們就是一直很頭痛這個缺字的問題,中推會卻不清楚解決缺字問題的良方-動態組字的最新狀況,顯然不知民間疾苦

今天的分數,我給三位評分,潘城武先生創見一流、妙語如珠,我給他99.999分。魏林梅女士演講一流但對演講的內容似乎狀況外(CNS 11643-2基本部件有提到供資訊交換之用,那部件沒有交換碼要怎麼個交換法?還是簡報唬人?),我給他60分,勉強及格。曾士熊先生講的太無聊,只能給他不及格。

2006年12月2日 星期六

2006年12月1日 星期五

左腦與右腦的掙扎

今天上台北,下午談技術、晚上跟一位音樂界的前輩討論音樂的東西,在捷運站還巧妙遇到5年不見的大學同學。讓我回想到很多東西,使我陷入很久沒有的感性與理性的衝突。今天晚上先不開店了,明天我心思沈澱了以後再說。

如果有朋友在殷殷期盼的話,我放個東西以為賠罪好了。

以前玩音樂時,搞過電琵琶,蠻奇怪,也算不上好吧,不過應該蠻有趣的,大家聽看看吧。

count