氣象預測

颱風鮎魚跟香港擦身而過,切合一句中國人的比喻『雷聲大雨點小』。的而且確,鮎魚初期來勢洶洶,挾著南中國海二十年來最猛的超級颱風之名而來,最終卻沒下過一場大雨便走了。一些無知巿民指責天文台『亂點』,打亂了他們的周末計劃云云。我本身不是一位追風者,但卻明白氣象預測的難處,所謂天有不測之風雲,要預測天氣,比預測女人的心理更困難。以龍捲風為例,美國氣象局只能在龍捲風形成二十分鐘前才能夠偵測到,氣象學家一直希望可以更早向市民提供預警,但奈何以現今的科學技術仍未能辦到。

要了解氣象預測,先要了解整個氣象系統,什麼高壓脊、高壓區、低壓區、冷鋒、暖鋒、海洋溫度、海洋氣流等等。颱風預測的氣象圖,需要覆蓋從內陸至南中國海至西太平洋,當中所包含的數據既多亦繁複,然而數據愈多及愈仔細,所得出來的預測亦愈準確。今天的氣象預測均依賴超級電腦,把所有氣象資料輸入電腦運算,再分析出颱風的位置及要走的方向。現代的颱風路線預測全賴模擬器技術,要預測精確的路線,需要依據今天的數據去模擬明天的氣象形勢,再依據『估計的』明天氣象形勢去再模擬後天的氣象形勢,如此類推。

自從 1997 年深藍電腦打敗國際象棋冠軍卡斯巴羅夫後,人工智慧在某程度上來說,已經可以取代人類智慧,甚至超越人類,尤其對於處理龐大的數據分析及預測,但仍然要面對一個難題:時間。在棋賽上,卡斯巴羅夫可以等深藍運算後再下棋,過程中,橫盤上的形勢不會改動,但現實世界卻是瞬息萬變的,地球總不能停轉二十分鐘來等電腦去運算。所以說,氣象預測一定要快,而且資料必須是最新及最準碓,甚至可能要每分每秒去更新氣象資料,氣象電腦總不能花二十分鐘去運算龍捲風的預測,否則龍捲風形成後才發預警便沒意思了。

412

感性狂想曲

最新一期﹝6月號﹞的《科學人》雜誌中,報導了一則小新聞,謂精神科學研究員論證了人為什麼會對紅色特別敏感。他們認為這是因為人的血是紅色,而腦神經對紅色特別敏感,就是為了容易察覺同伴在『氣色』上的狀況。所謂氣色,其實就是血液的含氧量,含氧量愈高,面色會愈見紅潤。久而久之,一切頭暈身㷫、喜怒哀樂等等,身體都會借氣色來向同伴發出訊號 ,令我們在女朋友發脾氣之前,可以洞悉先機,趨吉避凶去也。

唸過電腦科人工智慧學的朋友都知道,理性和感性之間有一條不可超越的界線。換句話說,不論電腦的功能多大、速度多快,始終不能夠拿人類的感性去當數字般處理。舉例說,『If I am happy, then I laugh』。什麼是『快樂』?我們該如何把『快樂』作數學上的定義呢?除此之外,還有悲哀、痛苦、妒忌、害羞、憤怒、懊惱、激動、怨恨、甜、酸、苦、辣、鹹、澀、香、臭、霉、美、醜等等。單單一個美與醜的學問,哲學家便可以談上一千幾百年。

顏色,其實也是一樣感性的東西。舉例說,紅跟藍的分別在哪裡?你忽然間百辭莫辯,然後指著天說這是藍色,指著蘋果說那是紅色。多得人工智慧學的 pattern matching 技術的發明,電腦終於可以分辨出紅和藍的分別,那是三元色(255,0,0) 及 (0,0,255)的分別。但同一種紅,印在光面紙及普通紙上的分別,電腦是否又分得出呢?更深入的問題:電腦究竟喜歡光面紙上的紅,還是普通紙上的紅呢?

隨著科技的不斷進步,理性與感性的分歧正在逐步收窄。難保一天,學者最終會在兩者之間搭起一道橋樑。到時候,距離《未來戰士》的世界不遠矣。《科學人》這篇報導,令我思考科學家是否已經築起了理性與感性之間的橋樑?因為科學家已經把紅── 這種顏色抽絲剝繭地研究過澈底,然後得出結論說:人類對紅色的感情,其實早已根植在我們的基因裡頭。科學家能夠進一步把人類對橙、黃、綠、青、藍、紫的感情基因密碼解開,只不過是時間上的問題。到了這一天,我只需要把基本喜好的資料輸入超級電腦:

A) 我喜歡藍色

B) 她喜歡黃色

運算:

1) 紅色 * 性格 A = 藍色 → 紅色 / 藍色 = 性格A

2) 紅色 * 性格 B = 黃色 → 紅色 / 黃色 = 性格B

3) 性格 A % 性格 B > 1

電腦或許會告訴我說:『她不會喜歡你的,死心吧。』

352

Program 鑊氣

我在研究院裡主修的是人工智慧學和資訊科學,擁有兩台互聯網伺服器,驟聽起來好像很科學的樣子,但其實食古不化,我對生活電腦化還有一點抗拒。原因我唸的人工智慧學,並不是去解說電腦如何萬能,而是去認識電腦的無能。電腦並不是神仙,但人卻常常對它們過份期望。舉例說,最近一次本地中學科學比賽中,有一件作品是裝在交通燈裡的發訊機,當盲人路過十字路口時,手杖會接收發訊機的訊號,然後提示盲人是紅燈還是綠燈。紅燈停、綠燈行,這是個公認的道理,但要是交通燈亮了藍燈怎樣辦?藍燈?你認為這是個笑話嗎?要是交通燈一定不會出錯的話,那麼新聞從業員都可以執包袱了。電腦跟人腦的分別在於這個所謂『智慧』是真還是假,電腦只會執行,不會思考,非黑即白,非紅即綠,藍燈的情況沒有 progam 進去的話,它便不會自行判斷。當然,出現藍燈的機會率可能低至千萬分之一,但要是發生了,後果承擔得來嗎?

社會愈來愈先進,電腦愈來愈普及,連帶我們都要為了遷就電腦而把生活機械化。人逐漸變得單純,少了變通,缺乏人情味。試想,你聽過多少次『電腦不容許』這句說話?電腦打不出這個口語字;這份文件電腦說沒有;輸入了關鍵字,但仍然找不出資料;這件貨品不能少收五角錢;最經典的例子,莫過於機場開幕當日,電腦系統癱瘓,空運貨物進行不了交收。中國商貿發展了幾千年,到頭來,沒有電腦竟然成不了事。電腦是人的工具,是用來提升我們的生活質素,不能為了遷就電腦的『智慧』而令我們變笨,這是本末倒置的方法。

今天讀到一則新聞,謂內地有發明家設計了一部自動炒菜機,簡單易用,放入菜、水、油,等一段時間便成。為此,記者訪問了某餐廳的廚子,他笨拙地回應:『機器當然唔可以取代人手,因為炒菜要講鑊氣同咩~家馬。』咩?!不是他讀得書少,不懂得表達,而是人生的味道本應不言而喻。想一想,『鑊氣』可以 program 得來嗎?人跟電腦,就是百樂和千里馬之間的關係,濫用了電腦,連未來的菜都會變得無味。

283

用心

自從電腦發明了以後,我們都喜歡把所有事情量化﹝Quantifing﹞起來。翻開報紙,治安有一個指數、蚊患有一個指數、特首民望有一個指數、年青人會考後對前途樂觀與否有一個指數、對中央的信任程度有一個指數、明星人氣也有一個指標。民望、樂觀、信任、名氣,連這些抽像的概念 都有一套數學公式去計算,當數據達到了某個標準後,便可以對號入座地介定為『嚴重』、『高』、『低』、『好』、『壞』。如此,市民便可以更清晰地掌握實況。

今天是科學發達的年代,把攏統的概念歸納出一個量度指標是人類進步過程中所必須的。例如特首民望由七十分跌至現時的四十四分,證據確鑿,總好過中央高層不斷在塗脂抹粉。 但讀者也許知道,我對這種指標其實不甚認同﹝見《生活數字化》﹞,因為我從來也不相信單靠一兩個數字可以完全表達一個人 / 一件事的全面。特首民望跌至四十四分,只不過是一個數字而已,有人拒絕握手、有人高叫下台、有人拒絕受勳、五十萬人上街,當中的悲、歡、憤、慨、恩恩怨怨,數字都不能表達出來。單是我們每日所見所聞,許多只能用感覺去領會的,都不能量化。硬去堆砌的話,最終只會令數據更加脫離現實﹝見《笑談工作指標》﹞。

世間上有許多東西是永遠不能量化的,『求學不是求分數』就是當中最明顯的失敗例子。一直以來,學生的能力、知識、質素都用分數來量化,結果是誕生了學生為考試而讀書的怪現象。藝術也是跟量化有明顯矛盾的,票房不能用來區分王家衛跟王晶電影的分別,也不能判斷究竟是黃秋生演得好還是曾志偉演得好;文章寫得好壞,也不能以讀者多寡或銷量去判斷,尤其在香港,經典的文學作品往往是沒有人看的。

要了解一個人,不能夠單靠數據,不論是工作表現指標﹝performance indicator﹞還是 ICQ 上的 profile。因為量化指標可以量度一個人的勤奮、效率、錯誤率,甚至財富、學歷、年齡,但永遠量度不了人的心。一件工作他是否用心去做?文章是否用心去寫?照片是否用心去拍?歌是否用心去唱?戲是否用心去演?一切只能夠心領神會,不能量化。還有良心、愛心、痴心、同情心、忠心、關心、真心、熱心、專心、偏心、機心、野心、貪心、歹心、黑心、居心 …..當中又有幾多『心』真正可以從數據中表達出來呢?愛情,也是用心去感受的。要挑選一個伴侶,總不能只講表面的條件,就算他如何德才﹝財﹞兼備、她如何天姿國色也好,一切都不是首選,最重要還是他 / 她有沒有用『心』去愛過你。

281

資料、資訊

最近偉入讀了某大學的研究院,專程相約他出來閒聊。我問他在研究院裡讀的是什麼科目,他說 Information Science﹝資訊科學﹞,我自從修讀過圖書館科學後,一聽人說起這兩個字我都會無名火起,連隨莫須有地『省』了他一頓。Information Science 這個字本身有語病,名字由來詳見《Oops囉》。在我檯頭的字典裡,Science 的意思是『the study of some aspect of behavior』,意指研究及解釋一項科目,所以 Natural Science 解釋作 the Science of Nature、Social Science 也解釋作 the Science of Social behavior,唯獨一般的 Information Science 並不是 the Science of Information,因為他們著眼在教電腦﹝尤其是資料庫﹞,而沒有去研究資訊本身的特質,所以極其量只能說是 the Science of Information Handling﹝處理資訊的科學﹞。因為我同時擁有電腦科學及資訊科學兩項專業資格,我說了,倒是沒有人敢來反駁。至於怎樣才算是資訊科學?在圖書館學校裡,其中一科所學的是認知心理學,即是當人接觸到資訊後,如何吸收並記憶在大腦裡,這才是 the Science of Information。

Information Science 的另一個謬誤是錯用了『資訊』這個字,與其說是資訊﹝information﹞,倒不如說是資料﹝data﹞。到底資料跟資訊有什麼分別?今天的 IT 人十居其十也分答不出這個問題,還敢自稱在唸『資訊科學』?資料跟資訊之別,在於資料本身是沒有意思的,例如未經分析的數據,要附加上人的智慧及見解,才可以演化成訊息。舉例說,每天我們在金融市場上可以獲得許多數據,但仍要經分析員研究後才可以得出有用的資訊,例如某某的股價現高於市值,短期內或許會下跌等等。在現今科學的進度而言,電腦還未達到可以不經人手地去理解數據裡潛藏的訊息1。今天在搜尋器裡處理的,都是經 Spider 去把網頁找出及收藏,當中沒有經過分析,所以一概都是資料,它們不會保證資料是否詳盡、有用及準確的,始終要人去鑑別,所以 Information Science 要是改用 Data 一字,應該比該貼切。

上星期到營養師處覆診,一個月來只輕了五磅,比起初期的一周四磅來說,進度並不如意。但一個月五磅只是數據,本身是沒有意思的,經專家評價了之後,她說:『可能是已經輕了脂肪,但長了肌肉,兩者打了和的關係。』我要是跟她換掉性別的話,我肯定會因她這一句花言巧語而傾心。經分析後的資訊,往往會隨個人的理解而存有不同取向,潑婦會指著我的鼻尖鬧:『睇o下你,又肥左喇,減肥又無恆心,又唔戒口……』溫柔的會說:『這是因為長了肌肉的關係。』當中加進了寬容、鼓勵、關懷、細心、體貼、善解人意,當中的分別不言而喻,電腦這條笨牛又怎麼會懂?

 

  1. Datamining 可以,但只能局限於預先設定好的資訊,再由電腦去對號入座。

259

找不同

『找不同』是一種小時候的遊戲,玩法是從兩幅大致相同的圖案裡找不同之處,這遊戲曾經有一段時間被人遺忘了。幾年前,隨著數碼技術不斷平民化,『找錯處』遊戲又再流行起來,換上一張數碼照片跟另一張人工潤飾後過的副本放在螢光屏上作比較,既考眼力又考腦筋,比什麼 AHA、DHA、SA 有效得多。

當『找不同』應用在電腦科學上的時候,我們稱之為『樣式比對技術』﹝Pattern Matching﹞,這是現時電腦人工智慧學上最熱門的課題之一,作用是要使電腦能夠辨識出不同的物件。踏進廿一世紀,電腦盛行,為什麼樣式比對技術仍然只限於研究階段?難處在哪裡?這都因為電腦學傳統的布林邏輯處事非黑即白,但萬物卻都存在模糊邏輯有關。舉一個例子說,在現今科技的語音辨認裡,閣下對著電話說『老細』,電腦馬上辨識出主人的意思,並自動撥一通電話到老闆的辦公室去,然而,人的聲線每一刻都不同,高低音、氣氛、心情、語氣、場合、媒介均可以影響發音,剛才說的一句『老細』不可能跟存在電腦紀錄裡頭的『老細』完全吻合,極其量只是『像』,這是一個抽象的定義,比對技術就是要由電腦去自行判斷 『老細』究竟『像』哪一個指令。

人腦的辨識能力比電腦強得多,我們從周歲開始己經懂得認人,成年人還能認得那是瘦了的老三、塑膠造的香蕉、 『化了灰』的仇人等等。但要電腦去辨識一件物件則比較困難,要先有不同的樣本寄存在紀錄裡,再去運行樣式比對技術去判斷該物像什麼。至現時為止,電腦還只能概括分類﹝風景、人物或城市﹞,而且還不十分準確。說了這麼久,只想說明在現實生活底下,電腦比人還是笨多了,要完全取代人,還只能在幻想小說裡出現。

不論未來的人工辨識能力發展到哪個地步,『人情味』還是不能被取締掉,曾司長稱呼特首的那句『老細』,跟特首稱呼江主席的『老細』態度固然不同,跟深圳卡拉 OK 裡的公關對闊客說的那句『老細』又不同。說『老細』壞話和被『老細』說壞話時的『老細』又不同,箇中的人際關係自然不言而喻,電腦如何會懂?看看『老細』 的樣子跟昨天的有何不同?他今天噘起嘴唇、雙頰通紅、兩眉上揚、青筋暴現、目露兇光,心情大概是糟透極了;有此情況,下屬都避免惹毛了他,電腦不懂得知情識趣,難保一天淪為『上門收機』的遺棄品。

240

對與錯

電腦科學的人工智慧理論裡,最大的挑戰是如何以 Boolean 的黑白羅輯在現實世界中實踐。世界上從來都沒有絕對的對與錯,只有中間的灰色地帶按比例去判斷『很大可能是對的』或『我想應該會錯』等等,電腦學稱這種灰色羅輯為模糊理論﹝Fuzzy Logic﹞。

H 早前思覺失調症復發,一草一木都成了他的憂慮,鄰居的關門聲變成了槍聲、朱鎔基總理的公開演說成了針對他個人的指令、親友的關懷都幻想成傷害他的行為,不明所以的人會覺得他是愚昧得可笑,然而在我們心中卻只有憐憫,試想一個人每刻都生活在恐懼之中,他可會快樂?思覺失調症除了腦袋的分泌起了變化而影響思維之外,身體上其他的功能都跟正常人無異,簡單一點說,他是一個正常人,只是混淆了腦海裡對與錯的觀念而已。

H 一直對自己的觀念深信不移,並拒絕看精神科醫生,不論親友費了多少唇舌去告訴他說:『朱鎔基跟本不會認識你。』他也無動於衷。一天他的病情惡化了,我平心靜氣地跟他討論,不要把對與錯看得太重,也許世界上跟本沒有對錯,只有不同方向的選擇,一是選擇去走一般人的路,過一般人的生活;二是依自己相信的路走,往後的日子一直如此下去。道理很簡單,幸福就在前面的分叉路口,任由他自己去選擇。翌日,他主動找我去見精神科醫生,並謂希望從過新生活。

H 的例子令我認識到人性的弱點,許多人都曾經頑固地去堅持自己的信念,寧願力排眾議,自己有沒有經歷過這樣的固執?當自己認為所作的決定是對的時候,問一問身邊的朋友是否也都認同自己?再想想自己的決擇會否令自己過得更愉快?也許自己真的對、全世界也是錯也說不定,這又如何?我們並不一定要計較對每一個選擇的得失,沒有人每次考試都會得一百分。人生的選擇,只要挑選一條自己應該走的路便已經足夠,自己認為的對或錯其實都不重要。

107

生活數字化

社會越趨進步,越變得數字化,有時候不禁想,世事萬物是否真能夠數字化?答案是否定的,所以才有「模糊理論」1的出現,西方國家一直對生活數字化存疑。不知何解,香港人卻樂此不疲,最後成了尖端科技的實驗室。實例一,電子貨幣早於十年前在西方國家研究2,卻不敢推行,數年後卻在香港盛行;實例二,流動電話科技儼然是美國、歐洲及日本廠商的科技大戰,前線卻開在香港。

多年前修讀人工智慧學時候,曾問教授,為何西方國家不積極推行生活電腦化?答案簡單,原因是人還不能全信電腦,躺在手術床上的病人還不能把性命交托給「專業系統」3、乘客還不能完全信任那位「自動司機」來開車。今天,我們的薪金、供款、花費等賬目已經由電子過戶應付,但我們還是認為「有銀紙渣手」比較有安全感。人與人之間還不能完全互相信任,何況人與電腦?但香港人卻是世界特殊的一群,膽量十足,寧願相信那部沒有人情味的機器。

  1. Fuzzy Logic 為人工智慧學的一個課題,謂萬物並非都能 Boolean Logic 般肯定或否定,0 與 1 之間總該有灰色地帶。
  2. 韋信單憑記憶,十年前修人工智慧學時曾唸過相關課題,確實年份不詳,也不太深究。
  3. Expert System 為人工智慧學的名詞,即為代替人類某種專門技術而設計的超級電腦。

43