十年網(wǎng)站開發(fā)經(jīng)驗(yàn) + 多家企業(yè)客戶 + 靠譜的建站團(tuán)隊(duì)
量身定制 + 運(yùn)營維護(hù)+專業(yè)推廣+無憂售后,網(wǎng)站問題一站解決
Lua5.0的語法非常簡潔,這從參考手冊中的語法定義的規(guī)模(轉(zhuǎn)換成標(biāo)準(zhǔn)BNF形式大概有100個(gè)左右的產(chǎn)生 式)可以看出。不過簡潔歸簡潔,它卻不完全是無二義性的。下面將用具體例子揭示什么樣的代碼會引起歧義(執(zhí)行環(huán)境是www.lua.org發(fā)布的 Lua5.04)。

首先定義如下幾個(gè)函數(shù):
- function foo(a)
- print("foo print",a)
- return a
- end
- function goo(a)
- print("goo print",a)
- return a
- end
- function hoo(a)
- print("hoo print",a)
- return a
- end
試看這一段代碼:
foo(goo)
(hoo)(1979)
如果試圖編譯執(zhí)行上面這段程序,那么解釋器就會報(bào)告 "ambiguous syntax (function call x new statement) near '(' " 這樣的錯(cuò)誤。為什么呢?或許寫程序的人原本的意思就是***行foo(goo)為一個(gè)單獨(dú)的函數(shù)調(diào)用語句(statement),而第二行(hoo) (1979)又為另一個(gè)單獨(dú)的函數(shù)調(diào)用語句(Lua中語句之間的分隔符——分號并非必需,而是可選的)。但是不要忘記了foo(goo)(hoo)是一個(gè) 語法上完全合法的函數(shù)調(diào)用形式(在編譯過程中換行符作為空白符會被忽略掉),foo(goo)(hoo)(1979)也可以成為一個(gè)完整的函數(shù)調(diào)用語句。 這樣的話,編譯器就無法知道程序員的真正意圖了。
我們可以再深入到編譯過程里頭一點(diǎn)看看。Lua語法的形式定義(轉(zhuǎn)換成BNF標(biāo)準(zhǔn)形式)包含如下幾個(gè)產(chǎn)生式:
(1) stat -> functioncall (語句的產(chǎn)生式)
(2) prefixexp -> functioncall (前綴表達(dá)式的產(chǎn)生式)
(3) functioncall -> prefixexp args
| prefixexp ':' Name args (函數(shù)調(diào)用的產(chǎn)生式)
可以發(fā)現(xiàn),functioncall既可以被規(guī)約(reduce)為stat,也可以被規(guī)約成prefixexp,(1)和(2)兩個(gè)產(chǎn)生式發(fā)生了沖突,編譯器不知道用哪一個(gè)對foo(goo)進(jìn)行規(guī)約,所以便出現(xiàn)了錯(cuò)誤。
其實(shí)要解決這個(gè)問題歧義問題也很簡單,在***行后面加一個(gè)語句分隔符——分號,編譯器就會把代碼編譯成兩個(gè)獨(dú)立的語句?;蛘甙褍尚泻喜⒊梢恍?, 那么foo(goo)(hoo)(1979)就被看作是一個(gè)完整的函數(shù)調(diào)用(其實(shí)此時(shí)仍然是有歧義的,但是Lua5.04通過優(yōu)先選擇prefixexp -> functioncall進(jìn)行規(guī)約解決了二義性)。
實(shí)際上,還有另外3種情況也會引起歧義:
- -- prefixexp -> functioncall 與
- -- exp -> functioncall 沖突。
- -- 編譯器不知道該把foo(goo)解釋成表達(dá)式(exp)還是前綴表達(dá)式
- local v = foo(goo) (hoo)(1979)
- -- exp -> var 與 prefixexp -> var 沖突
- -- 第二行的變量(var)m不知道該被看成表達(dá)式還是前綴表達(dá)式
- m = foo local v = m (goo)(1979)
- -- prefixexp -> '(' exp ')' 與
- -- exp -> '(' exp ')' 沖突
- -- 不知道該把(t.fn)看成表達(dá)式還是前綴表達(dá)式
- t = {fn = foo} local v = (t.fn) (goo)(1979)
***個(gè)例子中解決歧義的兩種方法同樣也適用于這三種情況。至此我們不難發(fā)現(xiàn),引起歧義的根本原因在于Lua語句之間的分隔符是可選而不是必需的。如果強(qiáng)制 要求象C語言那樣每條語句后跟一個(gè)分號,那么二義性就不復(fù)存在(這一點(diǎn)在本文作者構(gòu)造Lua5.0的SLR解析表時(shí)得到了驗(yàn)證)。但是有許多人未必喜歡敲 入那么多討厭的分號,所以Lua的作者把選擇的權(quán)利留給了程序員自己,付出的代價(jià)就是引進(jìn)了這些模糊的代碼(雖然出現(xiàn)的幾率不大),這也算是語言設(shè)計(jì)時(shí)的 一種折衷吧。
原文鏈接:http://tech.it168.com/j/2008-02-17/200802171001717.shtml