簡(jiǎn)介:對(duì)于“算法”一詞給以精確的定不是一件容易事,有一些意義相的同義語(yǔ),就是一些其他的名詞它們(有時(shí))會(huì)給出差不多同樣東西,例如 "法則"" 技巧”“程序”還有“方法”等??都是種同義語(yǔ)。也可以給出一些例子如長(zhǎng)乘法,就是小學(xué)生學(xué)的把兩正整數(shù)相乘的豎式乘法。然而,然非形式的解釋和恰當(dāng)?shù)睦訉?duì)什么是算法給出了很好的感覺(jué),算法一詞中所深藏的思想?yún)s經(jīng)歷一個(gè)很長(zhǎng)的演化歷程,直得到 20 世紀(jì)才得到了令人滿意的形式定義獵獵而關(guān)于算法的觀念,直到今還在演進(jìn)。算盤家和算法家回關(guān)于乘法的例子,有一點(diǎn)是顯然:怎樣把兩個(gè)數(shù)相乘?表示這些的方法極大地影響了乘法的具體法。為了弄明白這點(diǎn),試著把兩羅馬數(shù)字 CXLVII 和 XXIX 相乘,但不要先把它們譯成等價(jià)的十鸚鵡數(shù)字 147 和 29。這件事既難弄明白,明白了以后進(jìn)行計(jì)熊山也極其花時(shí)間,而就可以解釋何以留存至今的羅馬國(guó)關(guān)于乘法的材料極為零散。記制可以是 " 累加的 ",如羅馬記數(shù)法:C 表示 100。X 表示 10。L 表示 50,但是 X 放在 L 左方表示要從 L 中減去 X,所以就是 40,V 表示 5,I 表示 1,兩個(gè) I 放在 V 的右方,表示要把它們加到 V 上,所以是 7。把所有以上的解釋“累加”起來(lái),就是羅馬數(shù)學(xué)的 147。記數(shù)制度也可以是進(jìn)位的,如我們今天所用的那樣。如果是進(jìn)的,可以使用一個(gè)或多個(gè)基底。很長(zhǎng)的時(shí)期中,進(jìn)行計(jì)算可以使一種計(jì)算工具 "算盤(abacus)"。這些計(jì)算工具可以表示一定基底下的進(jìn)位季格的數(shù)。例如如果以 10 為基底、則一個(gè)標(biāo)記物可以代表 1 個(gè)單位、或者 10?;蛘?100 等等,視它是放在哪一橫行或豎列思女定。照精確的規(guī)則移動(dòng)這些標(biāo)記物,可以進(jìn)行算術(shù)四則運(yùn)算。中國(guó)的盤就是 abacus 的一種。到 12 世紀(jì),阿拉伯?dāng)?shù)學(xué)著作被翻譯為拉酸與文以后,十進(jìn)制就歐洲流行開(kāi)來(lái)了。這種進(jìn)位制特適合于算術(shù)運(yùn)算,并且引導(dǎo)到許新的計(jì)算方法。這些方法就通稱算法(algoritmus),而與在算盤上用標(biāo)記物進(jìn)行計(jì)算區(qū)別。雖然數(shù)字符號(hào),就是數(shù)碼來(lái)自印度人的實(shí)踐,而后來(lái)才為拉伯人所知,現(xiàn)在這些數(shù)碼卻叫阿拉伯?dāng)?shù)碼.算法(algorithm)的字源卻是阿拉伯文,它是阿拉伯?dāng)?shù)學(xué)家阿爾?花拉子米名字的變體?;ɡ用资乾F(xiàn)在已的最古老的數(shù)學(xué)書的作者,這一作名為 《通過(guò)補(bǔ)全和還原做計(jì)算的綱要》(al-Kitab al-mukhtasar f hisib al-jabr wod ll-mugi balo),其中的 al-jabr 后來(lái)就變成了“代數(shù)”(algebra)一詞。有限性我們已經(jīng)看到“算法”一詞在中世琴蟲(chóng)是指以整數(shù)十進(jìn)制表示為基礎(chǔ)的計(jì)算程序。是到了 17 世紀(jì),在達(dá)朗貝爾主編的《百科全書》中,算法一被賦予了更廣泛的意義,不只用算術(shù),還用于關(guān)于代數(shù)方法以及他的計(jì)算程序,諸如 "積分學(xué)的算法"" 正弦的算法 " 等等。算法這個(gè)詞又逐漸地被用來(lái)表任意的具有精確規(guī)則的系統(tǒng)的計(jì)程序。最后,隨著計(jì)算機(jī)的作用來(lái)越大,有限性的重要性被充分識(shí)到了,很本質(zhì)的要求是,這個(gè)程在有限時(shí)間以后就會(huì)停止,而出結(jié)果。所以就得到了下面的樸的定義:一個(gè)算法就是有限多個(gè)則的集合,用以對(duì)數(shù)量有限的數(shù)進(jìn)行操作,而在有限多步以后產(chǎn)結(jié)果。注意,在這里一直強(qiáng)調(diào)有性,在寫出算法時(shí)的有限性,以在執(zhí)行算法時(shí)的有限性。上面的述算不上是在經(jīng)典意義下的數(shù)學(xué)義。我們將會(huì)看到,把它進(jìn)一步式化是重要的。但是我們現(xiàn)在暫也就滿足于這個(gè) "定義" 了,而且來(lái)看一下數(shù)學(xué)中的算法的一經(jīng)典例子。三個(gè)歷史上的例子算具有一種我們尚未提到的特性:代,也就是簡(jiǎn)單程序的反復(fù)執(zhí)行為了看清迭代的重要性,我們?cè)?次來(lái)看一下長(zhǎng)乘法這個(gè)例子,這一個(gè)對(duì)任意大小的正整數(shù)都適用方法。數(shù)字變得越大、程序也就長(zhǎng)。但是最關(guān)緊要的是,方法是同樣的”,如果會(huì)把兩個(gè)三位數(shù)乘,也就會(huì)把兩個(gè) 137 位的數(shù)字相乘,而不必再去學(xué)什么新原理,理由在于長(zhǎng)乘法的方法里包含了大量的仔細(xì)構(gòu)造好的小得的任務(wù)的重復(fù)執(zhí)行,例如把兩個(gè)位數(shù)相乘的九九表。我們將會(huì)看,迭代在我們所要討論的算法中了重要作用。歐幾里得算法:迭歐幾里得算法是說(shuō)明算法本質(zhì)的好也是最常用的例子。這個(gè)算法以追溯到公元前 3 世紀(jì)。歐幾里得用它來(lái)計(jì)算兩個(gè)正整數(shù)的最公約數(shù)(gcd)。當(dāng)我們最開(kāi)始遇到兩個(gè)正整數(shù) a 和 b 的最大公約數(shù)時(shí),它是定義為一個(gè)整數(shù),而且同為 a 和 b 的因數(shù)。然而,為了很多目的,定它為具有以下兩個(gè)性質(zhì)的唯一的數(shù) d 更好。這兩個(gè)性質(zhì)就是:首先,d 是 a 和 b 的一個(gè)因數(shù);其次,如果 c 是 a 和 b 的另一個(gè)因數(shù),則 d 可以被 c 所整除。歐幾里得的《幾何原本》卷 VII 的前兩個(gè)命題給出了求 d 的方法,其中第一個(gè)命題如下:"給定了兩個(gè)不相等的數(shù)、從較大的一數(shù)不地減去較小的一數(shù),如果余下的位,都不能量度前數(shù),直到余下數(shù)為一單位為止,這時(shí),原來(lái)的為互質(zhì)。" 換句話說(shuō),如果輾轉(zhuǎn)相減得到了數(shù) 1,則 gcd 為 1。這時(shí),就說(shuō)原來(lái)的兩個(gè)數(shù)互質(zhì)擁有或互為素?cái)?shù))。輾轉(zhuǎn)相減現(xiàn)在我們來(lái)一般地描述歐幾里得法,它是基于以下兩點(diǎn)觀察的:1)如果 a=b,則 a 和 b 的 gcd 就是 b(或 a)。(2)d 是 a 和 b 的公約數(shù),當(dāng)且僅當(dāng)它也是 a-b 和 b 的公約數(shù)?,F(xiàn)在設(shè)要求 a 和 b 的 gcd,而且設(shè) a≥b。如果 a=b,則觀察(1)告訴我們,gcd 就是 b。若不然,觀察(2)告訴我們,如果求 a-b 和 b 的 gcd 也會(huì)得到同樣的答案。現(xiàn)在令 a_1 是 a-b 和 b 中較大的一個(gè),而 b_1 則為其中較小的一個(gè),然后再求兩數(shù)的 gcd。不過(guò),現(xiàn)在兩數(shù)中較大的一個(gè),即 a_1,小于原來(lái)兩數(shù)中較大的一個(gè),即 a。這樣我們就可以把上面的程序再重復(fù)一遍:若 a_1=b_1,則 a_1 和 b_1 的 gcd,亦即 a 和 b 的 gcd 是 b_1,若不然,就把 a_1 換成 a_1-b_1,再來(lái)組織 a_1-b_1 和 b_1,總之,較大的一個(gè)要放在前面,然后再繼續(xù)下楮山,這叫做 " 輾轉(zhuǎn)相減 "。為了使這個(gè)程序能夠進(jìn)行下去,還有一觀察是需要的,這就是下面的關(guān)正整數(shù)的一個(gè)基本事實(shí),有時(shí)稱良序原理:嚴(yán)格下降的正整數(shù)序 a_0 > a1 > a2 >… 必為有限序列。因?yàn)樯厦娴牡绦蚯『卯a(chǎn)生了一個(gè)夷山格下序列,這個(gè)迭代最終一定會(huì)停止這就意味著在某一點(diǎn)上必有 a_k=b_k,而這個(gè)公共值就是 a 和 b 的 gcd。歐幾里得算法的流程圖歐幾里得除法通對(duì)于歐幾里得算法的陳述與此稍不同。可以應(yīng)用一種較復(fù)雜的程,稱為歐幾里得除法(也就是帶除法),它可以大大減少算法的數(shù),這種算法也稱為輾轉(zhuǎn)相除法這個(gè)程序的基本事實(shí)是:若 a 和 b 是兩個(gè)正整數(shù),則必存在唯一的整數(shù) q 和 r,使得數(shù) q 稱為商,而 r 稱為余數(shù)。上面的兩點(diǎn)說(shuō)明(1)和(2)現(xiàn)在要代以若 r=0,則 a 和 b 的 gcd 就是 b。a 和 b 的 gcd 與 b 和 r 的 gcd 是相同的。這一次,在第一步要用(b,r)代替(a,b)。如果 r≠0,則還要做第二步,并用(r,r_1)來(lái)代替(b,r),r1 是用 r 去除 b 所得的余數(shù),所以 r_1r>m>r1>r2≥0)。再用一次良序原理,即知這個(gè)程序經(jīng)過(guò)有限張弘后一定停止而最后一個(gè)非零的余數(shù)就是 a 和 b 的 gcd。不難看到,這兩種方法,就求 gcd 而言是等價(jià)的,但就算法而言則有很區(qū)別。例如,設(shè) a=103 438,b=37。如果用輾轉(zhuǎn)相減法,就要從 103 438 中累次減去 37,一直到余下的差數(shù)小于 37 為止。這個(gè)差數(shù)與 103438 除以 37 的余數(shù)是一樣的,而如果用第二種法,一次就可以得到它。這樣,用第二種方法的理由就在于用累減法來(lái)求除法的余數(shù)是非常低效的。效率上的收益在實(shí)踐上是很要的,第二種方法給出的是多項(xiàng)時(shí)間算法,而第一種方法所需的是指數(shù)長(zhǎng)的時(shí)間。推廣歐幾里得法可以推廣到許多其他背景下,要有加法、減法和乘法的概念就。例如它有一個(gè)變體,可以用于斯整數(shù)環(huán)。就是形如 a+ bi,而其中 a,b 為整數(shù)的復(fù)數(shù)所成的環(huán),它也可以用于系數(shù)為數(shù)的多項(xiàng)式環(huán)中(就此而論,系在任意域中也行)。但有一個(gè)要,就是要能夠定義帶余除法的類物,有了這一點(diǎn)以后、算法就與整數(shù)情況的算法基本上相同了。如下面的命題:設(shè) A 和 B 是兩個(gè)任意多項(xiàng)式,而且 B 不是零多項(xiàng)式、則必存在兩個(gè)多項(xiàng) Q 和 R。使得或者 R=0,或者 R 的次數(shù)小于 B 的次數(shù)。正如歐幾里得在《幾何原》中提到的那樣,也可以對(duì)于一數(shù)(a,b)當(dāng) a 和 b 不一定是整數(shù)時(shí)實(shí)行這個(gè)程序。容驗(yàn)證,當(dāng)且僅當(dāng)比 a / b 是有理數(shù)時(shí),這個(gè)程序會(huì)停下來(lái)這個(gè)觀點(diǎn)引導(dǎo)到連分?jǐn)?shù)的概念。 17 世紀(jì)以前,沒(méi)有特別地研究過(guò)它,但是其中赤鷩思想根源可追溯到阿基米德。阿基米德計(jì)算 π 的方法:逼近和有限性圓周長(zhǎng)和圓的直徑的比值是一個(gè)儀禮數(shù),自從 18 世紀(jì)以來(lái)就記作 π?,F(xiàn)在我們來(lái)看一看阿基米德怎在公元前 3 世紀(jì)就得到了這個(gè)比值的經(jīng)典的近似值 22/7。若在圓內(nèi)作一個(gè)內(nèi)接的正多邊形其頂點(diǎn)都在圓周上),又作其外的正多邊形(其邊都是圓周的切),再計(jì)算這些多邊形的周長(zhǎng),會(huì)得到 x 的下界與上界,因?yàn)閳A的周長(zhǎng)必定大于任意內(nèi)接多邊的周長(zhǎng),而小于任意外切多邊形周長(zhǎng)。阿基米德從正六邊形開(kāi)始然后,每次把多邊形的邊數(shù)加倍得到了越來(lái)越精確的上下界。他到九十六邊形為止,得到了π 的逼近這個(gè)過(guò)程中顯然涉及迭代。是稱它為一個(gè)算法對(duì)不對(duì)?嚴(yán)格說(shuō),它不是一個(gè)算法,不論取多邊的多邊形,所得到的僅是 π 的近似值,所以這個(gè)過(guò)程不是有的。然而我們確實(shí)得到了一個(gè)可近似計(jì)算 π 到任意精確度的算法。例如。如果想得到 π 的一個(gè)準(zhǔn)確到小數(shù)十位的近似值,經(jīng)有限多步以后,這個(gè)算法會(huì)給出個(gè)我們想要的近似值。重要的是這個(gè)過(guò)程是收斂的。就是說(shuō),重的在于由迭代得出之值可以任意接近于 π。這個(gè)方法的幾何來(lái)源可以用來(lái)證明這個(gè)收斂性,而 1609 年德國(guó)人作到了 202 邊形(基本上用阿基米德的方法),得到 π 的精確到小數(shù) 35 位的近似值。然而,逼近 π 的算法與阿基米德計(jì)算兩個(gè)正整數(shù)的 gcd 的算法有一個(gè)明顯的區(qū)別。如歐幾里得那樣的算法常稱為離散算法,而與用來(lái)計(jì)算整數(shù)值的數(shù)值算法相對(duì)立。牛頓-拉夫森方法:遞推公式1670 年前后、牛頓提出了一個(gè)求方程根的方法,而且就方程 x^3-2x-5=0 解釋了他的方法。他的解釋從下面的修鞈個(gè)觀察開(kāi)始根 x 近似地等于 2。于是他寫出 x=2+p,并用 2+p 代替原方程的 x,而得到了一個(gè)關(guān)于 p 的方程。這個(gè)新方程算出來(lái)是因?yàn)?x 接近于 2,所以 p 很小,而他就略去了 p^3 和 6p^2 來(lái)估計(jì) p。這就給了他 p 的方程 10p-1=0,即 p=1/10。這當(dāng)然不是一個(gè)準(zhǔn)確解,但是給了牛頓關(guān)于根的新的更好的近值:x=2.1。然后牛頓就重復(fù)這個(gè)過(guò)程,令 x=2.1+q,代入原方程以后又給出了一個(gè)關(guān) q 的方程,近似地解這個(gè)方程,又把他的思女似解精確化了,于得到 q 的估計(jì)為-0.0054,所以 x 的下一個(gè)近似值是 2.0946。盡管如此,我們?cè)趺茨艽_定這個(gè)過(guò)宋史會(huì)收斂于 x 呢?讓我們更仔細(xì)地考察這個(gè)方法。切線和收斂性夔牛頓的方法可從幾何上用函數(shù) f 的圖像來(lái)解釋,雖然牛頓本人并沒(méi)有鬲山樣做f(x)=0 的每一個(gè)根 x 都對(duì)應(yīng)于函數(shù) y=f(x)的曲線和 x 軸的一個(gè)交點(diǎn)。如果從根 x 的一個(gè)近似值 a 開(kāi)始,而且和上面做的一樣,設(shè) p=x- a,于是可以用 a+p 代替 x 而得到一個(gè)新的函數(shù) g(p),也就是說(shuō)把原點(diǎn)(0,0)有效地移到了(a,0)處。然后把 p 的所有高次冪都略去,只留下常數(shù)項(xiàng)和線性項(xiàng),這樣得到了函數(shù) g 的最佳的線性逼近 —— 從幾何上說(shuō),這就是 g 在點(diǎn)(0,g(0))處的切線。這樣,對(duì)于 p 所得到的近似值就是函數(shù) y 在點(diǎn)(0,g(0))處的切線與 x 軸的交點(diǎn)。再在橫坐標(biāo)上加一個(gè) a,也就是讓原點(diǎn)回到原來(lái)的(0,0)處,這樣 a+p 就給出了 f 的根的新近似值。這就是牛頓的方法戲?yàn)榍芯€法的原因。牛頓方從上圖可以看到,再作一次切線逼近,如果曲線 y=f(x)與 x 軸的交點(diǎn)在 a 點(diǎn)以及 f 在點(diǎn)(a,f(a))處的切線與 x 軸的交點(diǎn)(即上圖中的橫坐標(biāo)為 a+p 的點(diǎn),即根的近似值)之間,則滅蒙二次的近似(即 a+p+q)肯定比第一次的近似值 a+p 好(這里稱 a 為根的零次近似)?;氐脚nD的例子,可以看到牛頓選朱厭 a=2 并不是上面所說(shuō)的情況。但是從下一個(gè)近似值 2.1 開(kāi)始,以下所有的近似值就都是旋龜個(gè)情了。從幾何上看,如果點(diǎn)(a,f(a))位于 x 軸的上方,而且 y=f(x)的曲線在凸部與 x 軸相交,或者點(diǎn)(a,f(a))在 x 軸的下方,而且 y=f(x)曲線在凹部與 x 軸相交,就會(huì)出現(xiàn)這種有利的情。初始的逼近(即零次近似)的擇顯然是很重要的,而且提出了妙的未曾想到的問(wèn)題。如果我們慮復(fù)多項(xiàng)式的復(fù)根,這就更加清了。牛頓的方法很容易適應(yīng)這個(gè)廣泛的背景。設(shè) z 是一個(gè)復(fù)多項(xiàng)式的復(fù)根,而 z_0 是初始的逼近,于是牛頓方法將給出一序列 z_0,z_1,z_2…… 它可能收斂于 z,也可能不收斂。我們定義根 z 的吸引區(qū)域?yàn)檫@樣的初始逼近 z_0 的集合,使得所得到的序列確實(shí)收于 z,并且記這個(gè)區(qū)域?yàn)?A(z)。怎樣來(lái)決定 A(z)呢?第一個(gè)問(wèn)這個(gè)問(wèn)題的人是凱萊,間是 1879 年。他注意到,對(duì)于二次多項(xiàng)式,這個(gè)問(wèn)兵圣是很易的,但當(dāng)次數(shù)為 3 或者更大時(shí),問(wèn)題就很困難了。例如多項(xiàng) z^2-1 的根 ±1 的吸引區(qū)域分別是復(fù)平面上以鉛直軸界的兩個(gè)半平面,但是 z^3-1 的三個(gè)根 1,w,w^2 的相應(yīng)的吸引區(qū)域就是極復(fù)雜的合。這些集合是由儒利亞在 1918 年描述的,而現(xiàn)在稱為分形集合。遞推公式牛供給方法的每一段都會(huì)產(chǎn)生一個(gè)新方程。但是拉森指出實(shí)際上并無(wú)必要。他就特的例子給出在每一步都可以使用單一一個(gè)公式。但是他的基本的察可以一般地適用,導(dǎo)出可以用每一個(gè)情況的一般公式,而這個(gè)式用切線的解釋就可以容易得出事實(shí)上,曲線 y=f(x)在 x 坐標(biāo)為 a 處的切線方程是它與 x 軸的交點(diǎn)的橫坐標(biāo)是 a-f(a)/f'(a)。我們現(xiàn)在所說(shuō)的牛頓-拉夫森方法就是指的這個(gè)公式。我們從一個(gè)初始近 a_0=a 開(kāi)始再用這個(gè)遞推公式得出這樣就得到一個(gè)逼近序列,在復(fù)情況下,也就是前面的 z_0,z_1,z_2,…。作為一個(gè)例子,考慮函數(shù) f(x)=x^2-c。這時(shí),牛頓方法就給出 c 的平方根根號(hào) c 的一串近似值,遞推公式現(xiàn)在成了在上面的一般公式中把 f 換成 x^2-c 即得。這個(gè)近似平方根的求法,公元 1 世紀(jì)的亞歷山大里亞的海倫就已鱧魚(yú)知道本文來(lái)自微信公眾號(hào):老胡說(shuō)科 (ID:LaohuSci),作者:我才是老?