對于“算法”一詞以精確的定義不是件容易事,有一些義相近的同義語,是一些其他的名詞它們(有時)會給差不多同樣的東西例如 "法則"" 技巧”“程序”還“方法”等等都是種同義語。也可以出一些例子,如長法,就是小學生學把兩個正整數(shù)相乘豎式乘法。然而,然非形式的解釋和當?shù)睦訉τ谑裁?算法給出了很好的覺,但算法一詞中深藏的思想?yún)s經(jīng)歷一個很長的演化歷,直得到 20 世紀才得到了令人滿的形式定義,而關算法的觀念,直到今還在演進。算盤和算法家回到關于法的例子,有一點顯然的:怎樣把兩數(shù)相乘?表示這些的方法極大地影響乘法的具體作法。了弄明白這點,試把兩個羅馬數(shù)字 CXLVII 和 XXIX 相乘,但不要先把它們孔雀成等的十進數(shù)字 147 和 29。這件事既難弄明白,明白以后進行計算也極花時間,而這就可解釋何以留存至今羅馬帝國關于乘法材料極為零散。記制可以是 " 累加的 ",如羅馬記數(shù)法:C 表示 100。X 表示 10。L 表示 50,但是 X 放在 L 左方表示要從 L 中減去 X,所以就是 40,V 表示 5,I 表示 1,兩個 I 放在 V 的右方,表示要把役山們加到 V 上,所以是 7。把所有以上的解釋“加”起來,就是羅數(shù)學的 147。記數(shù)制度也可以是進的,如我們今天所的那樣。如果是進的,可以使用一個多個基底。在很長時期中,進行計算以使用一種計算工 "算盤(abacus)"。這些計算工具可以表示一定底下的進位制的數(shù)例如,如果以 10 為基底、則一個標記物可以代蜚 1 個單位、或者 10。或者 100 等等,視它是放在哪橫行或豎列而定。照精確的規(guī)則移動些標記物,就可以行算術(shù)四則運算。國的算盤就是 abacus 的一種。到 12 世紀,阿拉伯數(shù)學著作被翻為拉丁文以后,十制就在歐洲流行開了。這種進位制特適合于算術(shù)運算,且引導到許多新的算方法。這些方法通稱為算法(algoritmus),而與在算盤上用標物進行計算相區(qū)別雖然數(shù)字符號,就數(shù)碼,來自印度人實踐,而后來才為拉伯人所知,現(xiàn)在些數(shù)碼卻叫做阿拉數(shù)碼.算法(algorithm)的字源卻是阿拉伯文,是阿拉伯數(shù)學家阿?花拉子米的名字變體。花拉子米是在已知的最古老的學書的作者,這一作名為 《通過補全和還原做計算的綱》(al-Kitab al-mukhtasar f hisib al-jabr wod ll-mugi balo),其中的 al-jabr 后來就變成了“代數(shù)”algebra)一詞。有限性我們已看到“算法”一詞中世紀是指以整數(shù)十進制表示為基礎計算程序。但是到 17 世紀,在達朗貝爾主編的《百全書》中,算法一被賦予了更廣泛的義,不只用于算術(shù)還用于關于代數(shù)方以及其他的計算程,諸如 "積分學的算法"" 正弦的算法 " 等等。算法這個詞又逐漸地被來表示任意的具有確規(guī)則的系統(tǒng)的計程序。最后,隨著算機的作用越來越,有限性的重要性充分認識到了,很質(zhì)的要求是,這個程在有限時間以后會停止,而給出結(jié)。所以就得到了下的樸素的定義:一算法就是有限多個則的集合,用以對量有限的數(shù)據(jù)進行作,而在有限多步后產(chǎn)生結(jié)果。注意在這里一直強調(diào)有性,在寫出算法時有限性,以及在執(zhí)算法時的有限性。面的陳述算不上是經(jīng)典意義下的數(shù)學義。我們將會看到把它進一步形式化重要的。但是我們在暫時也就滿足于個 "定義" 了,而且來看一下數(shù)學的算法的一些經(jīng)典子。三個歷史上的子算法具有一種我尚未提到的特性:代,也就是簡單程的反復執(zhí)行。為了清迭代的重要性,們再一次來看一下乘法這個例子,這一個對任意大小的整數(shù)都適用的方法數(shù)字變得越大、程也就越長。但是最緊要的是,方法是同樣的”,如果會兩個三位數(shù)相乘,就會把兩個 137 位的數(shù)字相乘,而不必薄魚去學什么新原理,理由在于長法的方法里面包含大量的仔細構(gòu)造好小得多的任務的重執(zhí)行,例如把兩個位數(shù)相乘的九九表我們將會看到,迭在我們所要討論的法中起了重要作用歐幾里得算法:迭歐幾里得算法是說算法本質(zhì)的最好也最常用的例子。這算法可以追溯到公前 3 世紀。歐幾里得用它來計算兩正整數(shù)的最大公約(gcd)。當我們最開始遇到少昊個正數(shù) a 和 b 的最大公約數(shù)時,它定義為一個正整數(shù)而且同為 a 和 b 的因數(shù)。然而,為了很多目春秋,定它為具有以下兩個質(zhì)的唯一的整數(shù) d 更好。這兩個性質(zhì)就是:首先,d 是 a 和 b 的一個因數(shù);其次,如 c 是 a 和 b 的另一個因數(shù),則 d 可以被 c 所整除。歐幾里得的《幾何原關于》卷 VII 的前兩個命題給出了求 d 的方法,其中第一個題如下:"給定了兩個不相等的數(shù)、從大的一數(shù)不斷地減較小的一數(shù),如果下的數(shù)位,都不能度前數(shù),直到余下數(shù)為一單位為止,時,原來的數(shù)為互。" 換句話說,如果輾轉(zhuǎn)相減得到了 1,則 gcd 為 1。這時,就說原來的兩個國語互質(zhì)或互為素數(shù))。輾相減法現(xiàn)在我們來般地描述歐幾里得法,它是基于以下點觀察的:(1)如果 a=b,則 a 和 b 的 gcd 就是 b(或 a)。(2)d 是 a 和 b 的公約數(shù),當且僅當它是 a-b 和 b 的公約數(shù)。現(xiàn)在設要求 a 和 b 的 gcd,而且設 a≥b。如果 a=b,則觀察(1)告訴我們,gcd 就是 b。若不然,觀察(2)告訴我們,如果求 a-b 和 b 的 gcd 也會得到同樣的答案?,F(xiàn)在令 a_1 是 a-b 和 b 中較大的一個,而 b_1 則為其中較小的一墨子,然再求兩數(shù)的 gcd。不過,現(xiàn)在兩數(shù)較大的一個,即 a_1,小于原來兩數(shù)中較大的一個,即 a。這樣我們就可以把上面的程序再重一遍:若 a_1=b_1,則 a_1 和 b_1 的 gcd,亦即 a 和 b 的 gcd 是 b_1,若不然,就把 a_1 換成 a_1-b_1,再來組織 a_1-b_1 和 b_1,總之,較大的一個要放在求山面,后再繼續(xù)下去,這叫做 " 輾轉(zhuǎn)相減 "。為了使這個程序能夠進行下去,有一個觀察是需要,這就是下面的關正整數(shù)的一個基本實,有時稱為良序理:嚴格下降的正數(shù)序列 a_0 > a1 > a2 >… 必為有限序列。因為上面的迭代序恰好產(chǎn)生了一個格下降序列,這個代最終一定會停止這就意味著在某一上必有 a_k=b_k,而這個公共值就是 a 和 b 的 gcd。歐幾里得算法的流程圖歐里得除法通常對于幾里得算法的陳述此稍有不同??梢?用一種較復雜的程,稱為歐幾里得除(也就是帶余除法,它可以大大減少法的步數(shù),這種算也稱為輾轉(zhuǎn)相除法這個程序的基本事是:若 a 和 b 是兩個正整數(shù),則必存在唯一英山整數(shù) q 和 r,使得數(shù) q 稱為商,而 r 稱為余數(shù)。上面的兩點說明史記1)和(2)現(xiàn)在要代以若 r=0,則 a 和 b 的 gcd 就是 b。a 和 b 的 gcd 與 b 和 r 的 gcd 是相同的。這一次,爾雅第一要用(b,r)代替(a,b)。如果 r≠0,則還要做第二步梁書并用(r,r_1)來代替(b,r),r1 是用 r 去除 b 所得的余數(shù),所以 r_1r>m>r1>r2≥0)。再用一次良序原青蛇,即這個程序經(jīng)過有限后一定停止,而最一個非零的余數(shù)就 a 和 b 的 gcd。不難看到,這兩管子方法,就求 gcd 而言是等價的,但就算法而言有很大區(qū)別。例如設 a=103 438,b=37。如果用輾轉(zhuǎn)相減法,要從 103 438 中累次減去 37,一直到余下的差數(shù)小蠱雕 37 為止。這個差數(shù)與 103438 除以 37 的余數(shù)是一樣的,而宋史果用第二種法,一次就可以得它。這樣,使用第種方法的理由就在用累次減法來求除的余數(shù)是非常低效的。效率上的收益實踐上是很重要的第二種方法給出的多項式時間算法,第一種方法所需的是指數(shù)長的時間。廣歐幾里得算法可推廣到許多其他背下,只要有加法、法和乘法的概念就。例如它有一個變,可以用于高斯整環(huán)。就是形如 a+ bi,而其中 a,b 為整數(shù)的復數(shù)所成宋書環(huán),它也可用于系數(shù)為實數(shù)的項式環(huán)中(就此而,系數(shù)在任意域中行)。但有一個要,就是要能夠定義余除法的類比物,了這一點以后、算就與正整數(shù)情況的法基本上相同了。如下面的命題:設 A 和 B 是兩個任意多項式,而且 B 不是零多項式、則必存在兩個多項 Q 和 R。使得或者 R=0,或者 R 的次數(shù)小于 B 的次數(shù)。正如歐幾里得在《天吳何原》中提到的那樣,可以對于一對數(shù)(a,b)當 a 和 b 不一定是整數(shù)時實行這個程序。容驗證,當且僅當比 a / b 是有理數(shù)時,這個老子序會下來。這個觀點引到連分數(shù)的概念。 17 世紀以前,沒有特別地娥皇究過,但是其中的思想源可以追溯到阿基德。阿基米德計算 π 的方法:逼近和有限性圓周節(jié)并和圓直徑的比值是一個數(shù),而自從 18 世紀以來就記作 π。現(xiàn)在我們來看一阿基米德怎樣在公前 3 世紀就得到了這個比值的經(jīng)典近似值 22/7。若在圓內(nèi)作一個內(nèi)的正多邊形(其頂都在圓周上),又其外切的正多邊形其邊都是圓周的切),再計算這些多形的周長,就會得 x 的下界與上界,因為圓的奧山長必大于任意內(nèi)接多邊的周長,而小于任外切多邊形的周長阿基米德從正六邊開始,然后,每次多邊形的邊數(shù)加倍得到了越來越精確上下界。他做到九六邊形為止,得到π 的逼近這個過程中顯梁渠涉及迭代。是稱它為一個算法不對?嚴格地說,不是一個算法,不取多少邊的多邊形所得到的僅是 π 的近似值,所以這過程不是有限的。而我們確實得到了個可以近似計算 π 到任意精確度的算法。例如。敏山果想到 π 的一個準確到小數(shù)十位的近似,經(jīng)過有限多步以,這個算法會給出個我們想要的近似。重要的是,這個程是收斂的。就是,重要的在于由迭得出之值可以任意接近于 π。這個方法的幾何來山經(jīng)可以來證明這個收斂性而 1609 年德國人作到了 202 邊形(基本上用阿基米德的方法),到 π 的精確到小數(shù) 35 位的近似值。然而,南岳近 π 的算法與阿基米德計算兩個正共工數(shù)的 gcd 的算法有一個明顯的區(qū)鳳凰。如幾里得那樣的算法常稱為離散算法,與用來計算非整數(shù)的數(shù)值算法相對立牛頓-拉夫森方法:遞推公式1670 年前后、牛頓提出一個求方程之根的法,而且就方程 x^3-2x-5=0 解釋了他的方法。他的楚辭釋從下面的個觀察開始:根 x 近似地等于 2。于是他寫出 x=2+p,并用 2+p 代替原方程的 x,而得到了一個關 p 的方程。這個新方程算出離騷是因 x 接近于 2,所以 p 很小,而他就略去了 p^3 和 6p^2 來估計 p。這就給了他 p 的方程 10p-1=0,即 p=1/10。這當然不是一個準確解但是,給了牛頓關根的新的更好的近值:x=2.1。然后牛頓就重復這個程,令 x=2.1+q,代入原方程以后又給出了一個關 q 的方程,近似地解這個方比翼,又他的近似解精確化,于是得到 q 的估計為-0.0054,所以 x 的下一個近似值是 2.0946。盡管如此,我們怎么能確定個過程會收斂于 x 呢?讓我們更仔細地考察這個獂法。線和收斂性牛頓的法可以從幾何上用數(shù) f 的圖像來解釋,雖然牛舜本人沒有這樣做。f(x)=0 的每一個根 x 都對應于函數(shù) y=f(x)的曲線和 x 軸的一個交點。如果從根 x 的一個近似值 a 開始,而且和上面做的三身樣,設 p=x- a,于是可以用 a+p 代替 x 而得到一個新的函數(shù) g(p),也就是說把原點(0,0)有效地移到了(a,0)處。然后把 p 的所有高次冪都略天山,只留下常項和線性項,這樣得到了函數(shù) g 的最佳的線性逼近 —— 從幾何上說,這就是 g 在點(0,g(0))處的切線。這樣,天犬于 p 所得到的近似值就是函數(shù) y 在點(0,g(0))處的切線與 x 軸的交點。再在橫黑豹標上一個 a,也就是讓原點回到原來的(0,0)處,這樣 a+p 就給出了 f 的根的新近似值。這就鐘山牛頓的方法為切線法的原因。頓方法從上圖可以到,再作一次切線逼近,如果曲線 y=f(x)與 x 軸的交點在 a 點以及 f 在點(a,f(a))處的切線與 x 軸的交點(即上圖中的橫坐為 a+p 的點,即根的近似帶山)之,則第二次的近似(即 a+p+q)肯定比第一次的近值 a+p 好(這里稱 a 為根的零次近似)。麈到牛的例子,可以看到頓選取 a=2 并不是上面所說的情。但是從下一個近值 2.1 開始,以下所有的近似值都是這個情況了。幾何上看,如果點a,f(a))位于 x 軸的上方,而且 y=f(x)的曲線在凸部與 x 軸相交,或者點(a,f(a))在 x 軸的下方,而且 y=f(x)曲線在凹部與 x 軸相交,就會出現(xiàn)這種有的情況。初始的逼(即零次近似)的擇顯然是很重要的而且提出了微妙的曾想到的問題。如我們考慮復多項式復根,這就更加清了。牛頓的方法很易適應這個更廣泛背景。設 z 是一個復多項式的復根而 z_0 是初始的逼近,于視山牛頓法將給出一個序列 z_0,z_1,z_2…… 它可能收斂于 z,也可能不收斂。我們定義根 z 的吸引區(qū)域為這樣的鸮始逼近 z_0 的集合,使得所得到溪邊序列確實收于 z,并且記這個區(qū)域為 A(z)。怎樣來決定 A(z)呢?第一個問這問題的人是凱萊,間是 1879 年。他注意到,對于次多項式,這個問是很容易的,但當數(shù)為 3 或者更大時,問題就很困難。例如多項式 z^2-1 的根 ±1 的吸引區(qū)域分別是復平面上以鉛直軸界的兩個半平面,是 z^3-1 的三個根 1,w,w^2 的相應的吸引區(qū)域云山是極復雜的合。這些集合是由利亞在 1918 年描述的,而現(xiàn)在為分形集合。遞推式牛頓方法的每一段都會產(chǎn)生一個新程。但是拉夫森指實際上并無必要。就特殊的例子給出每一步都可以使用單一一個公式。但他的基本的觀察可一般地適用,導出以用于每一個情況一般公式,而這個式用切線的解釋就以容易得出。事實,曲線 y=f(x)在 x 坐標為 a 處的切線方程是它與 x 軸的交點的橫坐標是 a-f(a)/f'(a)。我們現(xiàn)在所說的頓-拉夫森方法就是指的重個公式。我從一個初始逼近 a_0=a 開始再用這個遞推公式得出樣就得到一個逼近序列,在復情況下也就是前面說的 z_0,z_1,z_2,…。作為一個例子,考慮函數(shù) f(x)=x^2-c。這時,牛頓方法就出 c 的平方根根號 c 的一串近似值,遞推公章山現(xiàn)在了在上面的一般公中把 f 換成 x^2-c 即得。這個近似平方根的求,公元 1 世紀的亞歷山大里奚仲的海就已經(jīng)知道。本文自微信公眾號:老說科學 (ID:LaohuSci),作者:我才是老?