朱光潛《談美書簡》讀書筆記10篇
朱光潛《談美書簡》讀書筆記1
這是朱光潛先生在83歲高齡寫給青年的美學(xué)入門讀物《談美書簡》。朱光潛先生是*現(xiàn)代美學(xué)的**人物,是開拓者和創(chuàng)新者,在美學(xué)領(lǐng)域是全國的權(quán)威,他主張美是主觀性與客觀性的**。他運(yùn)用*****的觀點(diǎn)來闡明了美和美感的規(guī)律、美范疇等一系列問題。
在前言中,朱光潛告訴我們?cè)鯓訉W(xué)美學(xué),但我認(rèn)為更重要的在于,他對(duì)我們?nèi)松^的引導(dǎo),如在前言中朱光潛寫到“正路并不一定是一條**坦坦的直路,難免有些曲折和崎嶇險(xiǎn)阻,要繞一些彎,甚至難免誤入歧途。哪個(gè)重要的科學(xué)實(shí)驗(yàn)一次就能成功呢?“失敗者成功之母”。失敗的教訓(xùn)一般比成功的經(jīng)驗(yàn)更有益”……這些都呈現(xiàn)出一種積極的人生態(tài)度。
什么是美?這是一個(gè)很基本的問題,但毫無意外地,我們大多數(shù)人并不知道它的確切答案。其實(shí)從另一個(gè)方面來說,美并沒有一個(gè)具體的標(biāo)準(zhǔn),每個(gè)人對(duì)于美都有不同的定義。在《談美書簡》中,朱光潛先生給了我們一個(gè)答案,雖然這個(gè)答案不一定正確,但至少比毫無頭緒要高明許多。
許多人都認(rèn)為,看過去舒服的就是美的,也許更深一層,會(huì)說心靈美也是一種美。但所有的這些都比較淺顯的,而深入研究,又是望塵莫及的事了。通常我們對(duì)于美、美感、美的規(guī)律、美的范疇等等這些問題感到很深?yuàn)W,也研究甚少,關(guān)于這些問題,朱光潛先生在此書中都一并回復(fù)了,而且回復(fù)的很詳盡,對(duì)于思想,文學(xué),方法,理論等等也有詳細(xì)的陳述。對(duì)于美,我們看到的都是片面的,也可以說是表面的,而看完這本書,我對(duì)于美則有了全新的看法,這也是讀此書的收獲吧。
朱光潛《談美書簡》讀書筆記2
讀完《談美書簡》總體感覺就是稀里糊涂,包含了各種不明白。留下鮮明印象的很少而且也模模糊糊的記不清楚,也許是這本書的內(nèi)容本身就很乏味或者專業(yè)性很強(qiáng),雖然作者也竭力寫得明白清楚而不是趣味,最好能達(dá)到“深入淺出”的目的。但就我本身而言,一個(gè)從為看過聽過“美學(xué)”,壓根不知道有美學(xué)存在的人,突然讀到一本美學(xué)大師談美學(xué)的書,總覺得有些唐突,甚至是不知如何是好,難以應(yīng)付。
可以做個(gè)比喻來形象的詮釋我的感覺。
看這本書,就像看T臺(tái)秀一樣。看著各種各樣想盡辦法創(chuàng)新的時(shí)裝,卻得不償失的讓人看到另類的搞怪,難以接受。但當(dāng)你知道這是一位知名大師嘔心瀝血的作品,你就會(huì)按奈住自己的煩躁,耐心品位,試圖找到一點(diǎn)可以看的過去的地方。但當(dāng)你發(fā)現(xiàn)這樣也是徒勞的時(shí)候,你又看到別人對(duì)這些設(shè)計(jì)贊不絕口,你便會(huì)心生疑惑,不得不從其他方面來尋找樂趣以作消遣。
于是你便會(huì)將***轉(zhuǎn)到主體的龐雜部分,比如你會(huì)欣賞模特的妝容、身材、造型,或者聆聽秀場的音樂,或者研究T臺(tái)的設(shè)計(jì)。總之,你會(huì)找到主體以外出彩的地方,以便使自己感到欣慰,沒有白白的浪費(fèi)時(shí)間,但卻忽略了作品本身的內(nèi)容。
讀它,需要靜心,在一大堆晦澀難懂的文字中,努力的想尋找到一點(diǎn)能讀懂的,能理解作者觀點(diǎn)的,但往往是努力與收獲不成正比。
和服裝***類似,作者也努力的'想做到使文章通俗易懂,但卻收效甚微。至少作為萬千讀者之一的我,確實(shí)是在還沒弄明白是怎么一回事的情況下就讀完了,只留下一些模糊的對(duì)美學(xué)的認(rèn)知。當(dāng)然,這也不能全怪作者;蛟S是內(nèi)容涉及知識(shí)面太廣,含蓋內(nèi)容太多,這就對(duì)我像我一樣知識(shí)面狹窄的讀者造成了很多的捆擾。這個(gè)問題,即使作者再怎樣神通廣大也解釋不清楚。比如,書中常提到的***、*的著作,我根本就沒接觸過,試問,我又怎能理解透徹呢?所以,我還是要多讀書,多涉獵些不同領(lǐng)域的知識(shí),也許這樣,便可以理解此書的內(nèi)容。
正如看T臺(tái)一樣,如果我看不出精彩的,無法理解晦澀難懂的內(nèi)容,我就會(huì)從其他細(xì)節(jié)方面來尋找這本書的精彩,好鼓勵(lì)我繼續(xù)讀下去。作者朱光潛先生,是一位民族責(zé)任感很強(qiáng)的人,他對(duì)社會(huì)學(xué)風(fēng)很是憂慮,也不斷鼓勵(lì)年輕人去打破禁區(qū),為文壇帶來清風(fēng)。他也確實(shí)是個(gè)“老實(shí)人”經(jīng)常自我反省,不斷思考,不斷改正,不斷進(jìn)步。他這種務(wù)實(shí)的科研精神,是他的思想精華,也是這本書的精華。而且,作者在這本書中一直流露出的是謙虛,謹(jǐn)慎的態(tài)度。
他的文字也給人一種親切的感覺,并沒有拘人與千里之外的意外,這也是朱光潛先生與其他一些咬文嚼字,拿理論拘人與外,讓人心生畏懼的學(xué)者的最大不同,這才是真正有學(xué)識(shí)的表現(xiàn)!拔ㄓ衅焚|(zhì)好的人才能寫出好書才能寫出好書”。所以,從這點(diǎn)上來說這本書也有它的可貴之處。
對(duì)于這本書,我沒有讀懂,所以,也不敢枉加評(píng)論。只希望以此來記錄下讀它的心情,也算是一種紀(jì)念吧。
朱光潛《談美書簡》讀書筆記3
什么是“美”?用莎翁的話說:“這是一個(gè)問題!
但毫無疑問,沒有人知道答案,包括歷史**何時(shí)期的任何一位大師。他們耗盡畢生的精力也只是在人類對(duì)美的認(rèn)知史上留下了自己的見解,但卻從未揭開“美”的面紗。其實(shí)在我看來,“美”并沒有一個(gè)具體的標(biāo)準(zhǔn),因?yàn)楹苌贂?huì)有人對(duì)美的認(rèn)知完全相同。也就是說,“美”是無定義的。在《談美書簡》中,朱光潛先生引用了他的一位“老朋友”(我懷疑是作者本人)給“美”下的定義,并對(duì)其刻板和迂腐進(jìn)行了深刻的批判。從這里我們不難看出,朱光潛先生也是反對(duì)套用空洞的抽象概念去給“美”鑄一座密不透風(fēng)的牢籠的。
在朱光潛先生看來“人是審美的主體,人在改造客觀世界時(shí)也改造了人本身,人在審美中具有最高的意義,美離不開人!蓖瑫r(shí),美也是屬于社會(huì)價(jià)值范疇,它的適用主體是人。這便是說我們要去認(rèn)識(shí)美。
那么我們?cè)撊绾握J(rèn)識(shí)美呢?我的觀點(diǎn)是:不需要定義,只需要感受。
但在感受美的過程中,我們要找到正確的'方法。在這一點(diǎn)上,朱光潛先生給了我們十分重要的提示,那便是既要把握對(duì)“美”的理性認(rèn)識(shí),又要注重對(duì)“美”感性認(rèn)識(shí)。我認(rèn)為美是客觀存在的,但我們決不能只強(qiáng)調(diào)美的客觀性而將審美與人的思考力、情感與意識(shí)割裂**。審美活動(dòng)應(yīng)是一種實(shí)踐活動(dòng),同時(shí)因?yàn)樗哂心康男圆⑶遗c人類的情感息息相關(guān),所以審美必然要從主觀與客觀兩個(gè)角度去進(jìn)行。否則,就如“形而上學(xué)”一樣,以孤立、靜止、片面的觀點(diǎn)認(rèn)識(shí)世界,認(rèn)為一切事物都是孤立的,永遠(yuǎn)不變的。這顯然與主客觀結(jié)合的審美以及感性與理性的*衡相矛盾。認(rèn)識(shí)美和感受美一方面要求我們學(xué)習(xí)一些美學(xué)知識(shí),另一方面我們也要注重審美實(shí)踐,多去參加各種藝術(shù)展覽,多與他人交流自己對(duì)美的看法。在審美的過程中,探求美的真諦未必是我們最終的追求,但享受這個(gè)美妙的過程卻是我們每個(gè)人都必不可少的經(jīng)驗(yàn)。
而對(duì)于《談美書簡》這本書,朱光潛先生以耐心的口吻,以一位**的身份用信件的方式,將自己*生對(duì)美學(xué)感悟向我們娓娓道來,并對(duì)一些重要而關(guān)鍵的問題向美學(xué)的入門者們進(jìn)行了深入的探討。因而這本書相比較其他美學(xué)著作易懂。他在美學(xué)問題上對(duì)我們的幫助不僅是思想上的,也是方法上的。
朱光潛《談美書簡》讀書筆記4
"美是到處都有的,對(duì)于我們的眼睛,不是缺少美,而是缺少發(fā)現(xiàn)。"——羅丹
我們?cè)谶M(jìn)行藝術(shù)教育時(shí),常常想的是如何在教授一些美學(xué)知識(shí)、規(guī)律等的同時(shí),逐漸培養(yǎng)學(xué)生擁有一雙發(fā)現(xiàn)美的眼睛,進(jìn)而敞開心胸地感受美、靈動(dòng)地創(chuàng)造美。
其實(shí),作為教師,在認(rèn)識(shí)學(xué)生方面何嘗不需要擁有一雙發(fā)現(xiàn)美的眼睛呢。
朱光潛先生在《談美書簡》中曾舉過一個(gè)例子:對(duì)于園里那一棵古松,在木材商、植物學(xué)家和畫家眼里,卻是三種不同的東西――在木材商看來,它不過是一棵做某事價(jià)值多少錢的木料;在植物學(xué)家眼里,它是一棵葉為針狀、果為球狀、四季常青的顯花植物;然而畫家卻認(rèn)為它是一棵蒼翠挺拔的古樹。接下來三個(gè)人的反應(yīng)態(tài)度也不一致,木材商在心里盤算它是宜于架屋或是制器,思量怎樣去買它、砍它、運(yùn)它;植物學(xué)家馬上就會(huì)想到要把它歸到某類某科里去,注意它和其他松樹的異點(diǎn),思量它何以活得這樣老;而畫家卻只是在聚精會(huì)神地觀賞它的蒼翠的顏色,它的盤屈如龍蛇的線紋以及它的昂然高舉、不受屈撓的氣概。
我贊同三者眼中對(duì)古松的不同狀態(tài)和不同定位,我更推崇把三者的視角進(jìn)行綜合,更多方位、更多角度地去審視、去構(gòu)思、去塑造眼前的事物。就如我們作為教師,可以如植物學(xué)家一般根據(jù)學(xué)生的生活環(huán)境、學(xué)習(xí)現(xiàn)狀等去判斷學(xué)生的優(yōu)勢與不足,分析其成因;如畫家般去感受學(xué)生的個(gè)性、體味學(xué)生的品格和趣味、挖掘?qū)W生不被他人察覺的閃光點(diǎn);如木材商那樣規(guī)劃學(xué)生的前途、思忖學(xué)生的發(fā)展方向、培養(yǎng)目標(biāo)。那樣,不同的學(xué)生才真正地在教師的眼中鮮活起來、立體起來。我們?cè)谶M(jìn)行教育教學(xué)的同時(shí),才能真正地本著"關(guān)愛學(xué)生"的原則開展與實(shí)施。
就如,有的教師能針對(duì)不同學(xué)生的優(yōu)勢或特長,安排相對(duì)應(yīng)的工作,使得學(xué)生不斷地樹立自信心,轉(zhuǎn)而在其他方面也有座提高。又如:我們?cè)诮虒W(xué)活動(dòng)的設(shè)計(jì)過程中,要盡量多的給予學(xué)生嘗試、鍛煉、討論、交流等活動(dòng),讓學(xué)生從不同的活動(dòng)中展示自己,讓教師全方位地了解學(xué)生,發(fā)現(xiàn)學(xué)生多樣的"美";再針對(duì)學(xué)生的特點(diǎn),也可以量身定做地安排一些學(xué)習(xí)活動(dòng),使學(xué)生更積極地參與學(xué)習(xí),獲得更多的學(xué)習(xí)方法。在我的教學(xué)實(shí)踐過程中,曾嘗試過多種形式的師生合作示范:僅在語言上進(jìn)行交流;在繪畫方面進(jìn)行合作;綜合語言交流與繪畫合作等等。不論哪一種形式,學(xué)生在參與教師示范的過程中,都能積極開動(dòng)腦筋,主動(dòng)思維,大膽地發(fā)表著自己的見解與想法。許多想法由于學(xué)生間的差異,會(huì)形成教師也想不到的奇思妙想,從而迸發(fā)與碰撞出更精妙的思維的火花,學(xué)生們的個(gè)性因此而得到張揚(yáng),學(xué)生的生命在教師的呵護(hù)與培養(yǎng)中得到發(fā)展。
師生的共同示范中,學(xué)生亦在教師的配合下,樂于多方面、多角度地思維;在教師的鼓勵(lì)下,更投入地更專注地進(jìn)行創(chuàng)作與表現(xiàn),使得美術(shù)課堂中的示范環(huán)節(jié)也成為了提高學(xué)生生命的質(zhì)量,滿足學(xué)生心智成長需要,促進(jìn)學(xué)生生命價(jià)值體現(xiàn)的一個(gè)良好途徑。
只有熱愛生活,才會(huì)享受人生,才能活出精彩,因?yàn)樯钪胁⒉蝗鄙倜,缺少的是發(fā)現(xiàn)美的眼睛。教師要善于發(fā)現(xiàn)學(xué)生的美,為他們搭建更多展示美的舞臺(tái),他們的美才能逐漸累積、融合、幻化出更耀眼的光彩。
《談美書簡》采用書信體形式,娓娓道來,作為啟蒙式的書籍,將許多深?yuàn)W的美學(xué)知識(shí)通俗化,親切自然。是*現(xiàn)代美學(xué)家朱光潛在八十二歲高齡的情況下寫就的"暮年心血"之作,既是朱老對(duì)自己漫長美學(xué)生涯和美學(xué)思想的一次回顧和整理,也是"給來信未復(fù)的朋友們",尤其是青年朋友們的一次回復(fù)。
從書中還可以看出朱老很關(guān)心民族、國家的現(xiàn)實(shí)與命運(yùn),尤其關(guān)心青年在現(xiàn)實(shí)中的為人處世和道德修養(yǎng),每位讀者只有靜下心來,細(xì)細(xì)地品味與思考,才能領(lǐng)會(huì)作者的深層思想。
朱老在書中主張的是要積極地投入現(xiàn)實(shí)生活,而不能逃避人生,同時(shí)又要以一種審美的心態(tài)去面對(duì)現(xiàn)實(shí)生活,這樣才能給現(xiàn)實(shí)人生增添美好的色彩。在當(dāng)今競爭激烈的社會(huì)環(huán)境、繁忙緊張的工作氛圍中,我們也不妨借用朱老提倡的生活態(tài)度,才能更主動(dòng)、積極地投入工作,才能以審美的眼光去了解與發(fā)現(xiàn)每一位學(xué)生,才能放松地思維、進(jìn)行發(fā)散性思維,在新的教育**大潮中有所創(chuàng)新,有所進(jìn)步。
朱光潛《談美書簡》讀書筆記5
什么是“美”?用莎翁的話說:“這是一個(gè)問題!
但毫無疑問,沒有人知道答案,包括歷史**何時(shí)期的任何一位大師。他們耗盡畢生的精力也只是在人類對(duì)美的認(rèn)知史上留下了自己的見解,但卻從未揭開“美”的面紗。其實(shí)在我看來,“美”并沒有一個(gè)具體的標(biāo)準(zhǔn),因?yàn)楹苌贂?huì)有人對(duì)美的認(rèn)知完全相同。也就是說,“美”是無定義的。在《談美書簡》中,朱光潛先生引用了他的一位“老朋友”(我懷疑是作者本人)給“美”下的定義,并對(duì)其刻板和迂腐進(jìn)行了深刻的批判。從這里我們不難看出,朱光潛先生也是反對(duì)套用空洞的抽象概念去給“美”鑄一座密不透風(fēng)的牢籠的。
在朱光潛先生看來“人是審美的主體,人在改造客觀世界時(shí)也改造了人本身,人在審美中具有最高的意義,美離不開人!蓖瑫r(shí),美也是屬于社會(huì)價(jià)值范疇,它的適用主體是人。這便是說我們要去認(rèn)識(shí)美。
那么我們?cè)撊绾握J(rèn)識(shí)美呢?我的觀點(diǎn)是:不需要定義,只需要感受。
但在感受美的過程中,我們要找到正確的方法。在這一點(diǎn)上,朱光潛先生給了我們十分重要的提示,那便是既要把握對(duì)“美”的理性認(rèn)識(shí),又要注重對(duì)“美”感性認(rèn)識(shí)。我認(rèn)為美是客觀存在的,但我們決不能只強(qiáng)調(diào)美的客觀性而將審美與人的思考力、情感與意識(shí)割裂**。審美活動(dòng)應(yīng)是一種實(shí)踐活動(dòng),同時(shí)因?yàn)樗哂心康男圆⑶遗c人類的情感息息相關(guān),所以審美必然要從主觀與客觀兩個(gè)角度去進(jìn)行。否則,就如“形而上學(xué)”一樣,以孤立、靜止、片面的觀點(diǎn)認(rèn)識(shí)世界,認(rèn)為一切事物都是孤立的,永遠(yuǎn)不變的。這顯然與主客觀結(jié)合的審美以及感性與理性的*衡相矛盾。認(rèn)識(shí)美和感受美一方面要求我們學(xué)習(xí)一些美學(xué)知識(shí),另一方面我們也要注重審美實(shí)踐,多去參加各種藝術(shù)展覽,多與他人交流自己對(duì)美的看法。在審美的過程中,探求美的真諦未必是我們最終的追求,但享受這個(gè)美妙的過程卻是我們每個(gè)人都必不可少的經(jīng)驗(yàn)。
而對(duì)于《談美書簡》這本書,朱光潛先生以耐心的口吻,以一位**的身份用信件的方式,將自己*生對(duì)美學(xué)感悟向我們娓娓道來,并對(duì)一些重要而關(guān)鍵的問題向美學(xué)的入門者們進(jìn)行了深入的探討。因而這本書相比較其他美學(xué)著作易懂。他在美學(xué)問題上對(duì)我們的幫助不僅是思想上的,也是方法上的。
朱光潛《談美書簡》讀書筆記6
"美是到處都有的,對(duì)于我們的眼睛,不是缺少美,而是缺少發(fā)現(xiàn)。"——羅丹
我們?cè)谶M(jìn)行藝術(shù)教育時(shí),常常想的是如何在教授一些美學(xué)知識(shí)、規(guī)律等的同時(shí),逐漸培養(yǎng)學(xué)生擁有一雙發(fā)現(xiàn)美的眼睛,進(jìn)而敞開心胸地感受美、靈動(dòng)地創(chuàng)造美。
其實(shí),作為教師,在認(rèn)識(shí)學(xué)生方面何嘗不需要擁有一雙發(fā)現(xiàn)美的眼睛呢。
朱光潛先生在《談美書簡》中曾舉過一個(gè)例子:對(duì)于園里那一棵古松,在木材商、植物學(xué)家和畫家眼里,卻是三種不同的東西――在木材商看來,它不過是一棵做某事價(jià)值多少錢的木料;在植物學(xué)家眼里,它是一棵葉為針狀、果為球狀、四季常青的顯花植物;然而畫家卻認(rèn)為它是一棵蒼翠挺拔的古樹。接下來三個(gè)人的反應(yīng)態(tài)度也不一致――木材商在心里盤算它是宜于架屋或是制器,思量怎樣去買它、砍它、運(yùn)它;植物學(xué)家馬上就會(huì)想到要把它歸到某類某科里去,注意它和其他松樹的異點(diǎn),思量它何以活得這樣老;而畫家卻只是在聚精會(huì)神地觀賞它的蒼翠的顏色,它的盤屈如龍蛇的線紋以及它的昂然高舉、不受屈撓的氣概。
我贊同三者眼中對(duì)古松的不同狀態(tài)和不同定位,我更推崇把三者的視角進(jìn)行綜合,更多方位、更多角度地去審視、去構(gòu)思、去塑造眼前的事物。就如我們作為教師,可以如植物學(xué)家一般根據(jù)學(xué)生的生活環(huán)境、學(xué)習(xí)現(xiàn)狀等去判斷學(xué)生的優(yōu)勢與不足,分析其成因;如畫家般去感受學(xué)生的個(gè)性、體味學(xué)生的品格和趣味、挖掘?qū)W生不被他人察覺的閃光點(diǎn);如木材商那樣規(guī)劃學(xué)生的前途、思忖學(xué)生的發(fā)展方向、培養(yǎng)目標(biāo)。那樣,不同的學(xué)生才真正地在教師的眼中鮮活起來、立體起來。我們?cè)谶M(jìn)行教育教學(xué)的同時(shí),才能真正地本著"關(guān)愛學(xué)生"的原則開展與實(shí)施。
就如,有的教師能針對(duì)不同學(xué)生的優(yōu)勢或特長,安排相對(duì)應(yīng)的工作,使得學(xué)生不斷地樹立自信心,轉(zhuǎn)而在其他方面也有座提高。又如:我們?cè)诮虒W(xué)活動(dòng)的設(shè)計(jì)過程中,要盡量多的給予學(xué)生嘗試、鍛煉、討論、交流等活動(dòng),讓學(xué)生從不同的活動(dòng)中展示自己,讓教師全方位地了解學(xué)生,發(fā)現(xiàn)學(xué)生多樣的"美";再針對(duì)學(xué)生的特點(diǎn),也可以量身定做地安排一些學(xué)習(xí)活動(dòng),使學(xué)生更積極地參與學(xué)習(xí),獲得更多的學(xué)習(xí)方法。在我的教學(xué)實(shí)踐過程中,曾嘗試過多種形式的師生合作示范:僅在語言上進(jìn)行交流;在繪畫方面進(jìn)行合作;綜合語言交流與繪畫合作等等。不論哪一種形式,學(xué)生在參與教師示范的過程中,都能積極開動(dòng)腦筋,主動(dòng)思維,大膽地發(fā)表著自己的見解與想法。許多想法由于學(xué)生間的差異,會(huì)形成教師也想不到的奇思妙想,從而迸發(fā)與碰撞出更精妙的思維的火花,學(xué)生們的個(gè)性因此而得到張揚(yáng),學(xué)生的生命在教師的呵護(hù)與培養(yǎng)中得到發(fā)展。
師生的共同示范中,學(xué)生亦在教師的配合下,樂于多方面、多角度地思維;在教師的鼓勵(lì)下,更投入地更專注地進(jìn)行創(chuàng)作與表現(xiàn),使得美術(shù)課堂中的示范環(huán)節(jié)也成為了提高學(xué)生生命的質(zhì)量,滿足學(xué)生心智成長需要,促進(jìn)學(xué)生生命價(jià)值體現(xiàn)的一個(gè)良好途徑。
只有熱愛生活,才會(huì)享受人生,才能活出精彩,因?yàn)樯钪胁⒉蝗鄙倜,缺少的是發(fā)現(xiàn)美的眼睛。教師要善于發(fā)現(xiàn)學(xué)生的美,為他們搭建更多展示美的舞臺(tái),他們的美才能逐漸累積、融合、幻化出更耀眼的光彩。
《談美書簡》采用書信體形式,娓娓道來,作為啟蒙式的書籍,將許多深?yuàn)W的美學(xué)知識(shí)通俗化,親切自然。是*現(xiàn)代美學(xué)家朱光潛在八十二歲高齡的情況下寫就的"暮年心血"之作,既是朱老對(duì)自己漫長美學(xué)生涯和美學(xué)思想的一次回顧和整理,也是"給來信未復(fù)的朋友們",尤其是青年朋友們的一次回復(fù)。
從書中還可以看出朱老很關(guān)心民族、國家的現(xiàn)實(shí)與命運(yùn),尤其關(guān)心青年在現(xiàn)實(shí)中的為人處世和道德修養(yǎng),每位讀者只有靜下心來,細(xì)細(xì)地品味與思考,才能領(lǐng)會(huì)作者的深層思想。
朱老在書中主張的是要積極地投入現(xiàn)實(shí)生活,而不能逃避人生,同時(shí)又要以一種審美的心態(tài)去面對(duì)現(xiàn)實(shí)生活,這樣才能給現(xiàn)實(shí)人生增添美好的色彩。在當(dāng)今競爭激烈的社會(huì)環(huán)境、繁忙緊張的工作氛圍中,我們也不妨借用朱老提倡的生活態(tài)度,才能更主動(dòng)、積極地投入工作,才能以審美的眼光去了解與發(fā)現(xiàn)每一位學(xué)生,才能放松地思維、進(jìn)行發(fā)散性思維,在新的教育**大潮中有所創(chuàng)新,有所進(jìn)步。
朱光潛《談美書簡》讀書筆記7
《談美書簡》一文中,作者比力詳細(xì)、完整地解說了在文學(xué)與戲劇作品中人物與情況的關(guān)系。他起首回顧了這一實(shí)際孕育發(fā)生與生長的汗青,進(jìn)而指出,典范人物是可以或許表現(xiàn)社會(huì)汗青生長的某些紀(jì)律而且具有鮮明個(gè)性特點(diǎn)的人物抽象,而典范情況則是典范人物所處的可以或許反應(yīng)社會(huì)汗青生長現(xiàn)狀和趨向的詳細(xì)情景和配景。典范人物應(yīng)生存在典范情況中,而不能與情況相脫節(jié)。在這里,共性是經(jīng)過個(gè)性來表現(xiàn)的,是在特別中顯示一樣*常。文學(xué)之以是能在偶然性中見出一定性,是與再現(xiàn)“典范情況中的典范人物”這一實(shí)際分不開的。
固然此書不是一本完整的美學(xué)著作,卻也從一些很重要很關(guān)鍵的角度對(duì)美學(xué)的入門者的問題進(jìn)行了解答,而且在很多方面都很有資助。
類似如許的例子另有許多,在此也就紛歧一詳談了。
朱光潛先生信奉“三此**”,即此身,此時(shí),此地:“此身應(yīng)該做而且可以或許做的事,就得由此身擔(dān)當(dāng)起,不推委給旁人!薄按藭r(shí)應(yīng)該做而且可以或許做的事,就該在此時(shí)做,不拖延到未來。美的歷程讀后感”“此地(我的職位地方、我的情況)應(yīng)該做而且可以或許做的事,就得在此地做,不推委到想象中另一職位地方去做。”這是朱光潛先生不尚空談,腳踏實(shí)地的治學(xué)精力的表現(xiàn)。這很值得我們青少年去學(xué)習(xí)。
《談美書函》不是一樣*常的高頭講章,它接納書信體的情勢,娓娓道來,親切自然,將許多深?yuàn)W的美學(xué)知識(shí)普通化。
《談美書函》是作者在八十二歲高齡的情況下寫就的“老年末年心血”之作,它既是對(duì)本身漫長美門生活和美學(xué)頭腦的一次回顧和整理,也是“給來信未復(fù)的朋友們”,尤其是青年朋友們的一次復(fù)興。賣火柴小女孩讀后感全書由十三封書信結(jié)集而成。書中,朱光潛先生就青年朋友們普遍體貼的美和美感、美的紀(jì)律、美的領(lǐng)域等一系列美學(xué)問題進(jìn)行了深化的探討,同時(shí)也對(duì)文學(xué)的審美特性、文學(xué)的創(chuàng)作紀(jì)律及特點(diǎn)作了詳盡的闡釋,既是頭腦上的,又是要領(lǐng)上的,是初涉美學(xué)者學(xué)習(xí)美學(xué)知識(shí)的重要參考冊(cè)本。
八十二歲的高齡仍舊著書立說,對(duì)美學(xué)頭腦回顧和整理,給青年朋友們復(fù)興,體貼美學(xué)教誨,這是何等的學(xué)者風(fēng)范和社會(huì)責(zé)任感!
朱光潛《談美書簡》讀書筆記8
從本質(zhì)上講,我喜歡讀書,喜歡與文字有關(guān)的一切,但是我卻是一個(gè)懶于思考的人,更多的是一個(gè)被動(dòng)的接受者的角色,已經(jīng)開始讀研了,不論現(xiàn)在的研究生有多水,擴(kuò)招有多么厲害,我想我都應(yīng)該做一些該做的事情,認(rèn)真踏實(shí)的盡自己所能做一個(gè)合格的學(xué)生。開學(xué)了,沒有以往的興奮和新奇,心里更多了一份沉甸甸的責(zé)任,只希望不辜負(fù)所有人的熱切期盼,不辜負(fù)自己心中的信仰。開始認(rèn)真的讀書思考。
最近,讀了朱光潛先生的《文藝心理學(xué)》,驚嘆于先生那融貫中西的學(xué)識(shí)和過人的思考能力,對(duì)自己頗有啟發(fā)。朱光潛先生在研究文藝美學(xué)之時(shí),將**的文藝美學(xué)思想和*古典的美學(xué)思想融會(huì)貫通,并提出了自己獨(dú)具一格的美學(xué)思想,對(duì)我國現(xiàn)代當(dāng)?shù)拿缹W(xué)研究提供了寶貴的思想資源和思維方式,朱光潛先生的美學(xué)思想深受意大利美學(xué)家克羅齊的影響。但是不同于克羅齊的文藝心理學(xué)的研究,朱光潛先生更是把視野放在了文藝活動(dòng)這個(gè)大框架來進(jìn)行文藝美學(xué)的研究,其中朱光潛先生提到文藝活動(dòng)不僅僅是心靈的瞬間感受,是形象的直覺,文藝活動(dòng)過程從直覺到傳達(dá)才是一個(gè)階段的完成,而文藝的傳達(dá)活動(dòng)更是藝術(shù)家區(qū)別于普通人,優(yōu)秀藝術(shù)家區(qū)別于一般藝術(shù)家的不同之處。文藝的傳達(dá)有賴于藝術(shù)家的匠心獨(dú)運(yùn),更和日常的學(xué)習(xí)密不可分。
藝術(shù)家除了要有不同于常人的形象的直覺之外,還需掌握以下知識(shí):一是掌握有關(guān)媒介的知識(shí),二是模仿傳達(dá)的技巧,三是作品的錘煉。藝術(shù)家所進(jìn)行的模仿傳達(dá),實(shí)際就是藝術(shù)家的勤學(xué)苦練的過程,藝術(shù)家勤于練習(xí)才會(huì)形成相關(guān)的模仿習(xí)慣,下筆時(shí)才會(huì)水到渠成。而這模仿習(xí)慣,在朱光潛先生看來主要是模仿筋肉技巧,每種藝術(shù)都有其特殊的筋肉技巧,如寫字、繪畫、雕刻、圖畫、彈琴都要有手腕上的技巧;唱歌、演戲、吹簫、說話都要有喉舌上的技巧,跳舞要有全身筋肉的技巧,詩文的創(chuàng)作也需練習(xí)筋肉的技巧,古人所言的“文以氣為主”,這氣就是一種肌肉的技巧。
這是我頗為關(guān)注的地方,文藝活動(dòng)中的傳達(dá)過程竟和人體的筋肉活動(dòng)有著密切的聯(lián)系,而這些聯(lián)系是如何發(fā)生的,在現(xiàn)實(shí)生活中是否有可解釋的地方,我還需要進(jìn)一步的拜讀作品,才能了解朱先生的文藝思想,讀書之少,導(dǎo)致所思之淺,現(xiàn)在彌補(bǔ)也許為時(shí)不晚。加油吧!
朱光潛《談美書簡》讀書筆記9
《談美書簡》,是朱光潛先生一部談美學(xué)的論著。朱光潛先生在美學(xué)界的造詣這里無需過多贅述,他是我國研究美學(xué)的始祖,一代美學(xué)大師。通讀完后,首先的感覺是朱先生知識(shí)的淵博,旁征博引,學(xué)貫中西。在他的書中,古今中外的文獻(xiàn)引用得極多,而且所引用的英法德等國關(guān)于美的論述都是他最早翻譯過來的。
其實(shí)粗讀一篇,我真沒有弄明白到底什么是美。雖然他通篇都在介紹什么是美,從心理學(xué)角度、從哲學(xué)角度、從自然科學(xué)角度去研究、論證美的本質(zhì)意義。但是我讀的還是一頭霧水,因?yàn)橹煜壬乃枷胧悄敲吹纳铄;眼光是那么犀利;觀點(diǎn)是那么獨(dú)到。都說讀書就是讀者和作者心與心的交流,我只覺得朱先生穿著一身長馬褂,在某個(gè)黃昏的清風(fēng)中,向我娓娓道來,像一切得道智者一樣,他持才并不傲物,從容淡泊,虛懷若谷。對(duì)我而言,朱先生只能用“高山仰止,景行行止”來形容了。
那么,到底是什么美?
什么是美?朱光潛先生并沒有給出明確的定義。對(duì)于一個(gè)嚴(yán)謹(jǐn)?shù)目茖W(xué)研究者或者說是理論研究者,簡單草率地定義某種事物,總不免會(huì)把讀者引入歧途甚至?xí)Υ蠓健ト巳绨乩瓐D也曾犯下把人定義成沒有羽毛動(dòng)物的錯(cuò)誤,留下了千古笑柄。美不完全是事物的屬性,不能科學(xué)定性地定義。譬如我們說水,這是可以嚴(yán)格定義的,凡是由2個(gè)氫原子和1個(gè)氧原子化合而成的物質(zhì)就是水,這個(gè)不會(huì)因?yàn)椴煌擞胁煌捶ǘ淖儭?/p>
然而我們很多人對(duì)美的定義其實(shí)都是成為美的條件,我們說腳長的女人比腳短的女人要美,對(duì)稱的比散亂的要美,但這都是成為美的條件,但具備這些條件的不一定就是美。正如空氣含有水分是雨的條件,但空氣中的水分卻不是雨。因此有人問圣·奧古斯。骸笆裁词菚r(shí)間?”,他回答:“你不問我,我本來很清楚地知道他是什么,你問我,我倒覺得茫然了”。
美不能定義,又不是事物固有的屬性,那就沒有研究價(jià)值了嗎?朱先生告訴我們,美其實(shí)在某種程度上也是事物屬性,當(dāng)我們見到美的事物時(shí),大多數(shù)人還是會(huì)覺得那是美的。但是研究判別美,不僅要在物本身著眼,同時(shí)還要著重觀賞者在所觀賞物中見到的價(jià)值去研究。通俗一點(diǎn)講,就是美不僅在物,而且在心,在物為刺激,在心為感受。世界上沒有天生自在,俯首即拾的美,凡是美都要經(jīng)過心靈的創(chuàng)造,所以美學(xué)研究的理論,不僅要講藝術(shù),而且要講心理。作者用了十七章的篇幅在講美,我才疏學(xué)淺,讀了多遍亦只是管中窺豹,不能全面真正理解作者所闡述的理論。剛看到這本書的時(shí)候,我和大多數(shù)人一樣都有一個(gè)疑問,自已認(rèn)為美就是美,了解那么多有意義嗎?
那么,為什么要研究美?
現(xiàn)實(shí)生活中,我們每個(gè)人都攀登過山,游玩過水,欣賞過畫,背頌過詩文,當(dāng)我們發(fā)現(xiàn)某處景色讓我們心情愉悅時(shí),我們會(huì)說,這里真美;當(dāng)我們讀到某處詩文讓我們身臨其近時(shí),我們會(huì)說這首詩真美;當(dāng)我們讀到某篇文章讓我們長期心靈的桎梏、精神的困頓豁然開朗的.時(shí)候,我們會(huì)說這篇文章真美。我們?cè)谡f美的時(shí)候,其實(shí)都只是一個(gè)隨性的判斷,靠得是自己粗疏的經(jīng)驗(yàn),至于為什么會(huì)覺得美,我們都沒有意識(shí)進(jìn)行仔細(xì)的考量。我們要欣賞、判斷美,其實(shí)是不能離開理論支撐的。如果我們沒有決定怎么才是美,就沒有理由說這幅畫比那幅畫更美;如果我們沒有明白藝術(shù)的本質(zhì),就沒有理由說這件是藝術(shù)品,那件作品不是藝術(shù)品。只有當(dāng)我們明白美的本質(zhì)的時(shí)候,才能使欣賞和創(chuàng)造的過程得著更準(zhǔn)確的力量。
對(duì)于讀這本講哲學(xué),講心理學(xué)的理論書籍,讀起來非常費(fèi)力。要來只是想了解一下,但是被作者嚴(yán)謹(jǐn)?shù)闹螌W(xué)態(tài)度,一以貫之的努力精神所感染,覺得不認(rèn)真讀完都是對(duì)不起作者所付出的努力和自己白白流失的青春。作者在整篇文章中,每論到一個(gè)觀點(diǎn),都列舉了十幾個(gè)思想流派的主流觀點(diǎn),然后自己不輕易的判斷某種觀點(diǎn)的對(duì)錯(cuò),也不輕易接受某種觀點(diǎn)。在以過自己認(rèn)真思索、艱苦探索的之后,提出自己的見解。
因此,他在《談美》中說到寫此書時(shí)“要先看幾十部書才敢下筆寫一章”。這讓我想起,他在這本書附錄《作者自傳》中提到的一件事情,在作者年近花甲的時(shí)候,還努力去學(xué)習(xí)俄文,并且可以達(dá)到讀寫的程度。前些年,我在某本書上看到北大王選在60多歲的時(shí)候,再去學(xué)計(jì)算機(jī)程序語言,并成功開發(fā)出漢字排版軟件,打破了**對(duì)漢字排版領(lǐng)域多年的壟斷,被譽(yù)為“當(dāng)代畢昇”。在這里不是想說他們“老驥伏櫪,志在千里”的故事,而是覺得我現(xiàn)在還很年輕,悲觀、懶惰的情緒時(shí)常在纏繞著我。每當(dāng)一看到《談美書簡》擺在我面前時(shí),自不覺汗流夾背。
朱光潛《談美書簡》讀書筆記10
一位耄耋之年的老人,在生命的黃昏還用如此細(xì)膩且深入淺出的文筆,將深?yuàn)W的美學(xué)知識(shí)娓娓道來。對(duì)朱光潛老先生不由地由衷敬佩。
書中,老先生“對(duì)自己漫長美學(xué)生涯和美學(xué)思想”進(jìn)行了系統(tǒng)的“回顧和整理”,也算是“給來信未復(fù)的朋友們”。在《談人》里,老先生指出“原始人類對(duì)美的追求和所從事的藝術(shù)活動(dòng),如人體裝飾、歌唱、音樂、舞蹈等,都直接源于原始民族休養(yǎng)生息的日常生活和經(jīng)驗(yàn),”美學(xué),原來源于生活,貼近生活,真真切切地存在于我們身邊。其實(shí),冥思細(xì)想,美無處不在。*五千年文化博大精深,就有不少美的傳承,比如唯美典雅的國畫、筆酣墨飽的書法、國之精髓的京劇、名揚(yáng)四海的瓷器工藝……
現(xiàn)代文化下人們更是發(fā)展了更多美學(xué)的分支。我們生活的現(xiàn)代城市格局,在追求現(xiàn)代感的同時(shí)融入大量自然元素,讓自然在城市最大限度的得以保留加以體現(xiàn),生態(tài)綠化的興起,不正是體現(xiàn)人們?cè)谕邔哟蔚拿赖淖非,在生活中時(shí)刻因外物美得到心理美,得到一種對(duì)于美感的滿足從而欣喜,這也成為一種美。
文學(xué)美,就是人類先進(jìn)思想的結(jié)晶,中間許多個(gè)性鮮明飽滿的人物更是成為了美的**!栋屠枋ツ冈骸分心贻p貌美的吉卜賽女郎在危急時(shí)刻為卡西莫多挺身而出,給他救命之水。奇丑無比的敲鐘人卡西莫多之后屢救吉卜賽女郎,為她報(bào)仇雪恨。你能說卡西莫多不美么?《老人與!分懈F困交加的圣地亞哥終日與海為伴,與比船還大的槍魚奮戰(zhàn)兩晝夜,并擊退啦鯊魚無數(shù)次的攻擊,雖然最后只拖回了一截白骨,但是我們能說他不是美的**嗎?還有《弱種子也要發(fā)芽》里的老農(nóng),得知“我”的孩子聽力受損,看到他把弱種子拋棄很難過后,“抹了一把眼角的淚水,以既夸張又慈愛的姿勢,抓起了那些癟種子”,讓它們“妥妥帖帖地躺在了新鮮、肥沃的土壤里”,此刻的老農(nóng)在震撼人心的感動(dòng)中能說不美嗎?
什么是美?如何學(xué)好美學(xué)?我們沒有系統(tǒng)地學(xué)習(xí)過美學(xué),就真的不懂美了么?難道一定要學(xué)好美學(xué),才算懂美?朱光潛先生書中舉例的杜甫詩句“癲狂柳絮隨風(fēng)舞,輕薄桃花逐水流”所反映的“移情作用”就明確告訴我們把自己的生命和情趣外射,達(dá)到物我合一,用心感受美的存在,就是最本質(zhì)的美了。文學(xué)美,建筑美,都可歸于此源。
生活中不是缺少美,而是缺少發(fā)現(xiàn)美的眼睛。羅丹的話已經(jīng)為我們指引了通向美的真理的正確方向。
朱光潛《談美書簡》讀書筆記10篇擴(kuò)展閱讀
朱光潛《談美書簡》讀書筆記10篇(擴(kuò)展1)
——朱光潛先生的《談美》讀書筆記5篇
朱光潛先生的《談美》讀書筆記1
這本毫無疑問不是我一貫愛的書型,但是一年中,總要有那么幾本這些世界外的書。因?yàn)椋鼤?huì)給你開一扇與你原本生活截然不同的窗。
朱光潛的談美,說的是什么是美、是藝術(shù),怎么去欣賞、創(chuàng)造美。
最核心的思想我看來莫過于,藝術(shù)源于生活但卻是無實(shí)際效用的,因?yàn)樘热粲袑?shí)際效用,那么接觸的時(shí)候,想到的會(huì)是怎么用,而非單純的欣賞怎么美。
書中有段話,我覺得說的很好:看倒影,看過去,看旁人的境遇,看稀奇的景物,都好比站在陸地上遠(yuǎn)看海霧,不受實(shí)際的切身的利害牽絆,能安閑自在地玩味目前美妙的景致。
這完全就能概括,為什么我們總覺得旅游的地方特別美,就像俗話說的,旅游就是從你活膩的地方到別人活膩的地方去。拼命想逃離,不是地方不美,只是,你到了這個(gè)地方你想到的是真實(shí)地生活、一系列的牽絆,無法去單純欣賞這里的美。所要逃離的不過是現(xiàn)實(shí)罷了。
美,是沒有意義的,朱光潛說意義大半都起于實(shí)用。唯有脫離了實(shí)用,你才能真正欣賞到純粹的美,這也是為什么印象**畫作你總是會(huì)看不懂,因?yàn)樗鼜?qiáng)調(diào)的是線條、顏色、陰影,看輕內(nèi)容。
這些感悟都讓我對(duì)何謂藝術(shù)有了更深的體會(huì)。
記得當(dāng)初朋友歐雯跟我說,她們系用來畫陶瓷的顏料很多都是不適合食用的時(shí)候,我第一個(gè)反應(yīng)是,那畫出來的陶瓷碟有什么用。
她當(dāng)時(shí)跟我說的是,用來欣賞的呀。
兜了一個(gè)圈,我開始慢慢理解了。要知道,我是個(gè)不擇不扣的理想實(shí)用**者。
朱光潛說,當(dāng)欣賞藝術(shù)的時(shí)候,人就能投入到絕無利害關(guān)系的世界里去。我在浮躁的生活中,要學(xué)會(huì)慢慢來,欣賞生活。
正如書中所說,車走太快,山邊的美景也不過是囚牢。
書里面的文字很美,讓我想起商學(xué)院之前愛文科的日子,中文真的很美,雖然我在拼命學(xué)外語,但看到像云破月來花弄影這樣的好句的時(shí)候,還是忍不住反復(fù)玩味,云、破、月、來、花、弄、影,字字珠璣。
噢,對(duì)了,書中還有一句話,我很喜歡,風(fēng)行水上,自然成紋。
其實(shí)我真的不知道這句話是什么意思,但我更希望自己把它解讀成,一切順其自然,會(huì)寫成你心目中最理想的故事的?础盁o用”的書籍,學(xué)著如何怡情養(yǎng)性。
在快節(jié)奏的生活,在奔忙的日子中,不失為一股清流。
朱光潛先生的《談美》讀書筆記2
已故的**大學(xué)教授朱光潛是我國著名的美學(xué)家,他從事美學(xué)研究六十多來著譯宏豐,他的早期美學(xué)著作有《談美》、《文藝心理學(xué)》《談修養(yǎng)》,翻譯的《歌德談話錄》、克羅齊的《美學(xué)》、柏拉圖的《文藝對(duì)話集》,特別是翻譯了黑格爾的110萬字的美學(xué)巨著《美學(xué)》,在學(xué)術(shù)界贏得非常高的贊譽(yù),他的學(xué)術(shù)生涯可以說是現(xiàn)代*美學(xué)發(fā)展的一個(gè)縮影,刊稱為我國美學(xué)史的一代宗師。
朱光潛先生的美學(xué)思想的核心觀點(diǎn):美不在心,即不存在人的主觀意識(shí)中,也不在物,即不存在客觀事物中,它在心物的關(guān)系上。
朱先生在《談美》一書中寫到:一棵古松長在園里,任何人一看見它都認(rèn)為它是一棵古松,古松在我們的腦海里已經(jīng)形成了表象,古松的形象與古松的美,每個(gè)人在古松的形象見到到不同的美;也就是見出古松的不同形象。
一棵很美的古松長在園里,無論我們看見與否,它都是很美地在那個(gè)園子里,這種美并不存在我們的主觀意識(shí)中;丑是美的殘缺,那棵古松是美或是丑,審美標(biāo)準(zhǔn)都不是由古松自己決定的。
在此,朱先生把*傳統(tǒng)的詩詞歌賦,以較高的美學(xué)理解力做出刨析,給后人在閱讀和賞析做出了杰出的藝術(shù)貢獻(xiàn)。如:
奉帚*明金殿開,暫將團(tuán)扇共徘徊。
玉顏不及寒鴉色,猶帶昭陽日影來。
大家都知道這是失寵于漢成帝之后班睫妤書寫的詩,通過對(duì)這首詩的分析,看到詩中的詞句“奉帚”、“金殿”、“徘徊”、“玉顏”、“寒鴉、“日影”運(yùn)用運(yùn)用種種聯(lián)想擬人式的想象喚起意象,并且采用《詩經(jīng)》中比、興手法,托物沿志,對(duì)情景人物刻畫地入木三分使得讀者受意非淺。
由此看來,他的對(duì)詩的獨(dú)到理解,無不看出他有著深厚的*文化功底,把洗練和精粹都凝結(jié)在他的《詩論》中,并運(yùn)**美學(xué)理論詮釋*古典詩歌所達(dá)到了極高的境界。
朱光潛的人生美學(xué)認(rèn)為沒有脫離人生藝術(shù)的人生,應(yīng)當(dāng)以指向?qū)徝赖拇嬖谔嵘犯瘛?/p>
在《談美》一書的開場白中這樣寫到:“在這個(gè)危急存亡的年頭,…… 我現(xiàn)在談美,正因?yàn)闀r(shí)機(jī)實(shí)在太緊迫了”。給青年朋友的十二封信中寫到:“要洗刷人心,一定要從怡情養(yǎng)性做起,要求人心凈化,先要求人生美化”,做到免俗。也就是說:人要以最高的境界來提高修養(yǎng)、完善自我,去投入社會(huì)人生,從而達(dá)到服務(wù)社會(huì)和改造社會(huì)人生的最終目的。
讀大師的《談美》感觸頗多,怨自己才疏學(xué)淺,只能潦此幾筆了,但是,我還是奉您之囑托,給等在天堂的您寫這封回信吧。叩首!
朱光潛先生的《談美》讀書筆記3
本書作者朱光潛,字孟實(shí)。他90歲生涯的大部分都貢獻(xiàn)給了*的美學(xué)事業(yè),所以晚年的他被尊稱為“美學(xué)老人”。
朱光潛的《談美》寫于1932年,由著名的開明書店出版。在此之前,他寫過一本《給青年的十二封信》, 用書信的形式,漫談文藝、美學(xué)、哲學(xué)、道德、**等問題,發(fā)人思考,指點(diǎn)迷津,在青年中引起很大反響,成為重印了30多次的暢銷書。但這本書主要談的是人生修養(yǎng),還沒有充分展示朱光潛的美學(xué)思想。于是,作為《給青年的十二封信》的姊妹篇,朱光潛以“給青年的第十三封信”為副標(biāo)題,寫作了這本《談美》。
作者是懷著一種崇高的使命感和社會(huì)責(zé)任感來寫這本不厚的小冊(cè)子的,他用通俗易懂的方式和明白如話的語言把高深的美學(xué)問題講得深入淺出,引人入勝,從而起到了凈化讀者心靈、提升一代青年精神境界的作用。而我,讀了這本書后同樣受益匪淺。
美是聯(lián)想所產(chǎn)生的嗎?作者借用牛希濟(jì)的兩句詞“記得綠羅裙,處處憐芳草”,指出“許多通常被認(rèn)為美感的經(jīng)驗(yàn)其實(shí)并非美感”,而是“實(shí)際人的態(tài)度,在藝術(shù)本身以外求它的價(jià)值”。由萋萋芳草,聯(lián)想到綠羅裙,也可以由一件古董,聯(lián)想到金錢,并不是所有的聯(lián)想,都是美的。純粹的美,永遠(yuǎn)是一種“專注”,離開了專注,就已經(jīng)離開了美了。
講解了基本的美學(xué)觀念之后,作者又進(jìn)一步跟我們談了藝術(shù)與游戲、藝術(shù)與想象、創(chuàng)造、情感等方面的問題。告訴我們藝術(shù)創(chuàng)造除了想象之外,還需要情感。
藝術(shù)創(chuàng)造除了想象之外,還需要情感。作者借司空?qǐng)D《詩品》中的一句話“超以象外,得其環(huán)中”指出:“詩人于想象之外又必有情感”,“情感是綜合的要素,許多本來不相關(guān)的意象如果在情感上能調(diào)協(xié),便可形成完整的有機(jī)體”!耙庀蟆笔侵旃鉂撁缹W(xué)理論的重要概念,這里情感的作用十分突出。沒有情感的統(tǒng)帥,想象也許會(huì)雜亂紛紜,有了情感的主導(dǎo),則綱舉目張,“意”與“象”合了。
朱自清先生說:“孟實(shí)先生引讀者由藝術(shù)走入人生,又將人生納入藝術(shù)之中。這種‘宏觀的眼界和豁達(dá)的胸襟’,值得學(xué)者深思。文藝?yán)碚摦?dāng)有以觀其會(huì)通,局于一方一隅,是不會(huì)有真知灼見的!蔽艺J(rèn)為確實(shí)如此,通過他的講解,我真正認(rèn)識(shí)了美,欣賞了美,發(fā)現(xiàn)了美。他的見解也的確“人性化”。
學(xué)術(shù)界有人指出:“朱光潛對(duì)美學(xué)的理解可以說是非常之深,他對(duì)**美學(xué)的介紹,在《談美》中已經(jīng)達(dá)到了一代大師的化境!
我認(rèn)為學(xué)習(xí)美學(xué)也好,學(xué)習(xí)藝術(shù)也好,關(guān)鍵不在能否掌握一兩種技能,而是要看我們能否達(dá)到一種境界。若能夠達(dá)到朱光潛先生所崇尚的“藝術(shù)化的人生”,恐怕可以說“今生無愧什么是美?這是一個(gè)很基本的問題,但毫無意外地,我們大多數(shù)人并不知道它的確切答案。其實(shí)從另一個(gè)方面來說,美并沒有一個(gè)具體的標(biāo)準(zhǔn),每個(gè)人對(duì)于美都有不同的定義。在《談美書簡》中,朱光潛先生給了我們一個(gè)答案,雖然這個(gè)答案不一定正確,但至少比毫無頭緒要高明許多。許多人都認(rèn)為,看過去舒服的就是美的,也許更深一層,會(huì)說心靈美也是一種美。但所有的這些都比較淺顯的,而深入研究,又是望塵莫及的事了。通常我們對(duì)于美、美感、美的規(guī)律、美的范疇等等這些問題感到很深?yuàn)W,也研究甚少,關(guān)于這些問題,朱光潛先生在此書中都一并回復(fù)了,而且回復(fù)的很詳盡,對(duì)于思想,文學(xué),方法,理論等等也有詳細(xì)的陳述。對(duì)于美,我們看到的都是片面的,也可以說成的表面的,而看完這本書,我對(duì)于美則有了全新的看法,這也是讀此書的收獲吧。這本書是以信件的方式組成的,大多都是給讀者的回信。(這一點(diǎn),書中也有提到過)因此也就比較淺顯易懂。在“知識(shí)鏈接”一欄中,編者提到了許多有關(guān)學(xué)術(shù)方面的美的知識(shí)。這讓我們也提前了解了一些有關(guān)美的知識(shí)。雖然此書不是一本完整的美學(xué)著作,卻也從一些很重要很關(guān)鍵的角度對(duì)美學(xué)的入門者的問題進(jìn)行了解答,而且在很多方面都很有幫助。例如在《典型環(huán)境中的典型人物》一文中,作者比較具體、完整地講解了在文學(xué)與戲劇作品中人物與環(huán)境的關(guān)系。他首先回顧了這一理論產(chǎn)生與發(fā)展的歷史,進(jìn)而指出,典型人物是能夠體現(xiàn)社會(huì)歷史發(fā)展的某些規(guī)律并且具有鮮明個(gè)性特點(diǎn)的人物形象,而典型環(huán)境則是典型人物所處的能夠反映社會(huì)歷史發(fā)展現(xiàn)狀和趨勢的具體情景和背景。典型人物應(yīng)生活在典型環(huán)境中,而不能與環(huán)境相脫節(jié)。在這里,共性是通過個(gè)性來表現(xiàn)的,是在特殊中顯示一般。文學(xué)之所以能在偶然性中見出必然性,是與再現(xiàn)“典型環(huán)境中的典型人物”這一理論分不開的。(此段有些摘錄于原文)類似這樣的例子還有許多,在此也就不一一詳談了。朱光潛先生信奉“三此**”,即此身,此時(shí),此地:“此身應(yīng)該做而且能夠做的事,就得由此身擔(dān)當(dāng)起,不推委給旁人!薄按藭r(shí)應(yīng)該做而且能夠做的事,就該在此時(shí)做,不拖延到未來!薄按说兀ㄎ业牡匚弧⑽业沫h(huán)境)應(yīng)該做而且能夠做的事,就得在此地做,不推委到想象中另一地位去做!边@是朱光潛先生不尚空談,腳踏實(shí)地的治學(xué)精神的體現(xiàn)。這很值得我們青少年去學(xué)習(xí)。一天的光陰轉(zhuǎn)瞬即逝,而在這一天,我卻度過了一個(gè)有意義的時(shí)光:我用一天的時(shí)間讀完了13封信,而這13封信讓我對(duì)美學(xué)有了一個(gè)基本的認(rèn)識(shí),這就是朱光潛先
生在83歲高齡寫給青年的美學(xué)入門讀物《談美書簡》。朱光潛先生是*現(xiàn)代美學(xué)的**人物,是開拓者和創(chuàng)新者,在美學(xué)領(lǐng)域是全國的權(quán)威,他主張美是主觀性與客觀性的**。他運(yùn)用*****的觀點(diǎn)來闡明了美和美感的規(guī)律、美范疇等一系列問題。在前言中,朱光潛告訴我們?cè)鯓訉W(xué)美學(xué),但我認(rèn)為更重要的在于,他對(duì)我們?nèi)松^的引導(dǎo),如在前言中朱光潛寫到“正路并不一定是一條**坦坦的直路,難免有些曲折和崎嶇險(xiǎn)阻,要繞一些彎,甚至難免誤入歧途。哪個(gè)重要的科學(xué)實(shí)驗(yàn)一次就能成功呢?“失敗者成功之母”。失敗的教訓(xùn)一般比成功的經(jīng)驗(yàn)更有益”……這些都呈現(xiàn)出一種積極的人生態(tài)度。通篇讀來,其中具有開創(chuàng)性的觀點(diǎn)比比皆是,現(xiàn)在簡要?dú)w納輯錄如下:一人是審美的主體,人在改造客觀世界時(shí)也改造了人本身,人在審美中具有最高的意義,美離不開人。二學(xué)習(xí)美學(xué)的方法應(yīng)是:在應(yīng)運(yùn)用*****觀點(diǎn)的同時(shí),應(yīng)多結(jié)合其他流派的觀點(diǎn)考察美學(xué)。三藝術(shù)也是一種生產(chǎn)勞動(dòng),在審美中,人有意識(shí)的依據(jù)美的規(guī)律來創(chuàng)造美和發(fā)現(xiàn)美,所以,美也是一種生產(chǎn)勞動(dòng)。四美是有階級(jí)性的,但同時(shí),美更本質(zhì)的性質(zhì)是人性,階級(jí)性是人性中的一部分。這及時(shí)的更正了人們關(guān)于美的錯(cuò)誤意識(shí)。五美與生理狀態(tài)的內(nèi)在聯(lián)系,并認(rèn)為美的文藝作品中應(yīng)有思想性的滲透,但不是直接,而是間接從作品中表現(xiàn)出來。六現(xiàn)實(shí)**從客觀出發(fā),而浪漫**從主觀出發(fā),并據(jù)此認(rèn)為我們不能容忍一個(gè)人因一點(diǎn)小過錯(cuò)而失敗,從而產(chǎn)生出悲劇感,驚恐和哀憐是悲劇的情感基礎(chǔ),悲劇更為本質(zhì),好的喜劇作品中一定有悲劇性。 七崇高是我們由壓抑而產(chǎn)生的,它是由恐懼轉(zhuǎn)為振奮的,并在其中體會(huì)到一種自尊或愉悅。
崇高側(cè)重于對(duì)立和沖突,而秀美側(cè)重于*衡和**。 13封信,行云流水,讀來渾然天成,卻使我對(duì)美學(xué)有了第一次有了明晰的認(rèn)識(shí)。每一封信都是那么親切自然,知識(shí)在這種脈脈溫情的態(tài)度中傳達(dá)出來,其間沒有美學(xué)中那種概念的堆砌,卻使人們對(duì)美有了更深刻的認(rèn)識(shí)。最美麗的人生一定有美的人生態(tài)度,所以,每個(gè)人多應(yīng)讀一讀這13封信。
朱光潛先生的《談美》讀書筆記4
縱觀朱光潛先生的《談美》,大致分為了三個(gè)板塊,其一是談對(duì)美的欣賞,其二是講美的創(chuàng)造,最后引申到了人生的藝術(shù)化,朱光潛先生本人也認(rèn)為這是他自己最重要的理論。這本書看完后,對(duì)人生與藝術(shù),自己與美有了自己的感悟。
書中開篇就解釋了談美的原因,“要求人心凈化,先要求人生美化!薄叭艘谐鍪赖木癫趴梢宰鋈胧赖氖聵I(yè)”,要做到“免俗”。而探討現(xiàn)如今美的意義,或者是美學(xué)的意義,有一個(gè)很著名的觀點(diǎn)就是現(xiàn)代美學(xué)的美育,美學(xué)可以把人的存在納入形式表達(dá)的方法,審美的本質(zhì)就在于讓人的存在變得更加美好,意味著唯有通過審美教育才能真正獲得對(duì)人生的的深層把握。以我所學(xué),美育能夠成為可能的基礎(chǔ),是因?yàn)樗囆g(shù)主要就是負(fù)擔(dān)人的感性認(rèn)知以及美感意識(shí)的水*的職責(zé)。而審美之所以如此重要,就在于通過藝術(shù)的審美教育,才能擺脫生命的慵常性,復(fù)蘇被現(xiàn)實(shí)麻痹的感知,重新領(lǐng)悟到生命的真諦。而現(xiàn)在的社會(huì)是一個(gè)被技術(shù)**的時(shí)代,藝術(shù)成為了消費(fèi)文化的一部分,在這種大潮里,唯有通過美育獲得存在的感知,得到真正的本真。
在對(duì)美的欣賞上,首先是態(tài)度問題,對(duì)一顆古松不同的身份會(huì)有不同的感悟,而無論何種感悟都是帶有個(gè)人的主觀,這也體現(xiàn)出藝術(shù)與人生之間存在著緊密地聯(lián)系!皹O*常的知覺都帶有幾分創(chuàng)造性;極客觀的東西之中都有幾分主觀的成分!币鲆粋(gè)顯而易見的道理“有審美的眼睛才能見到美”。仔細(xì)觀察生活,確是如此,生活中極*常的東西都帶有我們自己的主觀意識(shí),看到公寓旁邊與樓齊高的參天大樹,我們可能****,而當(dāng)我用審美的觀點(diǎn)去看待它,它又是那么的特別。站在樹底下觀之,只覺望不到樹尖,樹干上都是風(fēng)霜的痕跡,凹凸不*,卻帶有一種古樸美;有次站在樓頂觀之,別有一番景象,居高臨下,它是那么的孤立,獨(dú)樹一幟,顯示出傲然挺立之感,不畏寒冬,心中不覺對(duì)此敬佩。當(dāng)時(shí)正值我背書背的很煩悶,忽覺樹都能如此不畏環(huán)境的艱難,何況人呢。我想這就是審美給我?guī)淼木裆系捏w驗(yàn)。
藝術(shù)與實(shí)際人生也是有距離的,而藝術(shù)與極端的寫實(shí)**不相容。他說“美和實(shí)際人生有一個(gè)距離,要見出事物本身的美,須把他擺在適當(dāng)?shù)木嚯x之外去看!薄八囆g(shù)本來就是彌補(bǔ)人生和自然缺陷的! 在許多文學(xué)作品中,本來現(xiàn)實(shí)的結(jié)局完滿的,而改寫成文學(xué)作品后,去掉了完美,給了他一個(gè)不完美的結(jié)局,這就在于這樣使得悲劇更深入人心,能夠起到更大的藝術(shù)效果。我們感悟藝術(shù)作品的時(shí)候,也要記得這個(gè)適當(dāng)?shù)木嚯x,書中的古希臘和*舊戲的角色往往戴面具,穿高跟鞋,表演時(shí)的聲調(diào)不像*常,這都體現(xiàn)距離。而這個(gè)是適當(dāng)?shù)木嚯x,距離太遠(yuǎn)變成無法理解,而太近則不像是藝術(shù)。所以朱光潛先生說“一般人不能把切身的經(jīng)驗(yàn)放在一種距離以外去看,所以情感盡管深刻,經(jīng)驗(yàn)盡管豐富,終不能創(chuàng)造藝術(shù)!币灾饔^的參與者退變?yōu)榭陀^的觀賞者。
朱光潛先生也談到了幾點(diǎn)對(duì)許多人對(duì)美感的誤解。美學(xué)不是享樂**,而這個(gè)享樂指的是快感,我們欣賞一件作品時(shí)候的快感,愉悅之感,并不就是美感!懊栏杏衅毡樾,快感沒有普遍性!薄懊栏信c實(shí)用活動(dòng)無關(guān),而快感則起于實(shí)際要求的滿足!边@個(gè)也解釋了我心中的的疑問,對(duì)于一件事物的喜歡,并不能說明這個(gè)事物是美的,正如“實(shí)驗(yàn)美學(xué)”的人做的實(shí)驗(yàn),問受驗(yàn)者喜歡哪些顏色、條紋,而藝術(shù)上部分之和并不等于全體,每個(gè)人都不盡相同,不能以大多數(shù)認(rèn)為而斷定它是美的。另一個(gè)誤解是聯(lián)想帶來的就是美,“美感起于直覺,不帶思考,聯(lián)想?yún)s不免帶有思考。”每個(gè)人的知識(shí)水*不盡相同,看到一件事物的聯(lián)想也不會(huì)相同,看到一件事物的聯(lián)想只是持有實(shí)際人的態(tài)度,在它的藝術(shù)本身以外去求它的價(jià)值,這顯然是不對(duì)的。最后,考證和批評(píng)也不是對(duì)美的欣賞。當(dāng)你看到一件文學(xué)作品,探析作者的一切,透析寫作緣由,社會(huì)背景等,這可能會(huì)在無意之中磨滅了美!坝龅轿乃囎髌啡绻冀K持批評(píng)的態(tài)度,則我是我而作品是作品,我不能沉醉在作品里面,永遠(yuǎn)得不到真正的美感的經(jīng)驗(yàn)!被蛟S對(duì)待作品,我們應(yīng)該不摻加雜質(zhì),以本真之心去看待,這樣也能更好地閱讀作品,得到其中的真諦。
在美的創(chuàng)作上,朱光潛先生談到“大人者不失其赤子之心”,藝術(shù)游戲說!八囆g(shù)的雛形就是游戲。游戲之中就含有創(chuàng)造和欣賞的心理活動(dòng)!蔽矣X得這在一定程度上把藝術(shù)變得更加具體化。游戲和藝術(shù)一樣是把欣賞的意象加以客觀化,使它成為一個(gè)具體的情境。也是一種“想當(dāng)然耳”的勾當(dāng),游戲也帶有移情作作用,把死板的宇宙看成活躍的生靈,是在現(xiàn)實(shí)世界之外另造一個(gè)理想世界來安慰情感。這可能是受到席勒認(rèn)為人有一種游戲沖動(dòng),這是以美為對(duì)象的藝術(shù)創(chuàng)造沖動(dòng)。但是有濃厚的“烏托邦”色彩。同時(shí),也使藝術(shù)成為一種社會(huì)****的工具,承擔(dān)了太多的“說教”功能和“神圣”色彩,弱化了游戲的實(shí)踐性、對(duì)話性和非功利性等?傊艺J(rèn)為在美的創(chuàng)作上,朱光潛先生提到的“讀書破萬卷,下筆如有神”說的十分正確。以前看過一段話說,讀書有什么用,還不如拿讀書的錢出去旅行,古有“讀萬卷書,不如行萬里路”。接著就有人回復(fù)說,你不讀書,即使行了萬里路也只是一個(gè)郵差。說的不無道理,心中沒有知識(shí)的儲(chǔ)備,更不會(huì)說對(duì)美有任何感悟。現(xiàn)在的我們,應(yīng)該打好基礎(chǔ),多充實(shí)自己,不管是知識(shí)上,還是能力上。正如書中所說,靈感是突如其來,出于作者自己意料之外的,是不由自主的、突如其來的!安贿^靈感的培養(yǎng)正不必限于讀書。人只要留心,處處都是學(xué)問。”這就要求我們要注意觀察生活,也就是對(duì)美的欣賞上說的有一雙審美的眼睛。要留心觀察生活,對(duì)生活中的事物要有自己的見解和思考。
最后朱光潛先生說道人生的藝術(shù)化。以上見解可觀之藝術(shù)與人生的關(guān)系緊密,朱光潛先生也認(rèn)為“人生本來就是一種較廣義的藝術(shù)。每個(gè)人的生命史就是他自己的作品!倍舶讶松譃榱藢(shí)際人生和整個(gè)人生。實(shí)際人生只是整個(gè)人生中的一部分,藝術(shù)與人生都有一種完整性,都是以“情趣”為本體的生命精神的顯現(xiàn)。朱光潛先生說,藝術(shù)的生活就是本色的生活,我想這里的本色是指的有趣的,有源頭涉水的生活,而不是機(jī)械的、干枯的生活,而是顯露人生真性情的生活。
藝術(shù)和生活的創(chuàng)造之中都含有欣賞,朱光潛先生說:“善于生活者則徹底認(rèn)真,不讓一塵一芥妨礙整個(gè)生命的**!倍覀儗(duì)于生活也要懷有一定的嚴(yán)肅性,正如前文所說,在持出世精神與做入世事業(yè)之間、在超脫人生與淑世**之間的圓融。或者說,嚴(yán)肅與豁達(dá)尖山的藝術(shù)與人生態(tài)度,還喻示著道德精神與審美**的同一性。我覺得這種豁達(dá)的精神很值得學(xué)習(xí),在生活中,我們可能會(huì)過度的在乎我們自己的得失,斤斤計(jì)較,殊不知這是在喪失生活的樂趣。
而朱光潛先生說的阿爾卑斯山谷公路邊的標(biāo)牌:“慢慢走,欣賞啊!”許多人在這車水馬龍的世界里生活,恰如乘坐在疾馳而過的汽車上,“慢慢走”有的人認(rèn)為是以時(shí)間換空間,把實(shí)用的人暫時(shí)變成審美的人,把路旁的風(fēng)景變成審美的對(duì)象。“欣賞啊”,就是完成一次完滿的審美經(jīng)驗(yàn),體驗(yàn)到真正的“美”,F(xiàn)實(shí)世界名韁利鎖,人生很難**超脫,而我們可以懷著美感的純粹意象的世界,看淡我們**得失和利害關(guān)系,做一個(gè)純粹的本真的人,即使在現(xiàn)實(shí)生活中難以做到,我們也可以在自己心中找到自己的*衡點(diǎn)。從心中開始做一個(gè)本真的人,找到我們自己人生與藝術(shù)的聯(lián)系。
朱光潛先生的《談美》讀書筆記5
最經(jīng),我閱讀了朱光潛先生的《談美》一書,頗受啟發(fā),收獲良多,讀朱光潛《談美》有感。這本書為我打開了美學(xué)這一陌生學(xué)科的大門,讓我第一次真正領(lǐng)略到美學(xué)其獨(dú)特的知識(shí)魅力。最難能可貴的是,朱光潛先生能夠用樸實(shí)無華、淺顯易懂的語言,將原本深?yuàn)W枯燥的理論分析地如此客觀、如此透徹、如此深入淺出,讓我們這些美學(xué)的門外漢也能讀懂作者所要表達(dá)的思想和觀點(diǎn)。讀完這本書,頭腦里不是堆積如山的理論包袱,而是一種通透的、簡單的、貼近于生活的印象,這也就使我在閱讀后收獲了更多的知識(shí),以下就是我對(duì)于這本書內(nèi)容的一些總結(jié)和概括,以及我在閱讀后的所想所感。
《談美》是朱光潛先生于1932年以書信形式為青年所寫的一本美學(xué)入門書。本書共分為十五個(gè)章節(jié),章節(jié)間的思路連貫,層層深入,其間的論述有理有據(jù),語言深入淺出。本書主要探討了關(guān)于美學(xué)的一些基本問題,例如:美是什么,美從哪里來,美具有什么特點(diǎn),美與自然的關(guān)系,美與實(shí)際人生的距離 這些都是最基礎(chǔ)的美學(xué)問題,同時(shí)也是最關(guān)鍵的問題,朱光潛用客觀、精確、凝練的語言對(duì)其加以分析和論述,使讀者初步了解和認(rèn)識(shí)美學(xué),正如朱自清在《<談美>序》中所說:“引讀者由藝術(shù)走入人生,又將人生納入藝術(shù)之中”。
書的第一章到第三章重點(diǎn)論述了美感是什么,美感從哪里來的問題。在第一章中,作者以一顆古松為例,將人們實(shí)用的、科學(xué)的、美感的三種態(tài)度加以比較和區(qū)別。實(shí)用的態(tài)度以善為最高目的,***偏在事物對(duì)于人的利害,心理活動(dòng)偏重意志;科學(xué)的態(tài)度以真為最高目的,***偏在事物間的互相關(guān)系,心理活動(dòng)偏重抽象的思考;美感的態(tài)度以美為最高目的,***專在事物本身的形象,心理活動(dòng)偏重直覺。所以,美感經(jīng)驗(yàn)就是形象的直覺,美就是事物呈現(xiàn)形象于直覺時(shí)的特質(zhì)。在第二章中,作者強(qiáng)調(diào)要以一種“無所為而為”的精神去欣賞事物本身的形象,美和實(shí)際人生有一定的距離,要見出事物本身的美,須把它擺在適當(dāng)?shù)木嚯x之外去看。
長時(shí)間不曾讀書,更不曾這么認(rèn)真的讀書!段乃囆睦韺W(xué)》(復(fù)旦大學(xué)出版學(xué)出版)又名《談美》,是朱光潛先生一部談美學(xué)的論著。朱光潛先生在美學(xué)界的造詣這里無需過多贅述,他是我國研究美學(xué)的始祖,一代美學(xué)大師。通讀完后,首先的感覺是朱先生知識(shí)的淵博,旁征博引,學(xué)貫中西。在他的書中,古今中外的文獻(xiàn)引用得極多,而且所引用的英法德等國關(guān)于美的論述都是他最早翻譯過來的。其實(shí)粗讀一篇,我真沒有弄明白到底什么是美。雖然他通篇都在介紹什么是美,從心理學(xué)角度、從哲學(xué)角度、從自然科學(xué)角度去研究、論證美的本質(zhì)意義。但是我讀的還是一頭霧水,因?yàn)橹煜壬乃枷胧悄敲吹纳铄?眼光是那么犀利;觀點(diǎn)是那么獨(dú)到,讀后感《讀朱光潛《談美》有感》。都說讀書就是讀者和作者心與心的交流,我只覺得朱先生穿著一身長馬褂,在某個(gè)黃昏的清風(fēng)中,向我娓娓道來,像一切得道智者一樣,他持才并不傲物,從容淡泊,虛懷若谷。對(duì)我而言,朱先生只能用“高山仰止,景行行止”來形容了。
到底什么是美? 為什么美?朱光潛先生并沒有給出明確的定義。對(duì)于一個(gè)嚴(yán)謹(jǐn)?shù)目茖W(xué)研究者或者說是理論研究者,簡單草率地定義某種事物,總不免會(huì)把讀者引入歧途甚至?xí)Υ蠓健ト巳绨乩瓐D也曾犯下把人定義成沒有羽毛動(dòng)物的錯(cuò)誤,留下了千古笑柄。美不完全是事物的屬性,不能科學(xué)定性地定義。譬如我們說水,這是可以嚴(yán)格定義的,凡是由2個(gè)氫原子和1個(gè)氧原子化合而成的物質(zhì)就是水,這個(gè)不會(huì)因?yàn)椴煌擞胁煌捶ǘ淖。然而我們很多人?duì)美的定義其實(shí)都是成為美的條件,我們說腳長的女人比腳短的女人要美,對(duì)稱的比散亂的要美,但這都是成為美的條件,但具備這些條件的不一定就是美。正如空氣含有水分是雨的條件,但空氣中的水分卻不是雨。因此有人問圣·奧古斯。骸笆裁词菚r(shí)間?”,他回答:“你不問我,我本來很清楚地知道他是什么,你問我,我倒覺得茫然了”。 美不能定義,又不是事物固有的屬性,那就沒有研究價(jià)值了嗎?朱先生告訴我們,美其實(shí)在某種程度上也是事物屬性,當(dāng)我們見到美的事物時(shí),大多數(shù)人還是會(huì)覺得那是美的。但是研究判別美,不僅要在物本身著眼,同時(shí)還要著重觀賞者在所觀賞物中見到的價(jià)值去研究。通俗一點(diǎn)講,就是美不僅在物,而且在心,在物為刺激,在心為感受。世界上沒有天生自在,俯首即拾的美,凡是美都要經(jīng)過心靈的創(chuàng)造,所以美學(xué)研究的理論,不僅要講藝術(shù),而且要講心理。作者用了十七章的篇幅在講美,我才疏學(xué)淺,讀了多遍亦只是管中窺豹,不能全面真正理解作者所闡述的理論。剛看到這本書的時(shí)候,我和大多數(shù)人一樣都有一個(gè)疑問,自已認(rèn)為美就是美,了解那么多有意義嗎?
為什么要研究美? 現(xiàn)實(shí)生活中我們每個(gè)人都攀登過山,游玩過水,欣賞過畫,背頌過詩文,當(dāng)我們發(fā)現(xiàn)某處景色讓我們心情愉悅時(shí),我們會(huì)說,這里真美;當(dāng)我們讀到某處詩文讓我們身臨其近時(shí),我們會(huì)說這首詩真美;當(dāng)我們讀到某篇文章讓我們長期心靈的桎梏、精神的困頓豁然開朗的時(shí)候,我們會(huì)說這篇文章真美。我們?cè)谡f美的時(shí)候,其實(shí)都只是一個(gè)隨性的判斷,靠得是自己粗疏的經(jīng)驗(yàn),至于為什么會(huì)覺得美,我們都沒有意識(shí)進(jìn)行仔細(xì)的考量。我們要欣賞、判斷美,其實(shí)是不能離開理論支撐的。如果我們沒有決定怎么才是美,就沒有理由說這幅畫比那幅畫更美;如果我們沒有明白藝術(shù)的本質(zhì),就沒有理由說這件是藝術(shù)品,那件作品不是藝術(shù)品。只有當(dāng)我們明白美的本質(zhì)的時(shí)候,才能使欣賞和創(chuàng)造的過程得著更準(zhǔn)確的力量(朱自清語)。對(duì)于讀這本講哲學(xué),講心理學(xué)的理論書籍,讀起來非常費(fèi)力。要來只是想了解一下,但是被作者嚴(yán)謹(jǐn)?shù)闹螌W(xué)態(tài)度,一以貫之的努力精神所感染,覺得不認(rèn)真讀完都是對(duì)不起作者所付出的努力和自己白白流失的青春。作者在整篇文章中,每論到一個(gè)觀點(diǎn),都列舉了十幾個(gè)思想流派的主流觀點(diǎn),然后自己不輕易的判斷某種觀點(diǎn)的對(duì)錯(cuò),也不輕易接受某種觀點(diǎn)。在以過自己認(rèn)真思索、艱苦探索的之后,提出自己的見解。因此,他在《談美》中說到寫此書時(shí)“要先看幾十部書才敢下筆寫一章”。這讓我想起,他在這本書附錄《作者自傳》中提到的一件事情,在作者年近花甲的時(shí)候,還努力去學(xué)習(xí)俄文,并且可以達(dá)到讀寫的程度。前些年,我在某本書上看到北大王選在60多歲的時(shí)候,再去學(xué)計(jì)算機(jī)程序語言,并成功開發(fā)出漢字排版軟件,打破了**對(duì)漢字排版領(lǐng)域多年的壟斷,被譽(yù)為“當(dāng)代畢昇”。在這里不是想說他們“老驥伏櫪,志在千里”的故事,而是覺得我現(xiàn)在還很年輕,悲觀、懶惰的情緒時(shí)常在纏繞著我。
朱光潛《談美書簡》讀書筆記10篇(擴(kuò)展2)
——朱光潛《談美》的讀書筆記3篇
朱光潛《談美》的讀書筆記1
什么是美?這是一個(gè)很基本的問題,但毫無意外地,我們大多數(shù)人并不知道它的確切答案。其實(shí)從另一個(gè)方面來說,美并沒有一個(gè)具體的標(biāo)準(zhǔn),每個(gè)人對(duì)于美都有不同的定義。在《談美書簡》中,朱光潛先生給了我們一個(gè)答案,雖然這個(gè)答案不一定正確,但至少比毫無頭緒要高明許多。
許多人都認(rèn)為,看過去舒服的就是美的,也許更深一層,會(huì)說心靈美也是一種美。但所有的這些都比較淺顯的,而深入研究,又是望塵莫及的事了。通常我們對(duì)于美、美感、美的規(guī)律、美的范疇等等這些問題感到很深?yuàn)W,也研究甚少,關(guān)于這些問題,朱光潛先生在此書中都一并回復(fù)了,而且回復(fù)的很詳盡,對(duì)于思想,文學(xué),方法,理論等等也有詳細(xì)的陳述。對(duì)于美,我們看到的都是片面的,也可以說成的表面的,而看完這本書,我對(duì)于美則有了全新的看法,這也是讀此書的收獲吧。
這本書是以信件的方式組成的,大多都是給讀者的回信。(這一點(diǎn),書中也有提到過)因此也就比較淺顯易懂。在“知識(shí)鏈接”一欄中,編者提到了許多有關(guān)學(xué)術(shù)方面的美的知識(shí)。這讓我們也提前了解了一些有關(guān)美的知識(shí)。
雖然此書不是一本完整的美學(xué)著作,卻也從一些很重要很關(guān)鍵的角度對(duì)美學(xué)的入門者的問題進(jìn)行了解答,而且在很多方面都很有幫助。
例如在《典型環(huán)境中的典型人物》一文中,作者比較具體、完整地講解了在文學(xué)與戲劇作品中人物與環(huán)境的關(guān)系。他首先回顧了這一理論產(chǎn)生與發(fā)展的歷史,進(jìn)而指出,典型人物是能夠體現(xiàn)社會(huì)歷史發(fā)展的某些規(guī)律并且具有鮮明個(gè)性特點(diǎn)的人物形象,而典型環(huán)境則是典型人物所處的能夠反映社會(huì)歷史發(fā)展現(xiàn)狀和趨勢的具體情景和背景。典型人物應(yīng)生活在典型環(huán)境中,而不能與環(huán)境相脫節(jié)。在這里,共性是通過個(gè)性來表現(xiàn)的,是在特殊中顯示一般。文學(xué)之所以能在偶然性中見出必然性,是與再現(xiàn)“典型環(huán)境中的典型人物”這一理論分不開的。(此段有些摘錄于原文)
類似這樣的例子還有許多,在此也就不一一詳談了。
朱光潛先生信奉“三此**”,即此身,此時(shí),此地:“此身應(yīng)該做而且能夠做的事,就得由此身擔(dān)當(dāng)起,不推委給旁人!薄按藭r(shí)應(yīng)該做而且能夠做的事,就該在此時(shí)做,不拖延到未來!薄按说兀ㄎ业牡匚、我的環(huán)境)應(yīng)該做而且能夠做的事,就得在此地做,不推委到想象中另一地位去做。”這是朱光潛先生不尚空談,腳踏實(shí)地的治學(xué)精神的體現(xiàn)。這很值得我們青少年去學(xué)習(xí)。
朱光潛《談美》的讀書筆記2
“人生莫要大汗淋漓埋頭向前,也當(dāng)時(shí)不時(shí)停下來,慢慢走,欣賞路兩邊的風(fēng)景”,因橋梁而入美學(xué),朱光潛老先生的《談美》,當(dāng)為小玄子的美學(xué)第一課。
01、緣起
最先知道朱光潛作為美學(xué)家是在高中教室的圖書角,教語文的班**是美學(xué)碩士,在教室的窗臺(tái)上開辟了圖書角,放置了中外文學(xué)(美學(xué))書籍,其中就有朱的著作(具體是哪一本記不清了)。最先注意到《談美》這本書,也是因了朱光潛先生的名號(hào),這本書是先生于1932年(時(shí)年35歲,算是人生早期階段)著作的一部談?wù)撁缹W(xué)的書籍,書不算厚,197頁,其中講述了*的古典美,又引用**美學(xué)家的觀點(diǎn)談鑒賞美,讀來不像一般哲學(xué)書那般苦澀難懂,也不像一般美學(xué)書張口閉口引經(jīng)據(jù)典,非要有厚實(shí)的文學(xué)基礎(chǔ)才能讀得順心遂意,《談美》這本書就像作者在序言中所說,以一種跟小輩人談話的方式進(jìn)行,作者說在著書前不需動(dòng)輒讀十幾本參考書,就以最*常的語言和聊天的方式來聽談?wù)撋钪械拿,文學(xué)中的美,讓從未接觸過理論美學(xué)的工科生深深沉浸其中,驚喜于先生的文筆和當(dāng)中所蘊(yùn)含的思想。
02、轉(zhuǎn)合
拿到這本書,打開目錄便被序列一到十五的標(biāo)題驚艷到了,***談?wù)搶?duì)審美三種不同態(tài)度篇樸實(shí)如“我們對(duì)于一顆古松的三種態(tài)度”,也有談?wù)撁栏泻吐?lián)想且自帶意境的詩句“記得綠羅裙,處處憐芳草”,也有談?wù)搶憣?shí)**和理想**關(guān)系篇目的“依樣畫葫蘆”。不同于理科課本中純屬解釋概念的標(biāo)題,用樸實(shí)命題、古詩、經(jīng)典名句、俗語做標(biāo)題,參差不齊的表述形式,視覺上本身就形成了一種美感,借他語以言己意,又是一美!首先要想用他人之語表己之思想,你得理解到他人之語的深刻含義,他人通過這段語言想表達(dá)出自己什么樣的思想,之后你要用自己的情感去理解他人的思想,再將其融為一體并以一種大眾認(rèn)可為美的形式表現(xiàn)出來,這不就是最簡單的一種美的形成過程嗎?(對(duì)標(biāo)題美的初步看法)
對(duì)于書中的觀點(diǎn)我不是都認(rèn)可,只針對(duì)其中感興趣的幾點(diǎn),談?wù)撘幌挛业目捶ǎ唵巫鲆幌鹿P記。第一篇談?wù)搶?duì)美三種態(tài)度的末尾的一句話,讓我很受觸動(dòng),寫的很有文采,朱自清作的序中也曾提到這句,下面我們簡單來看看這句話。
“悠悠的過去只是一片漆黑的天空,我們所以還能認(rèn)識(shí)出來這漆黑的天空者,全賴思想家和藝術(shù)家所散步的'幾點(diǎn)星光。朋友,讓我們珍重這幾點(diǎn)星光!讓我們也努力散步幾點(diǎn)星光去照耀和那過去一般漆黑的未來!
這里看起來很有意思,漆黑的天空代指世間一切未知的混沌狀態(tài),把思想家對(duì)于世界的看法和藝術(shù)家基于世界現(xiàn)實(shí)所創(chuàng)造的藝術(shù)看做幾點(diǎn)星光,比喻很是貼切,也說明了我們對(duì)世界的認(rèn)知是小荷才露尖尖角,是那一點(diǎn)點(diǎn),后面又說珍惜這些星光,自己也要去散布星光,這種發(fā)掘未知的貢獻(xiàn)精神是我們應(yīng)當(dāng)去學(xué)習(xí)的。但這結(jié)論未免又有些絕對(duì),全賴思想家和藝術(shù)家概念是否有些縮小化,有以偏概全的嫌疑,或許一切可欣賞可表達(dá)者皆可稱為思想家和藝術(shù)家。
我們對(duì)美的追求古已有之。原始先民用于做飯的炊具,其上面的花紋令今人都嘆為觀止。炊具滿足了為人的基本生存需求提供了輔助,但花紋卻不是必須的,沒有花紋也并不影響人的生存,是否從這一表現(xiàn)中看到原始人對(duì)美的追求?按照書中的觀點(diǎn),這種美是最基礎(chǔ)的物質(zhì)美,是不需要系列復(fù)雜的情感和方法。如果從另一個(gè)角度想,先民們看到了美麗的花紋并將其內(nèi)化使心情愉悅,產(chǎn)生了對(duì)這些飾有花紋陶罐的喜歡,由物之美上升到內(nèi)心情感的愉悅喜愛,或許這已經(jīng)不是最基礎(chǔ)的物質(zhì)美了吧。
接著先生在第一章談?wù)搶?duì)一棵古松的三種態(tài)度,其實(shí)是人對(duì)美的三種態(tài)度,古松是美的載體,單純的談美未免讓人覺得空泛,古松給了美以具體的表現(xiàn)形式,美又是古松的表觀顯現(xiàn),就像我們的這門課,我們要學(xué)結(jié)構(gòu)美學(xué),而橋梁就是載體,我們要在不同的橋梁中去欣賞結(jié)構(gòu)美學(xué)。回到文中,作者以木商、植物學(xué)家和畫家三種人來表述人在不同狀況下對(duì)這棵古松的三種態(tài)度,用以表現(xiàn)美的實(shí)用性、科學(xué)性和藝術(shù)性,而不能單純理解為這三種人只能按照自己的職業(yè)思維去看這顆古松,如果非要這般解釋也未免太過于武斷。三種人劃分只是以他們的職業(yè)為依據(jù),但除去職業(yè)外,他們都是一個(gè)個(gè)體,可以欣賞美的個(gè)體,木商在思考這顆古松的價(jià)值時(shí)未必不會(huì)考慮到古松的蒼勁挺拔,未必不知道樹的根枝丫等結(jié)構(gòu),只是每個(gè)人由于自己的生活經(jīng)驗(yàn),在看到一個(gè)事物發(fā)表意見時(shí)最容易從自己生活中得到的先驗(yàn)知識(shí)出發(fā)。如果給定美的話題,讓上述的三種人談?wù)撨@顆古松,三人的看法未必可見高低。這里我想說,每個(gè)人都有欣賞美的眼睛,只是生活的經(jīng)驗(yàn)讓人容易從接近當(dāng)前生活狀態(tài)的角度出發(fā),而藝術(shù)家恰好是從事藝術(shù)審美的工作,他的出發(fā)點(diǎn)較之于他人距離美便近了很多。
第一章篇末,先生提到“許多轟轟烈烈的英雄和每人都過去了,許多轟轟烈烈的成功和失敗也都過去了,只有藝術(shù)作品真正是不朽的。”有列舉曹孟德和秦始皇的例子加以說明,其實(shí)我是不大認(rèn)同他的觀點(diǎn)的。曹明德和秦始皇是歷史上真人真事,是人便會(huì)有生死,是事便會(huì)有始末,歷史的流轉(zhuǎn)和朝代的更迭使之然。而先生所說的藝術(shù)作品則是他們形象和精神的載體,他們?nèi)怏w早已化為碳水盡歸自然,而他們的事跡流傳千古給無數(shù)人以激勵(lì)和警醒,當(dāng)朝子民的記載讓他們的事跡得以讓千百年后的我們知曉,感受曹孟德舳艫千里、旌旗蔽空的豪邁氣勢,感受秦始皇一統(tǒng)六國、始制文字、**度量衡時(shí)的雄心與壯志。此般情景因被人記錄而成為“藝術(shù)”,我們今人看到再根據(jù)自己的經(jīng)驗(yàn)想象那年那人那景,借彼之言抒自己的情感,我們便感到了美。所以我們能單純把此段要描述的藝術(shù)和歷史割裂**看嗎?答案顯然是否定的。
**者迷旁觀者清——論述了“藝術(shù)是主觀的,都是作者情感的流露,但是它一定要經(jīng)過幾分客觀化”,以此說明藝術(shù)和實(shí)際人生是有距離的。對(duì)于前面的觀點(diǎn)我從未涉足,但對(duì)后面藝術(shù)和人生的距離有幾點(diǎn)簡單的看法。拿生活中的例子來看,人們經(jīng)常會(huì)喜歡影視作品中扮演“好人”的演員,而討厭其中扮演壞人的演員,這個(gè)現(xiàn)象帶有一點(diǎn)移情作用,演員刻畫人物形象很到位,因此我們便將對(duì)角色的情感帶入到演員本身,像是藝術(shù)對(duì)生活的外延。但也有**報(bào)道觀眾因?qū)Π缪輭娜私巧類和醇捕仙綄?duì)演員的人身攻擊,這種行為本身已經(jīng)超出了藝術(shù)的范疇,藝術(shù)的美已經(jīng)被生活的帶入所破壞。演員刻畫壞人的形象深入骨髓,說明演員的表演功力深厚,我們欣賞“壞人”的表現(xiàn)來感受表演的魅力,這是一種美的體驗(yàn),但當(dāng)我們把藝術(shù)現(xiàn)實(shí)生活化后,藝術(shù)與現(xiàn)實(shí)不再有距離,藝術(shù)便被現(xiàn)實(shí)生活的基本生存需求和不受控的情感趕出了美的世界。
03、終
讀朱先生的《談美》,給我最大的感受是驚奇。在枯燥的理工科學(xué)習(xí)中偶爾體驗(yàn)一下文人墨客的情懷,感受詩詞歌賦中的風(fēng)花雪月,以第三視覺去看哲人的爭辯,豈不妙哉?記得有一章中寫藝術(shù)的移情于景,寫到王昌齡的《長信怨》,寫到“奉帚*明金殿開,暫將團(tuán)扇共徘徊”,寫班婕妤團(tuán)扇之用意,寫王昌齡又用團(tuán)扇之意,讀完這一章有一種茅塞頓開的感覺,初中語文老師費(fèi)九牛二虎之力給你講象征講抽象,撐著腦袋聽到頭暈暈也沒能明白什么是象征什么是抽象,讀完這段文字,便有“原來是這個(gè)樣子啊”的感嘆!不求一本書能讀懂美學(xué),看透美的哲理,但希望能以這本書為起點(diǎn),拓展自己的閱讀范圍和眼界,能夠在現(xiàn)實(shí)生活中體驗(yàn)書中所寫美學(xué)的魅力,讓生活變得不再僅僅是柴米油鹽那么簡單,即使是僅僅有柴米油鹽也可以有陶淵明“采菊東籬下,悠然見南山”般的深度,應(yīng)書中最后一章先生的提議,人生莫要大汗淋漓埋頭向前,也當(dāng)時(shí)不時(shí)停下來,慢慢走,欣賞路兩邊的風(fēng)景!
朱光潛《談美》的讀書筆記3
最近又重讀了美學(xué)大師朱光潛的《談美》一書,跟上次讀起來感覺又有很大不同,收獲良多。這或許正是經(jīng)典書籍的魅力所在:除了百看不厭,還能讓人每次都有新的感悟。
《談美》開篇舉例了三種人對(duì)一顆古松的不同態(tài)度。一位木材商,一位植物學(xué)家,一位畫家,三人同時(shí)來看一顆古松。三人同時(shí)都“知覺”到這一棵古松,可是三人所知覺到的卻是三種不同的東西。木材商難掩商人習(xí)性,只用木材價(jià)值來審視古松;植物學(xué)家知覺的只是一棵葉為針狀,果為球狀,四季常春的顯花植物;畫家卻只管審美,他所知覺到的只是一棵蒼翠勁拔的古樹。
同樣的一棵古松,它的形象隨觀者的性格和情趣而而變化。各人所見到的形象都是個(gè)人自己性格和情趣的觀照。古松的形象一半是天生的,一半也是人為的!極*常的知覺都帶有幾分創(chuàng)造性,極客觀的東西之中都有幾分主觀的成分。
美也是如此,即便是極客觀存在的美,也要通過審美(主觀)的眼睛才能見到。我不由得想起那句懷才不遇的老話,千里馬常有而伯樂不常有。再優(yōu)秀的設(shè)計(jì)作品也得同樣有眼光的業(yè)主才能欣賞和認(rèn)可呀(笑)。
說回上面的三種觀點(diǎn),作者認(rèn)為分別**了實(shí)用性、科學(xué)性和美感性三種截然不同的人生態(tài)度。
先說實(shí)用的態(tài)度,做人首先要維持生活,既要生活,就要講究如何利用環(huán)境!碍h(huán)境”對(duì)于生活有些有益,有些有害,有些不關(guān)痛癢。于是我們對(duì)于他們就有了愛惡的情感。這就是實(shí)用的態(tài)度。實(shí)用的態(tài)度起于實(shí)用的知覺,實(shí)用的知覺起于經(jīng)驗(yàn)。
科學(xué)的態(tài)度則不然。它純粹是客觀的,理論的。就是把自己的成見和情感完全丟開,專以“無所為而為”的精神去探索真理?茖W(xué)的態(tài)度源于公式、數(shù)據(jù)和理論。
美感經(jīng)驗(yàn)就是形象的直覺,美就是事物呈現(xiàn)形象于直覺時(shí)的特質(zhì)。所以美感的態(tài)度,是***專在事物本身的形象,也就是偏重直覺的心理活動(dòng)。
我突然聯(lián)想到,書中所說的三種態(tài)度這不就是設(shè)計(jì)裝修中的三方參與者的心理活動(dòng)嘛。我們不妨將這三種態(tài)度代入裝修工作中來看。
實(shí)用性——業(yè)主方。
什么是實(shí)用性呢,具體來說,比如衛(wèi)生間地磚是否防滑(安全第一)、廚房墻地磚好不好打理(衛(wèi)生第二)、開關(guān)位置合不合理(再也不用石頭剪刀布老虎棒子雞決定誰關(guān)燈)、不同位置燈光明暗設(shè)置得好不好(起夜開燈晃瞎眼)、門窗開扇方向合不合適、櫥柜高度會(huì)不會(huì)影響操作(不下廚理由±1)等等。
綜合整個(gè)裝修周期來講,絕大部分的業(yè)主最為關(guān)心的還是裝修實(shí)不實(shí)用,畢竟他們才是房屋的最終的使用者,實(shí)用與否決定了他們對(duì)裝修工作的蓋棺定論。
科學(xué)性——項(xiàng)目經(jīng)理。
天馬行空的設(shè)計(jì)方案如何實(shí)現(xiàn)(還能這樣做?!不要錢的嗎),裝修成本和裝修質(zhì)量該怎么權(quán)衡(缺錢or缺德),施工工藝的選擇與改進(jìn)等等等等,事無巨細(xì)都需要科學(xué)、嚴(yán)謹(jǐn)?shù)膽B(tài)度才能做出最為合理的決策。
美感性——***。
優(yōu)秀的***往往都有天馬行空的想象力和善于發(fā)現(xiàn)美的眼睛,他們專注于建筑物本身的形象,往往會(huì)先大膽構(gòu)思一種或幾種最能展現(xiàn)建筑美的方案,自我欣賞不能自拔(大霧),再結(jié)合業(yè)主的要求,從實(shí)用性和科學(xué)性出發(fā),在滿足實(shí)用功能和可行性的基礎(chǔ)上追求整體居家環(huán)境的美觀性,從而將家居生活感化,達(dá)到功能性、科學(xué)性和美感性的****。(畢竟連**是妥協(xié)的藝術(shù),更何況裝修設(shè)計(jì)呢)
我們常說藝術(shù)(或者美)源于生活而高于生活,可見只有保持適當(dāng)?shù)木嚯x和高度,才能產(chǎn)生美感,而在美感方面保持洞察力正是***的基本素養(yǎng)。
所以,在滿足功能和成本要求的情況下,希望業(yè)主朋友能夠更多地采納***的意見,向光潛先生所說的“不令人俗”的境界再靠近一些。
朱光潛《談美書簡》讀書筆記10篇(擴(kuò)展3)
——朱光潛《談美書簡》的讀書筆記
朱光潛《談美書簡》的讀書筆記1
這是朱光潛先生在83歲高齡寫給青年的美學(xué)入門讀物《談美書簡》。朱光潛先生是**現(xiàn)代美學(xué)的**人物,是開拓者和創(chuàng)新者,在美學(xué)領(lǐng)域是全國的權(quán)威,他主張美是主觀性與客觀性的**。他運(yùn)用*****的觀點(diǎn)來闡明了美和美感的規(guī)律、美范疇等一系列問題。
在前言中,朱光潛告訴我們?cè)鯓訉W(xué)美學(xué),但我認(rèn)為更重要的在于,他對(duì)我們?nèi)松^的引導(dǎo),如在前言中朱光潛寫到“正路并不一定是一條**坦坦的直路,難免有些曲折和崎嶇險(xiǎn)阻,要繞一些彎,甚至難免誤入歧途。哪個(gè)重要的科學(xué)實(shí)驗(yàn)一次就能成功呢?“失敗者成功之母”。失敗的教訓(xùn)一般比成功的經(jīng)驗(yàn)更有益”……這些都呈現(xiàn)出一種積極的人生態(tài)度。
什么是美?這是一個(gè)很基本的問題,但毫無意外地,我們大多數(shù)人并不知道它的確切答案。其實(shí)從另一個(gè)方面來說,美并沒有一個(gè)具體的標(biāo)準(zhǔn),每個(gè)人對(duì)于美都有不同的定義。在《談美書簡》中,朱光潛先生給了我們一個(gè)答案,雖然這個(gè)答案不一定正確,但至少比毫無頭緒要高明許多。
許多人都認(rèn)為,看過去舒服的就是美的,也許更深一層,會(huì)說心靈美也是一種美。但所有的這些都比較淺顯的,而深入研究,又是望塵莫及的事了。通常我們對(duì)于美、美感、美的規(guī)律、美的范疇等等這些問題感到很深?yuàn)W,也研究甚少,關(guān)于這些問題,朱光潛先生在此書中都一并回復(fù)了,而且回復(fù)的很詳盡,對(duì)于思想,文學(xué),方法,理論等等也有詳細(xì)的陳述。對(duì)于美,我們看到的都是片面的,也可以說是表面的,而看完這本書,我對(duì)于美則有了全新的看法,這也是讀此書的收獲吧。
朱光潛《談美書簡》讀書筆記10篇(擴(kuò)展4)
——《數(shù)學(xué)之美》讀書筆記10篇
《數(shù)學(xué)之美》讀書筆記1
很多人都覺得,數(shù)學(xué)是一個(gè)太高深、太理論的學(xué)科,不接近生活,對(duì)我們大多數(shù)人來說*時(shí)也根本用不到,所以沒必要去理解數(shù)學(xué)。但事情真的是這樣嗎?
其實(shí)不然,數(shù)學(xué)一直滲透在我們生活的各個(gè)方面,尤其是在今天這個(gè)信息時(shí)代,很多簡單樸素的數(shù)學(xué)思想,能發(fā)揮一般人很難想象的巨大作用。比如,計(jì)算機(jī)處理自然語言,用到的最重要工具是統(tǒng)計(jì)學(xué)的思想;計(jì)算機(jī)對(duì)**內(nèi)容的分類,依靠的是數(shù)學(xué)里的余弦定理;而電子電路的基本邏輯,則來源于僅有0和1兩個(gè)數(shù)字的布爾代數(shù)。
在《數(shù)學(xué)之美》里,吳軍用自己在工作中使用數(shù)學(xué)的親身經(jīng)歷,為我們展現(xiàn)了數(shù)學(xué)的重要性,以及他對(duì)數(shù)學(xué)之美的理解。吳軍是“得到”App專欄《吳軍的谷歌方法論》的主理人。曾先后供職于谷歌和騰訊,是著名的.自然語言處理專家和搜索專家。同時(shí),他還是位暢銷書作家,除了這本《數(shù)學(xué)之美》以外,還寫過《文明之光》《智能時(shí)代》《浪潮之巔》等多本暢銷書。
《數(shù)學(xué)之美》讀書筆記2
《數(shù)學(xué)之美》是一本領(lǐng)域相關(guān)的數(shù)學(xué)概念書,生動(dòng)形象地講解了關(guān)于數(shù)據(jù)挖掘、文本檢索等方面的基礎(chǔ)知識(shí),可以作為數(shù)據(jù)挖掘、文本檢索的入門普及書。另外,就像作者吳軍老師提到的,關(guān)鍵是要從中學(xué)到道----解決問題的方法,而不僅僅是術(shù)。書中也啟發(fā)式的引導(dǎo)讀者形成自己解決問題的道。
下面記錄一下自己讀這本書的一些感想:
第一章《文字和語言vs數(shù)字和信息》:文字和語言中天然蘊(yùn)藏著一些數(shù)學(xué)思想,數(shù)學(xué)可能不僅僅的是一門非常理科的知識(shí),也是一種藝術(shù)。另外,遇到一個(gè)復(fù)雜的問題時(shí),可能生活中的一些常識(shí),一些簡單的思想會(huì)給你帶來解決問題的靈感。
第二章《自然語言處理----從規(guī)則到統(tǒng)計(jì)》:試圖模擬人腦處理語言的模式,基于語法規(guī)則,詞性等進(jìn)行語法分析、語義分析的自然語言處理有著很大的復(fù)雜度,而基于統(tǒng)計(jì)的語言模型很好的解決了自然語言處理的諸多難題。人們認(rèn)識(shí)這個(gè)過程,找到統(tǒng)計(jì)的方法經(jīng)歷了20多年,非常慶幸我們的前輩已經(jīng)幫我們找到了正確的方法,不用我們?cè)偃タ嗫嗝。另外,這也說明在發(fā)現(xiàn)真理的過程中是充滿坎坷的,感謝那些曾經(jīng)奉獻(xiàn)了青春的科學(xué)家。自己以后遇到問題也不能輕易放棄,真正的成長是在解決問題的過程中。事情不可能****的,這是自然界的普遍真理吧!
第三章《統(tǒng)計(jì)語言模型》:自然語言的處理找到了一種合適的方法---基于統(tǒng)計(jì)的模型,概率論的知識(shí)開始發(fā)揮作用。二元模型、三元模型、多元模型,模型元數(shù)越多,計(jì)算量越大,簡單實(shí)用就是最好的。對(duì)于某些不出現(xiàn)或出現(xiàn)次數(shù)很少的詞,會(huì)有零概率問題,這是就要找到一數(shù)學(xué)方法給它一個(gè)很小的概率。以前學(xué)概率論的時(shí)候覺的沒什么用,現(xiàn)在開始發(fā)現(xiàn)這些知識(shí)可能就是你以后解決問題的利器。最后引用作者本章的最后一句話:數(shù)學(xué)的魅力就在于將復(fù)雜的問題簡單化。
第四章《談?wù)勚形姆衷~》:中文分詞是將一句話分成一些詞,這是以后進(jìn)一步處理的基礎(chǔ)。從開始的查字典到后來基于統(tǒng)計(jì)語言模型的分詞,如今的中文分詞算是一個(gè)已經(jīng)解決的問題。然而,針對(duì)不同的系統(tǒng)、不同的要求,分詞的粒度和方法也不盡相同,還是針對(duì)具體的問題,提出針對(duì)該問題最好的方法。沒有什么是絕對(duì)的,掌握其中的道才是核心。
第五章《隱馬爾科夫模型》:隱馬爾科夫模型和概率論里面的馬爾科夫鏈相似,就是該時(shí)刻的狀態(tài)僅與前面某幾個(gè)時(shí)刻的狀態(tài)有關(guān);诖罅繑(shù)據(jù)訓(xùn)練出相應(yīng)的隱馬爾科夫模型,就可以解決好多機(jī)器學(xué)習(xí)的問題,訓(xùn)練中會(huì)涉及到一些經(jīng)典的算法(維特比算法等)。關(guān)于這個(gè)模型,沒有實(shí)際實(shí)現(xiàn)過,所以感覺好陌生,只是知道了些概率論講過的原理而已。
第六章《信息的度量和作用》:信息論給出了信息的度量,它是基于概率的,概率越小,其不確定性越大,信息量就越大。引入信息量就可以消除系統(tǒng)的不確定性,同理自然語言處理的大量問題就是找相關(guān)的信息。信息熵的物理含義是對(duì)一個(gè)信息系統(tǒng)不確定性的度量,這一點(diǎn)與熱力學(xué)中的熵概念相同,看似不同的學(xué)科之間也會(huì)有著很強(qiáng)的相似性。事務(wù)之間是存在聯(lián)系的,要學(xué)會(huì)借鑒其他知識(shí)。
第七章《賈里尼克和現(xiàn)代語言處理》:賈里尼克是為世界級(jí)的大師,不僅在于他的學(xué)術(shù)成就,更在于他的風(fēng)范。賈里尼克教授少年坎坷,也并非開始就投身到自然語言方面的研究,關(guān)鍵是他的思想和他的道。賈里克尼教授治學(xué)嚴(yán)謹(jǐn)、用心對(duì)待自己的學(xué)生,對(duì)于學(xué)生的教導(dǎo),教授告訴你最多的是“什么方法不好”,這很像聽到的一句話“我不贊同你,但我**你”。賈里克尼教授一生專注學(xué)習(xí),最后在辦公桌前過世了。讀了這章我總結(jié)出的一句話是“思想決定一個(gè)人的高度”。
在這章中對(duì)于少年時(shí)的教育,以下幾點(diǎn)值得借鑒:
1、少年時(shí)期其實(shí)沒有必要花那么多時(shí)間讀書,他們的社會(huì)經(jīng)驗(yàn)、生活能力以及在那時(shí)樹立起的志向?qū)椭麄円簧?/p>
2、中學(xué)時(shí)花大量時(shí)間學(xué)會(huì)的內(nèi)容,在大學(xué)用非常短的時(shí)間就可以讀完,因?yàn)樵诖髮W(xué)階段,人的理解力要強(qiáng)很多。
3、學(xué)習(xí)(和教育)是一個(gè)人一輩子的過程。
4、書本的'內(nèi)容可以早學(xué),也可以晚學(xué),但是錯(cuò)過了成長階段卻是無法補(bǔ)回來的。
第八章《簡單之美----布爾代數(shù)和搜索引擎的索引》:布爾是19世紀(jì)英國的一位中學(xué)教師,但他的公開身份是啤酒商,提出好的思想的人不一定是大師。簡單的建立索引可以根據(jù)一個(gè)詞是否在一個(gè)網(wǎng)頁中出現(xiàn)而設(shè)置為0和1,為了適應(yīng)索引訪問的速度、附加的信息、更新要快速,改進(jìn)了索引的建立,但原理上依然簡單,等價(jià)于布爾運(yùn)算。牛頓的一句話“(人們)發(fā)覺真理在形式上從來是簡單的,而不是復(fù)雜和含混的”。做好搜索,最基本的要求是每天分析10-20個(gè)不好的搜索結(jié)果,積累一段時(shí)間才有感覺。有時(shí)候,學(xué)習(xí)、處理問題,可以從不好的方面入手,效果可能更好。
第九章《圖論和網(wǎng)絡(luò)爬蟲》:圖的遍歷分為“廣度優(yōu)先搜索(Breadth-FirstSearch,簡稱BFS)”和“深度優(yōu)先搜索(Depth-FirstSearch,簡稱DFS);ヂ(lián)網(wǎng)上有幾百億的網(wǎng)頁,需要大量的服務(wù)器用來下載網(wǎng)頁,需要協(xié)調(diào)這些服務(wù)器的任務(wù),這就是網(wǎng)絡(luò)設(shè)計(jì)和程序設(shè)計(jì)的藝術(shù)了。另外對(duì)于簡單的網(wǎng)頁,沒必要下載。還需要存儲(chǔ)一張哈希表來記錄哪些網(wǎng)頁已經(jīng)存儲(chǔ)過(如果記錄每個(gè)網(wǎng)頁的url,數(shù)量太多,這里可以用后面提到的信息指紋,只需要一個(gè)很多位的數(shù)字即可),避免重復(fù)下載。另外,在圖論出現(xiàn)的很長一段時(shí)間里,實(shí)際需求的圖只有幾千個(gè)節(jié)點(diǎn),那時(shí)圖的遍歷很簡單,人們都沒有怎么專門研究這個(gè)問題,隨著互聯(lián)網(wǎng)的出現(xiàn),圖的遍歷一下子有了用武之地,很多數(shù)學(xué)方法就是這樣,看上去沒有什么用途,等到具體的應(yīng)用出來了一下子開始派上大用場了,這可能就是世界上很多人畢生研究數(shù)學(xué)的原因吧。一個(gè)系統(tǒng)看似整體簡單,但里面的每個(gè)東西都可能是一個(gè)復(fù)雜的東西,需要很好的設(shè)計(jì)。
第十章《PageRank----Google的**表決式網(wǎng)頁排名技術(shù)》:搜索返回了成千上萬條結(jié)果,如何為搜索結(jié)果排名?這取決與兩組信息:關(guān)于網(wǎng)頁的質(zhì)量信息以及這個(gè)查詢和每個(gè)網(wǎng)頁的相關(guān)性信息。PageRank算法來衡量一個(gè)網(wǎng)頁的質(zhì)量,該算法的思想是如果一個(gè)網(wǎng)頁被很多其他網(wǎng)頁所鏈接,說明它收到普遍的承認(rèn)和信賴,那么它的排名就高。谷歌的創(chuàng)始人佩奇和布林提出了該算法并用迭代的方法解決了這個(gè)問題。PageRank在Google所有的算法中依然是至關(guān)重要的。該算法并不難,可是當(dāng)時(shí)只有佩奇和布林想到了,為什么呢?
第十一章《如何確定網(wǎng)頁和查詢的相關(guān)性》:構(gòu)建一個(gè)搜索引擎的四個(gè)方面:如何自動(dòng)下載網(wǎng)頁、如何建立索引、如何衡量網(wǎng)頁的質(zhì)量以及確定一個(gè)網(wǎng)頁和某個(gè)查詢的相關(guān)性。搜索關(guān)鍵詞權(quán)重的科學(xué)度量TF—IDF,TF衡量一個(gè)詞在一個(gè)網(wǎng)頁中的權(quán)重,即詞頻。IDF衡量一個(gè)詞本身的權(quán)重,對(duì)主題的預(yù)測能力。一個(gè)查詢和該網(wǎng)頁的相關(guān)性公式由詞頻的簡單求和變成了加權(quán)求和,即TF1*IDF1+TF2*IDF2+...+TFN*IDFN?此茝(fù)雜的搜索引擎,里面的原理竟是這么簡單!
第十二章《地圖和本地搜索的最基本技術(shù)——有限狀態(tài)機(jī)和動(dòng)態(tài)規(guī)劃》:地址的解析依靠有限狀態(tài)機(jī),當(dāng)用戶輸入的地址不太標(biāo)準(zhǔn)或有錯(cuò)別字時(shí),希望進(jìn)行模糊匹配,提出了一種基于概率的有限狀態(tài)機(jī)。通用的有限狀態(tài)機(jī)的程序不是很好寫,要求很高,建議直接采用開源的代碼。圖論中的動(dòng)態(tài)規(guī)劃問題可以用來解決兩點(diǎn)間的最短路徑問題,可以將一個(gè)“尋找全程最短路線”的問題,分解成一個(gè)個(gè)尋找局部最短路線的小問題。有限狀態(tài)機(jī)和動(dòng)態(tài)規(guī)劃問題需要看相關(guān)的算法講解,才能深入理解,目前對(duì)其并未完全理解。
第十三章《GoogleAK-47的設(shè)計(jì)者——阿米特·辛格博士》:辛格堅(jiān)持選擇簡單方案的一個(gè)原因是容易解釋每一個(gè)步驟和方法背后的道理,這樣不僅便于出了問題時(shí)查錯(cuò),而且容易找到今后改進(jìn)的目標(biāo)。辛格要求對(duì)于搜索質(zhì)量的改進(jìn)方法都要能說清楚理由,說不清楚理由的改進(jìn)即使看上去有效也不會(huì)采用,因?yàn)檫@樣將來可能是個(gè)隱患。辛格非常鼓勵(lì)年輕人要不怕失敗,大膽嘗試。遵循簡單的哲學(xué)。
第十四章《余弦定理和**的分類》:將**根據(jù)詞的TF-IDF值組成**的特征向量,然后根據(jù)向量之間的余弦距離衡量兩個(gè)特征之間的相似度,將**自動(dòng)聚類。另外根據(jù)詞的不同位置,權(quán)重應(yīng)該不同,比如標(biāo)題的詞權(quán)重明顯應(yīng)該大點(diǎn)。大數(shù)據(jù)量的余弦計(jì)算也要考慮很多簡化算法。
第十五章《矩陣運(yùn)算和文本處理中的兩個(gè)分類問題》:將大量的文本表示成文本和詞匯的矩陣,然后對(duì)該矩陣進(jìn)行奇異值SVD分解,可以得到隱含在其中的一些信息。計(jì)算余弦相似度的一次迭代時(shí)間和奇異值分解的時(shí)間復(fù)雜度在一個(gè)數(shù)量級(jí),但計(jì)算余弦相似度需要多次迭代。另外,奇異值分解的一個(gè)問題是存儲(chǔ)量大,而余弦定理的聚類則不需要。奇異值分解得到的結(jié)果略顯粗糙,實(shí)際工作中一般先進(jìn)行奇異值分解得到粗分類結(jié)果,在利用余弦計(jì)算得到比較精確地結(jié)果。我覺得這章講的SVD有些地方不是很清楚,已向吳軍老師請(qǐng)教了,等待回信。
第十六章《信息指紋及其應(yīng)用》:信息指紋可以作為信息的唯一標(biāo)識(shí)。有很多信息指紋的產(chǎn)生方法,互聯(lián)網(wǎng)加密要使用基于加密的偽隨機(jī)數(shù)產(chǎn)生器,常用的算法有MD5或者SHA-1等標(biāo)準(zhǔn)。信息指紋可以用來判定集合相同或基本相同。YouTobe就用信息指紋來反盜版。128位的指紋,1.8*10^19次才可能重復(fù)一次,所以重復(fù)的可能性幾乎為0。判定集合是否相同,從簡單的逐個(gè)比對(duì)到利用信息指紋,復(fù)雜度降低了很多很多。啟發(fā)我們有時(shí)候要用變通的思想來解決問題。
第十七章《由電視劇《**》所想到的——談?wù)劽艽a學(xué)的數(shù)學(xué)原理》:RSA加密算法,有兩個(gè)完全不同的鑰匙,一個(gè)用于加密,一個(gè)用于解密。該算法里面蘊(yùn)含著簡單但不好理解的數(shù)學(xué)思想。信息論在密碼設(shè)計(jì)中的應(yīng)用:當(dāng)密碼之間分布均勻并且統(tǒng)計(jì)**時(shí),提供的信息最少。均勻分布使得敵人無從統(tǒng)計(jì),而統(tǒng)計(jì)**能保證敵人即使知道了加密算法,也不能破譯另一段密碼。
第十八章《閃光的不一定是金子——談?wù)勊阉饕娣醋鞅讍栴}》:把搜索反作弊看成是通信模型,作弊當(dāng)做是加入的噪聲,解決噪聲的方法:從信息源出發(fā),增強(qiáng)排序算法的抗干擾能力;過濾掉噪聲,還原信息。只要噪聲不是完全隨機(jī)并且前后有相關(guān)性,就可以檢測到并消除。作弊者的方法不可能是隨機(jī)的,且不可能一天換一種方法,及作弊是時(shí)間相關(guān)的。因此在搜集一段時(shí)間的作弊信息后,就可以將作弊者抓出來,還原原有的排名。一般作弊都是針對(duì)市場份額較大的搜索引擎做的,因此,一個(gè)小的搜索引擎作弊少,并不一定是它的反作弊技術(shù)好,而是到它那里作弊的人少。
第十九章《談?wù)剶?shù)學(xué)模型的重要性》:早期的行星運(yùn)行模型用大圓套小圓的方法,精確地計(jì)算出了所有行星運(yùn)行的軌跡。但其實(shí)模型就是簡單的橢圓而已。一個(gè)正確的數(shù)學(xué)模型應(yīng)該在形式上是簡單的;一個(gè)正確的模型可能開始還不如一個(gè)精雕細(xì)琢過的錯(cuò)誤模型來的準(zhǔn)確,但是,如果我們認(rèn)定大方向是對(duì)的,就應(yīng)該堅(jiān)持下去;大量準(zhǔn)備的數(shù)據(jù)對(duì)研發(fā)很重要;正確的模型可能受到噪聲干擾,而顯得不準(zhǔn)確,這是不應(yīng)該用一種湊合的修正方法來彌補(bǔ)它,要找到噪聲的根源,這也許能通往重大的發(fā)現(xiàn)。
第二十章《不要把雞蛋放在一個(gè)籃子里——談?wù)勛畲箪啬P汀罚簩?duì)一個(gè)隨機(jī)事件預(yù)測時(shí),當(dāng)各種情況概率相等時(shí),信息熵達(dá)到最大,不確定性最大,預(yù)測的風(fēng)險(xiǎn)最小。最大熵模型的訓(xùn)練非常復(fù)雜,需要時(shí)查看資料做進(jìn)一步的理解。
第二十一章《拼音輸入法的數(shù)學(xué)原理》:輸入法經(jīng)歷了以自然音節(jié)編碼,到偏旁筆畫拆字輸入,再回歸自然音節(jié)輸入的過程。任何事物的發(fā)展,螺旋式的回歸不是簡單的重復(fù),而是一種升華。輸入法的速度取決于編碼的場地*尋找這個(gè)鍵的時(shí)間。傳統(tǒng)的雙拼,記住編碼太難,尋找每個(gè)鍵的時(shí)間太長,并且增加了編碼上的歧義。根據(jù)香農(nóng)第一定理可以計(jì)算理論上每個(gè)漢字的*均最短碼長。全拼不僅編碼*均長度較少,而且根據(jù)上下文的語言模型可以很好的解決歧義問題。利用統(tǒng)計(jì)語言模型可是實(shí)現(xiàn)拼音轉(zhuǎn)漢字的有效算法,而且可以轉(zhuǎn)換為動(dòng)態(tài)規(guī)劃求最短路徑問題。如今各家輸入法的效率基本在一個(gè)量級(jí),進(jìn)一步提升的關(guān)鍵就在于建立更好的語言模型?梢愿鶕(jù)每個(gè)用戶建立個(gè)性化的語言模型。輸入的過程本身就是人和計(jì)算機(jī)的通信,好的輸入法會(huì)自覺或者不自覺的的遵循通信的數(shù)學(xué)模型。要做出最有效的輸入法,應(yīng)該自覺使用信息論做指導(dǎo)。
第二十二章《自然語言處理的教父馬庫斯和他的優(yōu)秀弟子們》:將自然語言處理從基于規(guī)則到基于統(tǒng)計(jì),貢獻(xiàn)最大的兩個(gè)人,一個(gè)是前面介紹的賈里尼克教授,他是一個(gè)開創(chuàng)性任務(wù);另一個(gè)是將這個(gè)方法發(fā)揚(yáng)光大的米奇·馬庫斯。馬庫斯的貢獻(xiàn)在于建立了造福全世界研究者的賓夕法尼亞大學(xué)LDC語料庫以及他的眾多優(yōu)秀弟子。馬庫斯的影響力很大程度上是靠他的弟子傳播出去的。馬庫斯教授有很多值得欽佩的地方:給予他的博士研究生自己感興趣的課題的**,高屋建瓴,給學(xué)生關(guān)鍵的指導(dǎo);寬松的管理方式,培養(yǎng)各有特點(diǎn)的年輕學(xué)者;是一個(gè)有著遠(yuǎn)見卓識(shí)的管理者。他的學(xué)生為人做事風(fēng)格迥異,但都年輕有為,例如追求完美的邁克爾·柯林斯和尋求簡單美的艾克爾·*。大師之所以能成為大師,肯定有著一些優(yōu)秀的品質(zhì)和追求。
第***章《布隆過濾器》:判斷一個(gè)元素是否在一個(gè)集合當(dāng)中時(shí),用到了布隆過濾器,存儲(chǔ)量小而且計(jì)算快速。其原理是:建立一個(gè)很長的二進(jìn)制,將每個(gè)元素通過隨機(jī)數(shù)產(chǎn)生器產(chǎn)生一些信息指紋,再將這些信息指紋映射到一些自然數(shù)上,最后在建立的那個(gè)很長的二進(jìn)制上把這些自然數(shù)的位置都置為1。布隆過濾器的不足之處是它可能把不在集合中的元素錯(cuò)判成集合中的元素,但在某些條件下這個(gè)概率是很小的,補(bǔ)救措施是可以建立一個(gè)小的白名單,存儲(chǔ)那些可能誤判的元素。布隆過濾器背后的數(shù)學(xué)原理在于完全隨機(jī)的數(shù)字其沖突的可能性很小,可以用很少的空間存儲(chǔ)大量的信息,并且由于只進(jìn)行簡單的算術(shù)運(yùn)算,因此速度非?!毒幊讨榄^》中第一章的那個(gè)例子就是布隆過濾器的思想。開闊思維,尋找更好更簡單的方法。
第***章《馬爾科夫鏈的擴(kuò)展——貝葉斯網(wǎng)絡(luò)》:貝葉斯網(wǎng)絡(luò)是馬爾科夫鏈的擴(kuò)展,由簡單的線性鏈?zhǔn)疥P(guān)系擴(kuò)展為網(wǎng)絡(luò)的關(guān)系,但貝葉斯網(wǎng)絡(luò)仍然假設(shè)每一個(gè)狀態(tài)只與它直接相連的狀態(tài)相關(guān)。確定貝葉斯網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu)和各個(gè)狀態(tài)之間相關(guān)的概率也需要訓(xùn)練。在詞分類中,可以建立文章、主題和關(guān)鍵詞的貝葉斯網(wǎng)絡(luò),用來得到詞的分類。貝葉斯網(wǎng)絡(luò)的訓(xùn)練包括確定拓?fù)浣Y(jié)構(gòu)和轉(zhuǎn)移概率,比較復(fù)雜,后者可以參考最大熵訓(xùn)練的方法。貝葉斯網(wǎng)絡(luò)導(dǎo)出的模型是非常復(fù)雜的。
第二十五章《條件隨機(jī)場和句法分析》:句法分析是分析出一個(gè)句子的句子結(jié)構(gòu),對(duì)于不規(guī)則的句子,對(duì)其進(jìn)行深入的分析是很復(fù)雜的,而淺層的句法分析在很多時(shí)候已經(jīng)可以滿足要求了。條件隨機(jī)場就是進(jìn)行淺層句法分析的有效的數(shù)學(xué)模型。條件隨機(jī)場與貝葉斯網(wǎng)絡(luò)很像,不用之處在于,條件隨機(jī)場是無向圖,而貝葉斯網(wǎng)絡(luò)是有向圖。條件隨機(jī)場的訓(xùn)練很復(fù)雜,簡化之后可以參考最大熵訓(xùn)練的方法。對(duì)于條件隨機(jī)場的詳細(xì)參數(shù)及原理還不理解。
第二十六章《維特比和他的維特比算法》:維特比算法是一個(gè)動(dòng)態(tài)規(guī)劃算法,凡是使用隱馬爾科夫模型描述的問題都可以用它來解碼。維特比算法采用逐步漸進(jìn)的方法,計(jì)算到每步的最短距離,到下步的最短距離只用接著本步的計(jì)算即可,相比窮舉法,**縮短了計(jì)算的時(shí)間,并且基本可以實(shí)現(xiàn)實(shí)時(shí)的輸出,這看似簡單,但在當(dāng)時(shí)確是很了不起的。維特比并不滿足停留在算法本身,他將算法推廣出去,并應(yīng)用到了實(shí)際中,創(chuàng)立了高通公司,成為了世界上第二富有的數(shù)學(xué)家。高通公司在第二代移動(dòng)通信中并不占很強(qiáng)的市場地位,而其利用CDMA技術(shù)霸占了3G的市場,可見遠(yuǎn)見的洞察力是多么的重要。
第二十七章《再談文本分類問題——期望最大化算法》:該章講的其實(shí)就是K均值聚類問題,設(shè)置原始聚類中心,然后不斷迭代,直至收斂,將每個(gè)點(diǎn)分到一個(gè)類中。其實(shí)隱馬爾科夫模型的訓(xùn)練和最大熵的訓(xùn)練都是期望最大化算法(EM)。首先,根據(jù)現(xiàn)有的模型,計(jì)算各個(gè)觀測數(shù)據(jù)輸入到模型中的計(jì)算結(jié)果,這個(gè)過程稱為期望值計(jì)算過程,或E過程;接下來,重新計(jì)算模型參數(shù),以最大化期望值,這個(gè)過程稱為最大化的過程,或M過程。優(yōu)化的目標(biāo)函數(shù)如果是個(gè)凸函數(shù),則一定有全局最優(yōu)解,若不是凸函數(shù),則可能找到的是局部最優(yōu)解。在以后的一些問題求解過程中,應(yīng)該考慮其是否是EM問題,也可以考慮參考這種思想,不斷迭代以優(yōu)化目標(biāo)的過程。
第二十八章《邏輯回歸和搜索廣告》:雅虎和百度的競價(jià)排名廣告并不比谷歌的根據(jù)廣告的預(yù)估點(diǎn)擊率來客觀的推送廣告收入多。點(diǎn)擊預(yù)估率有很多影響因素,一種有效的方法是邏輯回歸模型,邏輯回歸模型是一種將影響概率的不同因素結(jié)合在一起的指數(shù)模型。其訓(xùn)練方法和最大熵模型相似。同樣不是很理解其具體內(nèi)涵。
第二十九章《各個(gè)擊破和Google云計(jì)算的基礎(chǔ)》:分而治之,各個(gè)擊破是一個(gè)很好的方法,Google開發(fā)的MapReduce算法就應(yīng)用了該方法。將一個(gè)大任務(wù)分成幾個(gè)小任務(wù),這個(gè)過程叫Map,將小任務(wù)的結(jié)果合并成最終結(jié)果,這個(gè)過程叫Reduce,該過程如何調(diào)度、協(xié)調(diào)就是工程上比較復(fù)雜的事情了?梢姶罅坑玫降、真正有用的方法往往簡單而又樸實(shí)。
附錄《計(jì)算復(fù)雜度》:計(jì)算機(jī)中復(fù)雜度是以O(shè)()來表示的,如果一個(gè)算法的計(jì)算量不超過N的多項(xiàng)式函數(shù),則稱算法為多項(xiàng)式函數(shù)復(fù)雜度的(P問題),是可以計(jì)算的。若比N的多項(xiàng)式函數(shù)還高,則是非多項(xiàng)式問題,實(shí)際上是不可計(jì)算的。非多項(xiàng)式問題中一種非確定的多項(xiàng)式問題(簡稱NP),是科學(xué)家研究的焦點(diǎn),因?yàn)楝F(xiàn)實(shí)中好多問題都是NP問題。另外還有NP-Complete問題(NP問題可以在多項(xiàng)式時(shí)間內(nèi)規(guī)約到該問題)和NP-Hard問題,對(duì)于這兩種問題,需要簡化找到近似解。
整體上,《數(shù)學(xué)之美》這本書讓我了解了很多文本處理,數(shù)據(jù)挖掘相關(guān)的知識(shí),學(xué)到了很多。其中,簡單美以及一些科學(xué)家的大師風(fēng)范讓我印象深刻!書中提到的一些思想(即道)讓我受益匪淺!
《數(shù)學(xué)之美》讀書筆記3
我是在讀了吳軍博士的《浪潮之巔》之后,發(fā)現(xiàn)推薦了《數(shù)學(xué)之美》這本書。我到豆瓣讀書上看了看評(píng)價(jià),就果斷在當(dāng)當(dāng)上下單買了一本研讀。本來我以為這是一本充滿各種數(shù)學(xué)專業(yè)術(shù)語的書,讀后讓我非常震撼的是吳軍博士居然能用非常通俗的語言將自然語言處理等高深理論解釋的相當(dāng)簡單。在李開復(fù)博士之后,吳軍博士又成為了目前備受矚目的具有深厚技術(shù)背景的作家。對(duì)于我來說,讀這本書有掃盲的功效,讓我知道了很多以前不知道的東西。我的想法是在研究生階段,不只局限于導(dǎo)師的研究方向,通過更加廣泛的涉獵知識(shí),去尋找一個(gè)自己喜歡的研究領(lǐng)域。如果找到了這樣一個(gè)領(lǐng)域,那么我就讀博士。如果沒有的話,那么我想還是工作算了。
1、學(xué)科之間的聯(lián)系是如此的重要
全書主要是圍繞著吳軍博士所研究的自然語言處理方向來講述一些應(yīng)用在這個(gè)研究領(lǐng)域的數(shù)學(xué)知識(shí),用了很大篇幅講解了將通信的原理應(yīng)用到自然語言處理上所取得的'巨大成功。以前學(xué)習(xí)計(jì)算機(jī)網(wǎng)絡(luò)的時(shí)候,學(xué)過一個(gè)香農(nóng)定理。對(duì)香農(nóng)的認(rèn)識(shí)就從香農(nóng)定理開始,因?yàn)榭佳袝?huì)考相關(guān)的計(jì)算題?戳诉@本書才知道,香農(nóng)的《信息論》對(duì)今天的影響真的是不可估量。通過這樣一個(gè)過程,我也對(duì)以前的本科學(xué)校的學(xué)科建設(shè)產(chǎn)生了一些憂慮。對(duì)于培養(yǎng)計(jì)算機(jī)人才來說,無論是培養(yǎng)應(yīng)用型人才,還是培養(yǎng)研究型人才,都應(yīng)該與電子、通信有一定的交叉,這樣對(duì)學(xué)生思考問題的啟發(fā)與視野的開闊有著重要的作用。計(jì)算機(jī)本身就是從電子、通信、數(shù)學(xué)等學(xué)科中抽出來的新興的學(xué)科,在發(fā)展了多年之后,我們發(fā)現(xiàn)它仍然需要繼承一些傳統(tǒng)。回想自己的本科四年,上的更多的課時(shí)
語言類、技術(shù)類的課程,這些課程的確對(duì)提升學(xué)生的就業(yè)有很大幫助。但是我想說的是,一個(gè)忽視數(shù)學(xué)基礎(chǔ)、學(xué)科交叉的學(xué)校,他無法成為一所**的一流大學(xué)。作為一個(gè)母校培養(yǎng)的學(xué)生,我深知**的阻力與困難,但是我希望母校的計(jì)算機(jī)學(xué)院能越辦越好。我們現(xiàn)在已經(jīng)培養(yǎng)出很多高薪優(yōu)秀的技術(shù)人才,我希望將來也能培養(yǎng)出更多的研究型人才。
2、看起來很牛的東西卻用著難以置信的簡單數(shù)學(xué)原理
在整本書中讓我最為印象深刻的是解釋Google搜索的原理,居然就是簡單的布爾代數(shù)運(yùn)算。這個(gè)的確讓我大跌眼鏡,我一直認(rèn)為搜索時(shí)一個(gè)非常復(fù)雜而龐大的問題,其數(shù)學(xué)原理也是相當(dāng)高深的,但是吳軍博士的解釋讓我大開眼界。與此同時(shí)也知道了Google為什么牛,牛在哪了。搜索的原理雖然非常簡單,但是搜索是一個(gè)需要對(duì)海量數(shù)據(jù)進(jìn)行操作的工作。Google在海量數(shù)據(jù)的處理方面的確是相當(dāng)先進(jìn)的,MapReduce、BigTable等等一些技術(shù)的發(fā)明與應(yīng)用使得Google在搜索上無出其右。目前分布式存儲(chǔ)、分布式計(jì)算、數(shù)據(jù)倉庫與存儲(chǔ)等研究領(lǐng)域近些年來的大熱也說明Google在引領(lǐng)研究方向上的超凡本領(lǐng)。
3、感謝概率老師的教誨
在大二的時(shí)候,有一個(gè)在我們學(xué)生中聲望很高的概率老師,他在課程即將結(jié)束的時(shí)候跟我們說我們將的是前幾章,這些事概率論與數(shù)理統(tǒng)計(jì)的基礎(chǔ)。對(duì)于你們計(jì)算機(jī)的學(xué)生來時(shí),后面的章節(jié)才是最有用的,以后一定要好好的研究,弄上一兩個(gè)在你的畢業(yè)設(shè)計(jì)上就會(huì)讓你畢業(yè)設(shè)計(jì)提升一個(gè)檔次,有可能驗(yàn)收你畢業(yè)設(shè)計(jì)的老師也不懂。我當(dāng)時(shí)對(duì)他的話沒有特別在意,我只關(guān)心期末考試要考哪些題目,因?yàn)槲夷莻(gè)學(xué)期的概率課基本上都在睡覺,只有他講笑話的時(shí)候不睡。我看《數(shù)學(xué)之美》后發(fā)現(xiàn)馬爾科夫鏈、貝葉斯網(wǎng)絡(luò)之后,對(duì)以前的概率老師充滿無限的敬意。我發(fā)現(xiàn)我們?cè)俦究齐A段學(xué)習(xí)的《高等數(shù)學(xué)》、《線性代數(shù)》、《概率論與數(shù)理統(tǒng)計(jì)》在計(jì)算機(jī)學(xué)科應(yīng)用較多的要數(shù)概率論與數(shù)理統(tǒng)計(jì),還有一門我學(xué)的不好的《離散數(shù)學(xué)》在計(jì)算機(jī)中也是有著舉足輕重的地位。我在看米歇爾的《機(jī)器學(xué)習(xí)》時(shí)也發(fā)現(xiàn)很多熟悉的概率論與數(shù)理統(tǒng)計(jì)的知識(shí),這讓我不得不開始考慮重新彌補(bǔ)自己的數(shù)學(xué)短板。我的想法是在研一這一年把概率論與數(shù)理統(tǒng)計(jì)、線性代數(shù)、離散數(shù)學(xué)盡我最大的努力補(bǔ)一補(bǔ),希望他們對(duì)我今后的學(xué)習(xí)有所幫助。
4、說說作者吳軍博士
吳軍博士寫的書對(duì)于學(xué)習(xí)計(jì)算機(jī)的學(xué)生來說,讀起來有種說不出的親切感。可能這跟他是技術(shù)出身的原因有關(guān),流暢的文筆、質(zhì)樸的文風(fēng)也讓人讀起來很舒服?**松在優(yōu)酷上的《曉說》就知道,在硅谷有著眾多的華裔工程師,他們很多都來自清華、北大等**的名牌大學(xué),這些人在**實(shí)現(xiàn)著自己的夢想。吳軍博士也曾是這其中的一員,我非常希望那些像吳軍博士一樣的牛人們能夠?qū)憰蛘邅?*的大學(xué)做一些演講、論壇等等,開闊一下我們的視野,傳授一下做學(xué)問的經(jīng)驗(yàn)。與此同時(shí),我也在想為什么我們國家那么多優(yōu)秀的IT人才都去了**。
這個(gè)問題在我去蘋果公司在東軟信息學(xué)院**的培訓(xùn)過程中得到了答案,那個(gè)南京郵電的老師講了講*為什么不像**那么有創(chuàng)造力。我們*人并不缺乏創(chuàng)造力,很多時(shí)候是我們所處的外部環(huán)境恰恰阻礙了創(chuàng)新。我想那么多優(yōu)秀的清華北大學(xué)子紛紛到大洋彼岸的**,正是被**開放的學(xué)術(shù)環(huán)境、創(chuàng)新氛圍所吸引,每個(gè)人都有自己的夢想,他們?nèi)?*也是為了能實(shí)現(xiàn)自己的夢想。以前都覺得他們是不愛國,現(xiàn)在長大了,對(duì)于這個(gè)問題看得更清楚了一點(diǎn)。
我想說我們的祖國在經(jīng)歷了**開放30多年的飛速發(fā)展之后,目前正處于一個(gè)關(guān)鍵和脆弱的時(shí)期。我們靠著人口紅利取得了巨大的成就,我們能不能憑借人才紅利取得更大的成就還是未知。希望有更多的人才能像李開復(fù)博士、吳軍博士那樣,為我們這個(gè)民族青年的成長和國家發(fā)展做出貢獻(xiàn)。
《數(shù)學(xué)之美》讀書筆記4
本書介紹了Google產(chǎn)品中涉及的自然語言處理、統(tǒng)計(jì)語言模型、中文分詞、信息度量、拼音輸入法、搜索引擎、網(wǎng)頁排名、密碼學(xué)等內(nèi)容背后的數(shù)學(xué)原理。讓我們看到了布爾代數(shù)、離散數(shù)學(xué)、統(tǒng)計(jì)學(xué)、矩陣計(jì)算、馬爾科夫鏈等似曾相識(shí)的內(nèi)容在實(shí)際生活中的應(yīng)用。相比于其他數(shù)學(xué)題材書籍,吳軍老師把抽象、深?yuàn)W的數(shù)學(xué)方法解釋得通俗易懂,書中同時(shí)引用了諸多的歷史典故和人物介紹,給人以很多啟發(fā),也讓人由衷感嘆數(shù)學(xué)的簡潔和強(qiáng)大。
雖是數(shù)據(jù)專業(yè)畢業(yè),但是才疏學(xué)淺,無力對(duì)數(shù)學(xué)的美進(jìn)行闡述。僅就書中兩個(gè)比較喜歡的地方發(fā)表一點(diǎn)不成熟的見解,與諸位共勉。
其一,在講Google的搜素引擎反作弊時(shí)談到做事情的兩種境界“道”和“術(shù)”,術(shù)就是具體的做事方法,而道則是隱藏在問題背后的動(dòng)機(jī)和本質(zhì)。在術(shù)這個(gè)層面解決問題要付出更多的努力,有點(diǎn)類似于我們常說的“頭疼醫(yī)頭,腳疼醫(yī)腳”,暫時(shí)不疼了,過幾天復(fù)發(fā)了,再去醫(yī)治,如此往復(fù),無法從根本上解決;而只有找到了致病原因,才能做到藥到病除,根本治愈。本人之前參與過行內(nèi)月終自動(dòng)核對(duì)的研發(fā),月終核對(duì)初期數(shù)據(jù)的不一致性只能靠數(shù)百業(yè)務(wù)人員人工核對(duì)數(shù)據(jù)差異,然后修改數(shù)據(jù),每月1日都要加班加點(diǎn),工作量很大,這是從術(shù)上解決問題。后來找到了產(chǎn)生差異的原因是會(huì)計(jì)核算時(shí)的利息調(diào)整造成的,把這些數(shù)據(jù)接過來進(jìn)行相應(yīng)沖減后差異就消失了,業(yè)務(wù)人員也不用來加班了,這才是從道上解決問題。
其二,是在做中文網(wǎng)頁排名時(shí)提到的從業(yè)界成功的秘訣之一:“先幫助用戶解決80%的問題,再慢慢解決剩下的20%的問題。許多時(shí)候做事失敗,不是因?yàn)槿瞬粔騼?yōu)秀,而是做事的方法不對(duì)。一開始追求大而全的解決方案,之后長時(shí)間不能完成,最后不了了之”。我們?cè)谧鲰?xiàng)目時(shí)也是一樣,業(yè)務(wù)有時(shí)要的功能非常急,可能有些功能也實(shí)現(xiàn)不了(比如系統(tǒng)響應(yīng)時(shí)間長、查詢明細(xì)不能**省行等)。這時(shí)我們就要將焦點(diǎn)關(guān)注在那些可以實(shí)現(xiàn)的80%的功能上,哪怕剛剛上線的系統(tǒng)界面丑點(diǎn),操作復(fù)雜點(diǎn),反應(yīng)速度慢點(diǎn),但是至少業(yè)務(wù)有可用的系統(tǒng),剩下時(shí)間再去優(yōu)化那剩下的20%。這樣可以幫助我行搶占先機(jī),在與同行業(yè)的競爭中取得主動(dòng)。如果等待我們把所有的細(xì)節(jié)都搞清楚再動(dòng)手開發(fā),力求完美,那么很可能系統(tǒng)能夠上線的時(shí)候業(yè)務(wù)已經(jīng)不需要了。
數(shù)學(xué)之美,也就是簡單之美。希望大家能夠喜歡數(shù)學(xué),喜歡數(shù)學(xué)之美。
《數(shù)學(xué)之美》讀書筆記5
很多人都覺得,數(shù)學(xué)是一個(gè)太高深、太理論的學(xué)科,不接近生活,對(duì)我們大多數(shù)人來說*時(shí)也根本用不到,所以沒必要去理解數(shù)學(xué)。但事情真的是這樣嗎?
其實(shí)不然,數(shù)學(xué)一直滲透在我們生活的各個(gè)方面,尤其是在今天這個(gè)信息時(shí)代,很多簡單樸素的數(shù)學(xué)思想,能發(fā)揮一般人很難想象的巨大作用。比如,計(jì)算機(jī)處理自然語言,用到的最重要工具是統(tǒng)計(jì)學(xué)的思想;計(jì)算機(jī)對(duì)**內(nèi)容的分類,依靠的是數(shù)學(xué)里的余弦定理;而電子電路的基本邏輯,則來源于僅有0和1兩個(gè)數(shù)字的布爾代數(shù)。
在《數(shù)學(xué)之美》里,吳軍用自己在工作中使用數(shù)學(xué)的親身經(jīng)歷,為我們展現(xiàn)了數(shù)學(xué)的重要性,以及他對(duì)數(shù)學(xué)之美的理解。吳軍是“得到”App專欄《吳軍的谷歌方法論》的主理人。曾先后供職于谷歌和騰訊,是著名的自然語言處理專家和搜索專家。同時(shí),他還是位暢銷書作家,除了這本《數(shù)學(xué)之美》以外,還寫過《文明之光》《智能時(shí)代》《浪潮之巔》等多本暢銷書。
《數(shù)學(xué)之美》讀書筆記6
我在想,為什么我們要學(xué)習(xí)數(shù)學(xué)?也許這個(gè)問題成年人有一萬個(gè)答案,可是當(dāng)我們第一次走進(jìn)教室,學(xué)習(xí)數(shù)學(xué)的時(shí)候,大概率還是個(gè)孩子,你怎么跟一個(gè)孩子解釋為什么要學(xué)習(xí)數(shù)學(xué)呢?我把這個(gè)問題拋給了一個(gè)朋友,他說:“為了提高思維邏輯能力,這是我初中老師在第一節(jié)數(shù)學(xué)課上告訴我們的”;蛘咭晃5歲的小朋友又會(huì)問:“什么是邏輯能力呢?”
也許從出生第一天,我們就一直在被動(dòng)的接收一些東西,父母的勸導(dǎo),老師的.傳授,可5歲的孩子還是會(huì)把玩具散落一地,6歲的孩子仍然會(huì)因?yàn)楦改覆唤o買玩具而嗷嗷大哭,無論你怎么勸導(dǎo)一個(gè)人,怎么勸誡一個(gè)人,他可能仍然會(huì)犯你認(rèn)為會(huì)出現(xiàn)的錯(cuò)誤。我記得有位教育專家這么說:“你告訴寶寶他把玩具弄壞了,就等于丟了10個(gè)棒棒糖”,從此以后這個(gè)寶寶可能會(huì)更加珍惜玩具。這個(gè)方法很簡單,但是貌似最有效。數(shù)學(xué)是什么?數(shù)學(xué)不就是把復(fù)雜的東西簡單化么?
現(xiàn)在我們?cè)倩卮鹎懊娴膯栴}:為什么我要學(xué)習(xí)數(shù)學(xué)?我們可以這么跟5歲的小朋友說:“媽媽給你10元錢,讓你買醬油,醬油7元、棒棒糖1元一個(gè),剩下的錢你可以買幾個(gè)棒棒糖?”或許想吃棒棒糖的就會(huì)苦思冥想一番,或許未來媽媽真的給他10元錢去買醬油,結(jié)果回來就變成了一瓶醬油和3個(gè)棒棒糖;蛘咴龠^一段時(shí)間,這位小朋友會(huì)選擇6元的醬油,因?yàn)榭梢垣@得4個(gè)棒棒糖了。他這么計(jì)算著:7+3和6+4都可以等于10,那么如果要必須買醬油的情況下,1+9也可以等于10。我們都知道也有1元的袋裝醬油,于是9個(gè)棒棒糖到手了。任何知識(shí)的魅力都在于自我的發(fā)現(xiàn),只有你對(duì)它產(chǎn)生了無限的興趣,你就會(huì)不斷的發(fā)現(xiàn)它的美,《數(shù)學(xué)之美》也可以變成《物理之美》。
有些人會(huì)說,上面的例子是利益驅(qū)動(dòng)型,不是興趣驅(qū)動(dòng)型,對(duì)于一個(gè)孩子來說,你能指望他向**那樣:“我需要的不是物質(zhì)世界,我需要的是精神世界?”5歲寶寶最喜歡做得事情就是在吃和玩上面,請(qǐng)問,成年人不也是如此么?這就是天性。只不過成年人的自控能力足夠大罷了。
我們回到書本上,這本書是否合適自己?如果沒有專業(yè)的數(shù)學(xué)知識(shí),很難讀懂。但是它又有著無限的魅力,讓你不自覺的讀下去,為什么?因?yàn)椤皵?shù)學(xué)之美”,雖然大多數(shù)人看不懂里面的公式,但是能夠明白數(shù)學(xué)能解決的問題:概率統(tǒng)計(jì)學(xué)能夠解決自然語言處理、布爾代數(shù)能解決搜索引擎的問題、有限狀態(tài)機(jī)和動(dòng)態(tài)規(guī)劃能解決地圖問題、向量+特征向量+余弦定理能解決自動(dòng)**分類問題、最大熵模型解決金融問題,看著看著我就莫名的產(chǎn)生了一種想要學(xué)習(xí)算法的沖動(dòng),這不就是本書的意義所在么?
《數(shù)學(xué)之美》讀書筆記7
吳軍2012年的作品,源于其在谷歌黑板報(bào)的系列文章,講述數(shù)學(xué)方法在信息技術(shù)中的應(yīng)用,說明了為什么科學(xué)研究中方法論如此的重要,以及數(shù)學(xué)如何簡單優(yōu)雅地解決問題,直達(dá)本質(zhì)。對(duì)比他的其他作品比如《浪潮之巔》、《硅谷之謎》,本書比較偏技術(shù),屬于目前大熱的數(shù)據(jù)科學(xué)(Data Science)范疇,在云計(jì)算、大數(shù)據(jù)和人工智能等成為常態(tài)和趨勢的今天,適合所有對(duì)IT技術(shù)及相關(guān)管理人員閱讀。對(duì)我而言,最大的收獲包括:
規(guī)則vs.算法:自然語言處理,在早期幾十年基于文法規(guī)則都無法達(dá)到可應(yīng)用的效果,終于在轉(zhuǎn)變?yōu)榛诮y(tǒng)計(jì)方法且積累了足夠數(shù)據(jù)后,形成了突破,達(dá)到了今日可大規(guī)模商用的效果。再次說明了數(shù)據(jù)及算法在今日的重要性。
一些常見應(yīng)用涉及的優(yōu)化算法:搜索相關(guān)(分詞、網(wǎng)絡(luò)爬蟲、索引、結(jié)果排名、廣告及反作弊)、文本處理(**分類、廣告相關(guān)性、輸入法)、地圖路線規(guī)劃、信息指紋、密碼學(xué)等。這些算法不止適用于這些應(yīng)用場景,還可以在其他許多地方借鑒,比如用戶評(píng)論分析也需要用分詞和語義分析,許多價(jià)值優(yōu)化算法都需要用到期望值最大化和邏輯回歸等。
優(yōu)雅的理論模型:在初始階段,出于時(shí)間和成本考慮,在技術(shù)實(shí)現(xiàn)上可能會(huì)使用一些拼湊的方法,甚至山寨,但是這種方法并不可持續(xù),很難進(jìn)行系統(tǒng)化的優(yōu)化,開發(fā)維護(hù)成本都很高,最終會(huì)遇到災(zāi)難性問題。做事情需要有境界,最求簡單而優(yōu)雅的理論和工程實(shí)現(xiàn),這在長期是非常有好處的。
吳軍使用淺顯易懂的語言,把解決問題的思路和復(fù)雜的數(shù)學(xué)模型講得很清楚,雖然理解延伸閱讀里的具體數(shù)學(xué)公式還是有些挑戰(zhàn)。其實(shí)重要的是思想和方法,具體的實(shí)現(xiàn)可以在用到時(shí)再進(jìn)一步的了解。如何用簡單的語言把復(fù)雜的技術(shù)講清楚,也是我工作的需要,要不斷學(xué)習(xí)磨練。書里提到了啟發(fā)吳軍這方面能力的兩本書,即《從0到無窮大》和《時(shí)間簡史》,會(huì)有要去看下。
《數(shù)學(xué)之美》讀書筆記8
《數(shù)學(xué)之美》是一本領(lǐng)域相關(guān)的數(shù)學(xué)概念書,生動(dòng)形象地講解了關(guān)于數(shù)據(jù)挖掘、文本檢索等方面的基礎(chǔ)知識(shí),可以作為數(shù)據(jù)挖掘、文本檢索的入門普及書。另外,就像作者吳軍老師提到的,關(guān)鍵是要從中學(xué)到道----解決問題的方法,而不僅僅是術(shù)。書中也啟發(fā)式的引導(dǎo)讀者形成自己解決問題的道。
下面記錄一下自己讀這本書的一些感想:
第一章《文字和語言vs數(shù)字和信息》:文字和語言中天然蘊(yùn)藏著一些數(shù)學(xué)思想,數(shù)學(xué)可能不僅僅的是一門非常理科的知識(shí),也是一種藝術(shù)。另外,遇到一個(gè)復(fù)雜的問題時(shí),可能生活中的一些常識(shí),一些簡單的思想會(huì)給你帶來解決問題的靈感。
第二章《自然語言處理----從規(guī)則到統(tǒng)計(jì)》:試圖模擬人腦處理語言的模式,基于語法規(guī)則,詞性等進(jìn)行語法分析、語義分析的自然語言處理有著很大的復(fù)雜度,而基于統(tǒng)計(jì)的語言模型很好的解決了自然語言處理的諸多難題。人們認(rèn)識(shí)這個(gè)過程,找到統(tǒng)計(jì)的方法經(jīng)歷了20多年,非常慶幸我們的前輩已經(jīng)幫我們找到了正確的方法,不用我們?cè)偃タ嗫嗝。另外,這也說明在發(fā)現(xiàn)真理的過程中是充滿坎坷的,感謝那些曾經(jīng)奉獻(xiàn)了青春的科學(xué)家。自己以后遇到問題也不能輕易放棄,真正的成長是在解決問題的過程中。事情不可能****的,這是自然界的普遍真理吧!
第三章《統(tǒng)計(jì)語言模型》:自然語言的處理找到了一種合適的方法---基于統(tǒng)計(jì)的模型,概率論的知識(shí)開始發(fā)揮作用。二元模型、三元模型、多元模型,模型元數(shù)越多,計(jì)算量越大,簡單實(shí)用就是最好的。對(duì)于某些不出現(xiàn)或出現(xiàn)次數(shù)很少的詞,會(huì)有零概率問題,這是就要找到一數(shù)學(xué)方法給它一個(gè)很小的概率。以前學(xué)概率論的時(shí)候覺的沒什么用,現(xiàn)在開始發(fā)現(xiàn)這些知識(shí)可能就是你以后解決問題的利器。最后引用作者本章的最后一句話:數(shù)學(xué)的魅力就在于將復(fù)雜的問題簡單化。
第四章《談?wù)勚形姆衷~》:中文分詞是將一句話分成一些詞,這是以后進(jìn)一步處理的基礎(chǔ)。從開始的查字典到后來基于統(tǒng)計(jì)語言模型的分詞,如今的中文分詞算是一個(gè)已經(jīng)解決的問題。然而,針對(duì)不同的系統(tǒng)、不同的要求,分詞的粒度和方法也不盡相同,還是針對(duì)具體的問題,提出針對(duì)該問題最好的方法。沒有什么是絕對(duì)的,掌握其中的道才是核心。
第五章《隱馬爾科夫模型》:隱馬爾科夫模型和概率論里面的馬爾科夫鏈相似,就是該時(shí)刻的狀態(tài)僅與前面某幾個(gè)時(shí)刻的狀態(tài)有關(guān)。基于大量數(shù)據(jù)訓(xùn)練出相應(yīng)的隱馬爾科夫模型,就可以解決好多機(jī)器學(xué)習(xí)的問題,訓(xùn)練中會(huì)涉及到一些經(jīng)典的算法(維特比算法等)。關(guān)于這個(gè)模型,沒有實(shí)際實(shí)現(xiàn)過,所以感覺好陌生,只是知道了些概率論講過的原理而已。
第六章《信息的度量和作用》:信息論給出了信息的度量,它是基于概率的,概率越小,其不確定性越大,信息量就越大。引入信息量就可以消除系統(tǒng)的不確定性,同理自然語言處理的大量問題就是找相關(guān)的信息。信息熵的物理含義是對(duì)一個(gè)信息系統(tǒng)不確定性的度量,這一點(diǎn)與熱力學(xué)中的熵概念相同,看似不同的學(xué)科之間也會(huì)有著很強(qiáng)的相似性。事務(wù)之間是存在聯(lián)系的,要學(xué)會(huì)借鑒其他知識(shí)。
第七章《賈里尼克和現(xiàn)代語言處理》:賈里尼克是為世界級(jí)的大師,不僅在于他的學(xué)術(shù)成就,更在于他的風(fēng)范。賈里尼克教授少年坎坷,也并非開始就投身到自然語言方面的研究,關(guān)鍵是他的思想和他的道。賈里克尼教授治學(xué)嚴(yán)謹(jǐn)、用心對(duì)待自己的學(xué)生,對(duì)于學(xué)生的教導(dǎo),教授告訴你最多的是“什么方法不好”,這很像聽到的一句話“我不贊同你,但我**你”。賈里克尼教授一生專注學(xué)習(xí),最后在辦公桌前過世了。讀了這章我總結(jié)出的一句話是“思想決定一個(gè)人的高度”。
在這章中對(duì)于少年時(shí)的教育,以下幾點(diǎn)值得借鑒:
1、少年時(shí)期其實(shí)沒有必要花那么多時(shí)間讀書,他們的社會(huì)經(jīng)驗(yàn)、生活能力以及在那時(shí)樹立起的志向?qū)椭麄円簧?/p>
2、中學(xué)時(shí)花大量時(shí)間學(xué)會(huì)的內(nèi)容,在大學(xué)用非常短的時(shí)間就可以讀完,因?yàn)樵诖髮W(xué)階段,人的理解力要強(qiáng)很多。
3、學(xué)習(xí)(和教育)是一個(gè)人一輩子的過程。
4、書本的內(nèi)容可以早學(xué),也可以晚學(xué),但是錯(cuò)過了成長階段卻是無法補(bǔ)回來的。
第八章《簡單之美----布爾代數(shù)和搜索引擎的索引》:布爾是19世紀(jì)英國的一位中學(xué)教師,但他的公開身份是啤酒商,提出好的思想的人不一定是大師。簡單的建立索引可以根據(jù)一個(gè)詞是否在一個(gè)網(wǎng)頁中出現(xiàn)而設(shè)置為0和1,為了適應(yīng)索引訪問的速度、附加的信息、更新要快速,改進(jìn)了索引的建立,但原理上依然簡單,等價(jià)于布爾運(yùn)算。牛頓的一句話“(人們)發(fā)覺真理在形式上從來是簡單的,而不是復(fù)雜和含混的”。做好搜索,最基本的要求是每天分析10-20個(gè)不好的搜索結(jié)果,積累一段時(shí)間才有感覺。有時(shí)候,學(xué)習(xí)、處理問題,可以從不好的方面入手,效果可能更好。
第九章《圖論和網(wǎng)絡(luò)爬蟲》:圖的遍歷分為“廣度優(yōu)先搜索(Breadth-FirstSearch,簡稱BFS)”和“深度優(yōu)先搜索(Depth-FirstSearch,簡稱DFS)。互聯(lián)網(wǎng)上有幾百億的網(wǎng)頁,需要大量的服務(wù)器用來下載網(wǎng)頁,需要協(xié)調(diào)這些服務(wù)器的任務(wù),這就是網(wǎng)絡(luò)設(shè)計(jì)和程序設(shè)計(jì)的藝術(shù)了。另外對(duì)于簡單的網(wǎng)頁,沒必要下載。還需要存儲(chǔ)一張哈希表來記錄哪些網(wǎng)頁已經(jīng)存儲(chǔ)過(如果記錄每個(gè)網(wǎng)頁的url,數(shù)量太多,這里可以用后面提到的信息指紋,只需要一個(gè)很多位的數(shù)字即可),避免重復(fù)下載。另外,在圖論出現(xiàn)的很長一段時(shí)間里,實(shí)際需求的圖只有幾千個(gè)節(jié)點(diǎn),那時(shí)圖的遍歷很簡單,人們都沒有怎么專門研究這個(gè)問題,隨著互聯(lián)網(wǎng)的出現(xiàn),圖的遍歷一下子有了用武之地,很多數(shù)學(xué)方法就是這樣,看上去沒有什么用途,等到具體的應(yīng)用出來了一下子開始派上大用場了,這可能就是世界上很多人畢生研究數(shù)學(xué)的原因吧。一個(gè)系統(tǒng)看似整體簡單,但里面的每個(gè)東西都可能是一個(gè)復(fù)雜的東西,需要很好的設(shè)計(jì)。
第十章《PageRank----Google的**表決式網(wǎng)頁排名技術(shù)》:搜索返回了成千上萬條結(jié)果,如何為搜索結(jié)果排名?這取決與兩組信息:關(guān)于網(wǎng)頁的質(zhì)量信息以及這個(gè)查詢和每個(gè)網(wǎng)頁的相關(guān)性信息。PageRank算法來衡量一個(gè)網(wǎng)頁的質(zhì)量,該算法的思想是如果一個(gè)網(wǎng)頁被很多其他網(wǎng)頁所鏈接,說明它收到普遍的承認(rèn)和信賴,那么它的排名就高。谷歌的創(chuàng)始人佩奇和布林提出了該算法并用迭代的方法解決了這個(gè)問題。PageRank在Google所有的算法中依然是至關(guān)重要的。該算法并不難,可是當(dāng)時(shí)只有佩奇和布林想到了,為什么呢?
第十一章《如何確定網(wǎng)頁和查詢的相關(guān)性》:構(gòu)建一個(gè)搜索引擎的四個(gè)方面:如何自動(dòng)下載網(wǎng)頁、如何建立索引、如何衡量網(wǎng)頁的質(zhì)量以及確定一個(gè)網(wǎng)頁和某個(gè)查詢的相關(guān)性。搜索關(guān)鍵詞權(quán)重的科學(xué)度量TF—IDF,TF衡量一個(gè)詞在一個(gè)網(wǎng)頁中的權(quán)重,即詞頻。IDF衡量一個(gè)詞本身的權(quán)重,對(duì)主題的預(yù)測能力。一個(gè)查詢和該網(wǎng)頁的相關(guān)性公式由詞頻的簡單求和變成了加權(quán)求和,即TF1*IDF1+TF2*IDF2+...+TFN*IDFN?此茝(fù)雜的搜索引擎,里面的原理竟是這么簡單!
第十二章《地圖和本地搜索的最基本技術(shù)——有限狀態(tài)機(jī)和動(dòng)態(tài)規(guī)劃》:地址的解析依靠有限狀態(tài)機(jī),當(dāng)用戶輸入的地址不太標(biāo)準(zhǔn)或有錯(cuò)別字時(shí),希望進(jìn)行模糊匹配,提出了一種基于概率的有限狀態(tài)機(jī)。通用的有限狀態(tài)機(jī)的程序不是很好寫,要求很高,建議直接采用開源的代碼。圖論中的動(dòng)態(tài)規(guī)劃問題可以用來解決兩點(diǎn)間的最短路徑問題,可以將一個(gè)“尋找全程最短路線”的問題,分解成一個(gè)個(gè)尋找局部最短路線的小問題。有限狀態(tài)機(jī)和動(dòng)態(tài)規(guī)劃問題需要看相關(guān)的算法講解,才能深入理解,目前對(duì)其并未完全理解。
第十三章《GoogleAK-47的設(shè)計(jì)者——阿米特·辛格博士》:辛格堅(jiān)持選擇簡單方案的一個(gè)原因是容易解釋每一個(gè)步驟和方法背后的道理,這樣不僅便于出了問題時(shí)查錯(cuò),而且容易找到今后改進(jìn)的目標(biāo)。辛格要求對(duì)于搜索質(zhì)量的改進(jìn)方法都要能說清楚理由,說不清楚理由的改進(jìn)即使看上去有效也不會(huì)采用,因?yàn)檫@樣將來可能是個(gè)隱患。辛格非常鼓勵(lì)年輕人要不怕失敗,大膽嘗試。遵循簡單的哲學(xué)。
第十四章《余弦定理和**的分類》:將**根據(jù)詞的TF-IDF值組成**的特征向量,然后根據(jù)向量之間的余弦距離衡量兩個(gè)特征之間的相似度,將**自動(dòng)聚類。另外根據(jù)詞的不同位置,權(quán)重應(yīng)該不同,比如標(biāo)題的詞權(quán)重明顯應(yīng)該大點(diǎn)。大數(shù)據(jù)量的余弦計(jì)算也要考慮很多簡化算法。
第十五章《矩陣運(yùn)算和文本處理中的兩個(gè)分類問題》:將大量的文本表示成文本和詞匯的矩陣,然后對(duì)該矩陣進(jìn)行奇異值SVD分解,可以得到隱含在其中的一些信息。計(jì)算余弦相似度的一次迭代時(shí)間和奇異值分解的時(shí)間復(fù)雜度在一個(gè)數(shù)量級(jí),但計(jì)算余弦相似度需要多次迭代。另外,奇異值分解的一個(gè)問題是存儲(chǔ)量大,而余弦定理的聚類則不需要。奇異值分解得到的結(jié)果略顯粗糙,實(shí)際工作中一般先進(jìn)行奇異值分解得到粗分類結(jié)果,在利用余弦計(jì)算得到比較精確地結(jié)果。我覺得這章講的SVD有些地方不是很清楚,已向吳軍老師請(qǐng)教了,等待回信。
第十六章《信息指紋及其應(yīng)用》:信息指紋可以作為信息的唯一標(biāo)識(shí)。有很多信息指紋的產(chǎn)生方法,互聯(lián)網(wǎng)加密要使用基于加密的偽隨機(jī)數(shù)產(chǎn)生器,常用的算法有MD5或者SHA-1等標(biāo)準(zhǔn)。信息指紋可以用來判定集合相同或基本相同。YouTobe就用信息指紋來反盜版。128位的指紋,1.8*10^19次才可能重復(fù)一次,所以重復(fù)的可能性幾乎為0。判定集合是否相同,從簡單的逐個(gè)比對(duì)到利用信息指紋,復(fù)雜度降低了很多很多。啟發(fā)我們有時(shí)候要用變通的思想來解決問題。
第十七章《由電視劇《**》所想到的——談?wù)劽艽a學(xué)的數(shù)學(xué)原理》:RSA加密算法,有兩個(gè)完全不同的鑰匙,一個(gè)用于加密,一個(gè)用于解密。該算法里面蘊(yùn)含著簡單但不好理解的數(shù)學(xué)思想。信息論在密碼設(shè)計(jì)中的應(yīng)用:當(dāng)密碼之間分布均勻并且統(tǒng)計(jì)**時(shí),提供的信息最少。均勻分布使得敵人無從統(tǒng)計(jì),而統(tǒng)計(jì)**能保證敵人即使知道了加密算法,也不能破譯另一段密碼。
第十八章《閃光的不一定是金子——談?wù)勊阉饕娣醋鞅讍栴}》:把搜索反作弊看成是通信模型,作弊當(dāng)做是加入的噪聲,解決噪聲的方法:從信息源出發(fā),增強(qiáng)排序算法的抗干擾能力;過濾掉噪聲,還原信息。只要噪聲不是完全隨機(jī)并且前后有相關(guān)性,就可以檢測到并消除。作弊者的方法不可能是隨機(jī)的,且不可能一天換一種方法,及作弊是時(shí)間相關(guān)的。因此在搜集一段時(shí)間的作弊信息后,就可以將作弊者抓出來,還原原有的排名。一般作弊都是針對(duì)市場份額較大的搜索引擎做的,因此,一個(gè)小的搜索引擎作弊少,并不一定是它的反作弊技術(shù)好,而是到它那里作弊的人少。
第十九章《談?wù)剶?shù)學(xué)模型的重要性》:早期的行星運(yùn)行模型用大圓套小圓的方法,精確地計(jì)算出了所有行星運(yùn)行的軌跡。但其實(shí)模型就是簡單的橢圓而已。一個(gè)正確的數(shù)學(xué)模型應(yīng)該在形式上是簡單的;一個(gè)正確的模型可能開始還不如一個(gè)精雕細(xì)琢過的錯(cuò)誤模型來的準(zhǔn)確,但是,如果我們認(rèn)定大方向是對(duì)的,就應(yīng)該堅(jiān)持下去;大量準(zhǔn)備的數(shù)據(jù)對(duì)研發(fā)很重要;正確的模型可能受到噪聲干擾,而顯得不準(zhǔn)確,這是不應(yīng)該用一種湊合的修正方法來彌補(bǔ)它,要找到噪聲的根源,這也許能通往重大的發(fā)現(xiàn)。
第二十章《不要把雞蛋放在一個(gè)籃子里——談?wù)勛畲箪啬P汀罚簩?duì)一個(gè)隨機(jī)事件預(yù)測時(shí),當(dāng)各種情況概率相等時(shí),信息熵達(dá)到最大,不確定性最大,預(yù)測的風(fēng)險(xiǎn)最小。最大熵模型的訓(xùn)練非常復(fù)雜,需要時(shí)查看資料做進(jìn)一步的理解。
第二十一章《拼音輸入法的數(shù)學(xué)原理》:輸入法經(jīng)歷了以自然音節(jié)編碼,到偏旁筆畫拆字輸入,再回歸自然音節(jié)輸入的過程。任何事物的發(fā)展,螺旋式的回歸不是簡單的重復(fù),而是一種升華。輸入法的速度取決于編碼的場地*尋找這個(gè)鍵的時(shí)間。傳統(tǒng)的雙拼,記住編碼太難,尋找每個(gè)鍵的時(shí)間太長,并且增加了編碼上的歧義。根據(jù)香農(nóng)第一定理可以計(jì)算理論上每個(gè)漢字的*均最短碼長。全拼不僅編碼*均長度較少,而且根據(jù)上下文的語言模型可以很好的解決歧義問題。利用統(tǒng)計(jì)語言模型可是實(shí)現(xiàn)拼音轉(zhuǎn)漢字的有效算法,而且可以轉(zhuǎn)換為動(dòng)態(tài)規(guī)劃求最短路徑問題。如今各家輸入法的效率基本在一個(gè)量級(jí),進(jìn)一步提升的關(guān)鍵就在于建立更好的語言模型。可以根據(jù)每個(gè)用戶建立個(gè)性化的語言模型。輸入的過程本身就是人和計(jì)算機(jī)的通信,好的輸入法會(huì)自覺或者不自覺的的遵循通信的數(shù)學(xué)模型。要做出最有效的輸入法,應(yīng)該自覺使用信息論做指導(dǎo)。
第二十二章《自然語言處理的教父馬庫斯和他的優(yōu)秀弟子們》:將自然語言處理從基于規(guī)則到基于統(tǒng)計(jì),貢獻(xiàn)最大的兩個(gè)人,一個(gè)是前面介紹的賈里尼克教授,他是一個(gè)開創(chuàng)性任務(wù);另一個(gè)是將這個(gè)方法發(fā)揚(yáng)光大的米奇·馬庫斯。馬庫斯的貢獻(xiàn)在于建立了造福全世界研究者的賓夕法尼亞大學(xué)LDC語料庫以及他的眾多優(yōu)秀弟子。馬庫斯的影響力很大程度上是靠他的弟子傳播出去的。馬庫斯教授有很多值得欽佩的地方:給予他的博士研究生自己感興趣的課題的**,高屋建瓴,給學(xué)生關(guān)鍵的指導(dǎo);寬松的管理方式,培養(yǎng)各有特點(diǎn)的年輕學(xué)者;是一個(gè)有著遠(yuǎn)見卓識(shí)的管理者。他的學(xué)生為人做事風(fēng)格迥異,但都年輕有為,例如追求完美的邁克爾·柯林斯和尋求簡單美的艾克爾·*。大師之所以能成為大師,肯定有著一些優(yōu)秀的品質(zhì)和追求。
第***章《布隆過濾器》:判斷一個(gè)元素是否在一個(gè)集合當(dāng)中時(shí),用到了布隆過濾器,存儲(chǔ)量小而且計(jì)算快速。其原理是:建立一個(gè)很長的二進(jìn)制,將每個(gè)元素通過隨機(jī)數(shù)產(chǎn)生器產(chǎn)生一些信息指紋,再將這些信息指紋映射到一些自然數(shù)上,最后在建立的那個(gè)很長的二進(jìn)制上把這些自然數(shù)的位置都置為1。布隆過濾器的不足之處是它可能把不在集合中的元素錯(cuò)判成集合中的元素,但在某些條件下這個(gè)概率是很小的,補(bǔ)救措施是可以建立一個(gè)小的白名單,存儲(chǔ)那些可能誤判的元素。布隆過濾器背后的數(shù)學(xué)原理在于完全隨機(jī)的數(shù)字其沖突的可能性很小,可以用很少的空間存儲(chǔ)大量的信息,并且由于只進(jìn)行簡單的算術(shù)運(yùn)算,因此速度非?臁!毒幊讨榄^》中第一章的那個(gè)例子就是布隆過濾器的思想。開闊思維,尋找更好更簡單的方法。
第***章《馬爾科夫鏈的擴(kuò)展——貝葉斯網(wǎng)絡(luò)》:貝葉斯網(wǎng)絡(luò)是馬爾科夫鏈的擴(kuò)展,由簡單的線性鏈?zhǔn)疥P(guān)系擴(kuò)展為網(wǎng)絡(luò)的關(guān)系,但貝葉斯網(wǎng)絡(luò)仍然假設(shè)每一個(gè)狀態(tài)只與它直接相連的狀態(tài)相關(guān)。確定貝葉斯網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu)和各個(gè)狀態(tài)之間相關(guān)的概率也需要訓(xùn)練。在詞分類中,可以建立文章、主題和關(guān)鍵詞的貝葉斯網(wǎng)絡(luò),用來得到詞的分類。貝葉斯網(wǎng)絡(luò)的訓(xùn)練包括確定拓?fù)浣Y(jié)構(gòu)和轉(zhuǎn)移概率,比較復(fù)雜,后者可以參考最大熵訓(xùn)練的方法。貝葉斯網(wǎng)絡(luò)導(dǎo)出的模型是非常復(fù)雜的。
第二十五章《條件隨機(jī)場和句法分析》:句法分析是分析出一個(gè)句子的句子結(jié)構(gòu),對(duì)于不規(guī)則的句子,對(duì)其進(jìn)行深入的分析是很復(fù)雜的,而淺層的句法分析在很多時(shí)候已經(jīng)可以滿足要求了。條件隨機(jī)場就是進(jìn)行淺層句法分析的有效的數(shù)學(xué)模型。條件隨機(jī)場與貝葉斯網(wǎng)絡(luò)很像,不用之處在于,條件隨機(jī)場是無向圖,而貝葉斯網(wǎng)絡(luò)是有向圖。條件隨機(jī)場的訓(xùn)練很復(fù)雜,簡化之后可以參考最大熵訓(xùn)練的方法。對(duì)于條件隨機(jī)場的詳細(xì)參數(shù)及原理還不理解。
第二十六章《維特比和他的維特比算法》:維特比算法是一個(gè)動(dòng)態(tài)規(guī)劃算法,凡是使用隱馬爾科夫模型描述的問題都可以用它來解碼。維特比算法采用逐步漸進(jìn)的方法,計(jì)算到每步的最短距離,到下步的最短距離只用接著本步的計(jì)算即可,相比窮舉法,**縮短了計(jì)算的時(shí)間,并且基本可以實(shí)現(xiàn)實(shí)時(shí)的輸出,這看似簡單,但在當(dāng)時(shí)確是很了不起的.。維特比并不滿足停留在算法本身,他將算法推廣出去,并應(yīng)用到了實(shí)際中,創(chuàng)立了高通公司,成為了世界上第二富有的數(shù)學(xué)家。高通公司在第二代移動(dòng)通信中并不占很強(qiáng)的市場地位,而其利用CDMA技術(shù)霸占了3G的市場,可見遠(yuǎn)見的洞察力是多么的重要。
第二十七章《再談文本分類問題——期望最大化算法》:該章講的其實(shí)就是K均值聚類問題,設(shè)置原始聚類中心,然后不斷迭代,直至收斂,將每個(gè)點(diǎn)分到一個(gè)類中。其實(shí)隱馬爾科夫模型的訓(xùn)練和最大熵的訓(xùn)練都是期望最大化算法(EM)。首先,根據(jù)現(xiàn)有的模型,計(jì)算各個(gè)觀測數(shù)據(jù)輸入到模型中的計(jì)算結(jié)果,這個(gè)過程稱為期望值計(jì)算過程,或E過程;接下來,重新計(jì)算模型參數(shù),以最大化期望值,這個(gè)過程稱為最大化的過程,或M過程。優(yōu)化的目標(biāo)函數(shù)如果是個(gè)凸函數(shù),則一定有全局最優(yōu)解,若不是凸函數(shù),則可能找到的是局部最優(yōu)解。在以后的一些問題求解過程中,應(yīng)該考慮其是否是EM問題,也可以考慮參考這種思想,不斷迭代以優(yōu)化目標(biāo)的過程。
第二十八章《邏輯回歸和搜索廣告》:雅虎和百度的競價(jià)排名廣告并不比谷歌的根據(jù)廣告的預(yù)估點(diǎn)擊率來客觀的推送廣告收入多。點(diǎn)擊預(yù)估率有很多影響因素,一種有效的方法是邏輯回歸模型,邏輯回歸模型是一種將影響概率的不同因素結(jié)合在一起的指數(shù)模型。其訓(xùn)練方法和最大熵模型相似。同樣不是很理解其具體內(nèi)涵。
第二十九章《各個(gè)擊破和Google云計(jì)算的基礎(chǔ)》:分而治之,各個(gè)擊破是一個(gè)很好的方法,Google開發(fā)的MapReduce算法就應(yīng)用了該方法。將一個(gè)大任務(wù)分成幾個(gè)小任務(wù),這個(gè)過程叫Map,將小任務(wù)的結(jié)果合并成最終結(jié)果,這個(gè)過程叫Reduce,該過程如何調(diào)度、協(xié)調(diào)就是工程上比較復(fù)雜的事情了?梢姶罅坑玫降、真正有用的方法往往簡單而又樸實(shí)。
附錄《計(jì)算復(fù)雜度》:計(jì)算機(jī)中復(fù)雜度是以O(shè)()來表示的,如果一個(gè)算法的計(jì)算量不超過N的多項(xiàng)式函數(shù),則稱算法為多項(xiàng)式函數(shù)復(fù)雜度的(P問題),是可以計(jì)算的。若比N的多項(xiàng)式函數(shù)還高,則是非多項(xiàng)式問題,實(shí)際上是不可計(jì)算的。非多項(xiàng)式問題中一種非確定的多項(xiàng)式問題(簡稱NP),是科學(xué)家研究的焦點(diǎn),因?yàn)楝F(xiàn)實(shí)中好多問題都是NP問題。另外還有NP-Complete問題(NP問題可以在多項(xiàng)式時(shí)間內(nèi)規(guī)約到該問題)和NP-Hard問題,對(duì)于這兩種問題,需要簡化找到近似解。
整體上,《數(shù)學(xué)之美》這本書讓我了解了很多文本處理,數(shù)據(jù)挖掘相關(guān)的知識(shí),學(xué)到了很多。其中,簡單美以及一些科學(xué)家的大師風(fēng)范讓我印象深刻!書中提到的一些思想(即道)讓我受益匪淺!
《數(shù)學(xué)之美》讀書筆記9
最近看了這本《數(shù)學(xué)之美》,不得不感嘆一句,可惜早已身不在起點(diǎn)。
我讀書的時(shí)候,數(shù)學(xué)成績一直都很好,雖然離開學(xué)校已經(jīng)10多年,自覺當(dāng)初的知識(shí)還是記得很多,6~7年前再考線性代數(shù)和概率論,還是得到了很高的分?jǐn)?shù)。不過我也和大部分人一樣,覺得數(shù)學(xué)沒有太多用處,特別是高中和大學(xué)里面學(xué)的,那些三角函數(shù),向量,大數(shù)定律,解析幾何,除了在考試的題目里面用一下,*時(shí)又有什么地方可以用呢?
看了《數(shù)學(xué)之美》,驚嘆于數(shù)學(xué)的浩瀚和簡單,說它浩瀚,是因?yàn)樗姆种Шw了科學(xué)的方方面面,是所有科學(xué)的理論基礎(chǔ),說它簡單,無論多復(fù)雜的問題,最后總結(jié)的數(shù)學(xué)公式都簡單到只有區(qū)區(qū)幾個(gè)符號(hào)和字母。
這本書介紹數(shù)學(xué)理論在互聯(lián)網(wǎng)上的運(yùn)用,*時(shí)我們?cè)谑褂没ヂ?lián)網(wǎng)搜索或者翻譯功能的時(shí)候,時(shí)常會(huì)感嘆電腦對(duì)自己的了解和它的聰明,其實(shí)背后的原理就是一個(gè)個(gè)精美的算法和大量數(shù)據(jù)的訓(xùn)練。那些或者熟悉或者陌生的數(shù)學(xué)知識(shí)(聯(lián)合概率分布,維特比算法,期望最大化,貝葉斯網(wǎng)絡(luò),隱形馬爾可夫鏈,余弦定律,etc),一步步構(gòu)建了我們現(xiàn)在所賴以生存的網(wǎng)上世界。
之所以覺得自己早已身不在起點(diǎn),是因?yàn)樯厦孢@些數(shù)學(xué)知識(shí),早已經(jīng)不在我的知識(shí)框架之內(nèi),就算曾經(jīng)學(xué)過,也不過是囫圇吞棗一樣的強(qiáng)記硬背,沒有領(lǐng)會(huì)過其中的真正意義。而今天想重頭在來學(xué)一次,其實(shí)已經(jīng)不可能了。且不說要花費(fèi)多少的精力和時(shí)間,還需要的是領(lǐng)悟力。而這一些,已經(jīng)不是我可以簡單付出的。
不像物理、化學(xué)需要復(fù)雜的實(shí)驗(yàn)來驗(yàn)證,很多數(shù)學(xué)的證明,幾乎只要有一顆聰明的頭腦和無數(shù)的草稿紙,可是光是這顆聰明的頭腦,就可以阻攔掉很多人。有人說多讀書就會(huì)聰明,我不否認(rèn),書本的確會(huì)提供很多知識(shí),可是不同的人讀同一本書也會(huì)有不同的收貨,這就限制于每個(gè)人的知識(shí)框架和認(rèn)知水*。就如一個(gè)數(shù)學(xué)功底好過我的人,看這本書,就會(huì)更容易理解里面的公式和推導(dǎo)出這些公式的其他運(yùn)用點(diǎn),而我,只能站在數(shù)學(xué)的門口,感嘆一句,它真的好美吧。
當(dāng)然,我暫時(shí)無法在實(shí)際生活中運(yùn)用這些數(shù)學(xué)公式,可是書中提到的一些方法論,還是很有幫助的
1)一個(gè)產(chǎn)業(yè)的顛覆或者創(chuàng)新,大部分來自于外部的力量,比如用統(tǒng)計(jì)學(xué)原理做自然語言處理。
2)基礎(chǔ)知識(shí)和基礎(chǔ)數(shù)據(jù)是很重要性,只有足夠多和足夠廣的數(shù)據(jù),才可以提供有效的分析,和驗(yàn)證分析方法的好壞。
3)先幫用戶解決80%的問題,在慢慢解決剩下的20%的問題;
4)不要等一個(gè)東西完美了,才發(fā)布;
5)簡單是美,堅(jiān)持選擇簡單的做法,這樣會(huì)容易解釋每一個(gè)步驟和方法背后的道理,也便于查錯(cuò)。
6)正確的模型也可能受噪音干擾,而顯得不準(zhǔn)確;這時(shí)不應(yīng)該用一種湊合的修正方法加以彌補(bǔ),而是要找到噪音的根源,從根本上修正它。
7)一個(gè)人想要在自己的領(lǐng)域做到世界一流,他的周圍必須有非常多的一流人物。
《數(shù)學(xué)之美》讀書筆記10
很多人都覺得,數(shù)學(xué)是一個(gè)太高深、太理論的學(xué)科,不接近生活,對(duì)我們大多數(shù)人來說*時(shí)也根本用不到,所以沒必要去理解數(shù)學(xué)。但事情真的是這樣嗎?
其實(shí)不然,數(shù)學(xué)一直滲透在我們生活的各個(gè)方面,尤其是在今天這個(gè)信息時(shí)代,很多簡單樸素的數(shù)學(xué)思想,能發(fā)揮一般人很難想象的巨大作用。比如,計(jì)算機(jī)處理自然語言,用到的最重要工具是統(tǒng)計(jì)學(xué)的思想;計(jì)算機(jī)對(duì)**內(nèi)容的分類,依靠的是數(shù)學(xué)里的余弦定理;而電子電路的基本邏輯,則來源于僅有0和1兩個(gè)數(shù)字的布爾代數(shù)。
在《數(shù)學(xué)之美》里,吳軍用自己在工作中使用數(shù)學(xué)的親身經(jīng)歷,為我們展現(xiàn)了數(shù)學(xué)的重要性,以及他對(duì)數(shù)學(xué)之美的理解。吳軍是“得到”App專欄《吳軍的谷歌方法論》的主理人。曾先后供職于谷歌和騰訊,是著名的自然語言處理專家和搜索專家。同時(shí),他還是位暢銷書作家,除了這本《數(shù)學(xué)之美》以外,還寫過《文明之光》《智能時(shí)代》《浪潮之巔》等多本暢銷書。
朱光潛《談美書簡》讀書筆記10篇(擴(kuò)展5)
——《數(shù)學(xué)之美》讀書筆記10篇
《數(shù)學(xué)之美》讀書筆記1
《數(shù)學(xué)之美》是一本領(lǐng)域相關(guān)的數(shù)學(xué)概念書,生動(dòng)形象地講解了關(guān)于數(shù)據(jù)挖掘、文本檢索等方面的基礎(chǔ)知識(shí),可以作為數(shù)據(jù)挖掘、文本檢索的入門普及書。另外,就像作者吳軍老師提到的,關(guān)鍵是要從中學(xué)到道————解決問題的方法,而不僅僅是術(shù)。書中也啟發(fā)式的引導(dǎo)讀者形成自己解決問題的道。
下面記錄一下自己讀這本書的一些感想:
第一章《文字和語言vs數(shù)字和信息》:文字和語言中天然蘊(yùn)藏著一些數(shù)學(xué)思想,數(shù)學(xué)可能不僅僅的是一門非常理科的知識(shí),也是一種藝術(shù)。另外,遇到一個(gè)復(fù)雜的問題時(shí),可能生活中的一些常識(shí),一些簡單的思想會(huì)?給你帶來解決問題的靈感。
第二章《自然語言處理————從規(guī)則到統(tǒng)計(jì)》:試圖模擬人腦處理語言的模式,基于語法規(guī)則,詞性等進(jìn)行語法分析、語義分析的自然語言處理有著很大的復(fù)雜度,而基于統(tǒng)計(jì)的語言模型很好的解決了自然語言處理的諸多難題。人們認(rèn)識(shí)這個(gè)過程,找到統(tǒng)計(jì)的方法經(jīng)歷了20多年,非常慶幸我們的前輩已經(jīng)幫我們找到了正確的方法,不用我們?cè)偃タ嗫嗝。另外,這也說明在發(fā)現(xiàn)真理的過程中是充滿坎坷的,感謝那些曾經(jīng)奉獻(xiàn)了青春的科學(xué)家。自己以后遇到問題也不能輕易放棄,真正的成長是在解決問題的過程中。事情不可能****的,這是自然界的普遍真理吧!
第三章《統(tǒng)計(jì)語言模型》:自然語言的處理找到了一種合適的方法———基于統(tǒng)計(jì)的模型,概率論的知識(shí)開始發(fā)揮作用。二元模型、三元模型、多元模型,模型元數(shù)越多,計(jì)算量越大,簡單實(shí)用就是最好的。對(duì)于某些不出現(xiàn)或出現(xiàn)次數(shù)很少的詞,會(huì)有零概率問題,這是就要找到一數(shù)學(xué)方法給它一個(gè)很小的概率。以前學(xué)概率論的時(shí)候覺的沒什么用,現(xiàn)在開始發(fā)現(xiàn)這些知識(shí)可能就是你以后解決問題的利器。最后引用作者本章的最后一句話:數(shù)學(xué)的魅力就在于將復(fù)雜的問題簡單化。
第四章《談?wù)勚形姆衷~》:中文分詞是將一句話分成一些詞,這是以后進(jìn)一步處理的基礎(chǔ)。從開始的查字典到后來基于統(tǒng)計(jì)語言模型的分詞,如今的中文分詞算是一個(gè)已經(jīng)解決的問題。然而,針對(duì)不同的系統(tǒng)、不同的要求,分詞的粒度和方法也不盡相同,還是針對(duì)具體的問題,提出針對(duì)該問題最好的方法。沒有什么是絕對(duì)的,掌握其中的道才是核心。
第五章《隱馬爾科夫模型》:隱馬爾科夫模型和概率論里面的馬爾科夫鏈相似,就是該時(shí)刻的狀態(tài)僅與前面某幾個(gè)時(shí)刻的狀態(tài)有關(guān);诖罅繑(shù)據(jù)訓(xùn)練出相應(yīng)的隱馬爾科夫模型,就可以解決好多機(jī)器學(xué)習(xí)的問題,訓(xùn)練中會(huì)涉及到一些經(jīng)典的算法(維特比算法等)。關(guān)于這個(gè)模型,沒有實(shí)際實(shí)現(xiàn)過,所以感覺好陌生,只是知道了些概率論講過的原理而已。
第六章《信息的度量和作用》:信息論給出了信息的度量,它是基于概率的,概率越小,其不確定性越大,信息量就越大。引入信息量就可以消除系統(tǒng)的不確定性,同理自然語言處理的大量問題就是找相關(guān)的信息。信息熵的物理含義是對(duì)一個(gè)信息系統(tǒng)不確定性的度量,這一點(diǎn)與熱力學(xué)中的熵概念相同,看似不同的學(xué)科之間也會(huì)有著很強(qiáng)的相似性。事務(wù)之間是存在聯(lián)系的,要學(xué)會(huì)借鑒其他知識(shí)。
第七章《賈里尼克和現(xiàn)代語言處理》:賈里尼克是為世界級(jí)的大師,不僅在于他的學(xué)術(shù)成就,更在于他的風(fēng)范。賈里尼克教授少年坎坷,也并非開始就投身到自然語言方面的研究,關(guān)鍵是他的思想和他的道。賈里克尼教授治學(xué)嚴(yán)謹(jǐn)、用心對(duì)待自己的學(xué)生,對(duì)于學(xué)生的教導(dǎo),教授告訴你最多的是“什么方法不好”,這很像聽到的一句話“我不贊同你,但我**你”。賈里克尼教授一生專注學(xué)習(xí),最后在辦公桌前過世了。讀了這章我總結(jié)出的一句話是“思想決定一個(gè)人的高度”。在這章中對(duì)于少年時(shí)的教育,以下幾點(diǎn)值得借鑒:1、少年時(shí)期其實(shí)沒有必要花那么多時(shí)間讀書,他們的社會(huì)經(jīng)驗(yàn)、生活能力以及在那時(shí)樹立起的志向?qū)椭麄円簧?、中學(xué)時(shí)花大量時(shí)間學(xué)會(huì)的內(nèi)容,在大學(xué)用非常短的時(shí)間就可以讀完,因?yàn)樵诖髮W(xué)階段,人的理解力要強(qiáng)很多。3、學(xué)習(xí)(和教育)是一個(gè)人一輩子的過程。4、書本的內(nèi)容可以早學(xué),也可以晚學(xué),但是錯(cuò)過了成長階段卻是無法補(bǔ)回來的。
第八章《簡單之美————布爾代數(shù)和搜索引擎的索引》:布爾是19世紀(jì)英國的一位中學(xué)教師,但他的公開身份是啤酒商,提出好的思想的人不一定是大師。簡單的建立索引可以根據(jù)一個(gè)詞是否在一個(gè)網(wǎng)頁中出現(xiàn)而設(shè)置為0和1,為了適應(yīng)索引訪問的速度、附加的信息、更新要快速,改進(jìn)了索引的建立,但原理上依然簡單,等價(jià)于布爾運(yùn)算。牛頓的一句話“(人們)發(fā)覺真理在形式上從來是簡單的,而不是復(fù)雜和含混的”。做好搜索,最基本的要求是每天分析10—20個(gè)不好的搜索結(jié)果,積累一段時(shí)間才有感覺。有時(shí)候,學(xué)習(xí)、處理問題,可以從不好的方面入手,效果可能更好。
第九章《圖論和網(wǎng)絡(luò)爬蟲》:圖的遍歷分為“廣度優(yōu)先搜索(Breadth—First Search,簡稱BFS)”和“深度優(yōu)先搜索(Depth—First Search,簡稱DFS);ヂ(lián)網(wǎng)上有幾百億的網(wǎng)頁,需要大量的服務(wù)器用來下載網(wǎng)頁,需要協(xié)調(diào)這些服務(wù)器的任務(wù),這就是網(wǎng)絡(luò)設(shè)計(jì)和程序設(shè)計(jì)的藝術(shù)了。另外對(duì)于簡單的網(wǎng)頁,沒必要下載。還需要存儲(chǔ)一張哈希表來記錄哪些網(wǎng)頁已經(jīng)存儲(chǔ)過(如果記錄每個(gè)網(wǎng)頁的url,數(shù)量太多,這里可以用后面提到的信息指紋,只需要一個(gè)很多位的數(shù)字即可),避免重復(fù)下載。另外,在圖論出現(xiàn)的很長一段時(shí)間里,實(shí)際需求的圖只有幾千個(gè)節(jié)點(diǎn),那時(shí)圖的遍歷很簡單,人們都沒有怎么專門研究這個(gè)問題,隨著互聯(lián)網(wǎng)的出現(xiàn),圖的遍歷一下子有了用武之地,很多數(shù)學(xué)方法就是這樣,看上去沒有什么用途,等到具體的應(yīng)用出來了一下子開始派上大用場了,這可能就是世界上很多人畢生研究數(shù)學(xué)的原因吧。一個(gè)系統(tǒng)看似整體簡單,但里面的每個(gè)東西都可能是一個(gè)復(fù)雜的東西,需要很好的設(shè)計(jì)。
第十章《PageRank————Google的**表決式網(wǎng)頁排名技術(shù)》:搜索返回了成千上萬條結(jié)果,如何為搜索結(jié)果排名?這取決與兩組信息:關(guān)于網(wǎng)頁的質(zhì)量信息以及這個(gè)查詢和每個(gè)網(wǎng)頁的相關(guān)性信息。PageRank算法來衡量一個(gè)網(wǎng)頁的質(zhì)量,該算法的思想是如果一個(gè)網(wǎng)頁被很多其他網(wǎng)頁所鏈接,說明它收到普遍的承認(rèn)和信賴,那么它的排名就高。谷歌的創(chuàng)始人佩奇和布林提出了該算法并用迭代的方法解決了這個(gè)問題。PageRank在Google所有的算法中依然是至關(guān)重要的。該算法并不難,可是當(dāng)時(shí)只有佩奇和布林想到了,為什么呢?
第十一章《如何確定網(wǎng)頁和查詢的相關(guān)性》:構(gòu)建一個(gè)搜索引擎的四個(gè)方面:如何自動(dòng)下載網(wǎng)頁、如何建立索引、如何衡量網(wǎng)頁的質(zhì)量以及確定一個(gè)網(wǎng)頁和某個(gè)查詢的相關(guān)性。搜索關(guān)鍵詞權(quán)重的科學(xué)度量TF—IDF,TF衡量一個(gè)詞在一個(gè)網(wǎng)頁中的權(quán)重,即詞頻。IDF衡量一個(gè)詞本身的權(quán)重,對(duì)主題的預(yù)測能力。一個(gè)查詢和該網(wǎng)頁的相關(guān)性公式由詞頻的簡單求和變成了加權(quán)求和,即TF1*IDF1 + TF2*IDF2 + 。。。 + TFN*IDFN?此茝(fù)雜的搜索引擎,里面的原理竟是這么簡單!
第十二章《地圖和本地搜索的最基本技術(shù)——有限狀態(tài)機(jī)和動(dòng)態(tài)規(guī)劃》:地址的解析依靠有限狀態(tài)機(jī),當(dāng)用戶輸入的地址不太標(biāo)準(zhǔn)或有錯(cuò)別字時(shí),希望進(jìn)行模糊匹配,提出了一種基于概率的有限狀態(tài)機(jī)。通用的有限狀態(tài)機(jī)的程序不是很好寫,要求很高,建議直接采用開源的代碼。圖論中的動(dòng)態(tài)規(guī)劃問題可以用來解決兩點(diǎn)間的最短路徑問題,可以將一個(gè)“尋找全程最短路線”的問題,分解成一個(gè)個(gè)尋找局部最短路線的小問題。有限狀態(tài)機(jī)和動(dòng)態(tài)規(guī)劃問題需要看相關(guān)的算法講解,才能深入理解,目前對(duì)其并未完全理解。
第十三章《Google AK—47的設(shè)計(jì)者——阿米特·辛格博士》:辛格堅(jiān)持選擇簡單方案的一個(gè)原因是容易解釋每一個(gè)步驟和方法背后的道理,這樣不僅便于出了問題時(shí)查錯(cuò),而且容易找到今后改進(jìn)的目標(biāo)。辛格要求對(duì)于搜索質(zhì)量的改進(jìn)方法都要能說清楚理由,說不清楚理由的改進(jìn)即使看上去有效也不會(huì)采用,因?yàn)檫@樣將來可能是個(gè)隱患。辛格非常鼓勵(lì)年輕人要不怕失敗,大膽嘗試。遵循簡單的哲學(xué)。
第十四章《余弦定理和**的分類》:將**根據(jù)詞的TF—IDF值組成**的特征向量,然后根據(jù)向量之間的余弦距離衡量兩個(gè)特征之間的相似度,將**自動(dòng)聚類。另外根據(jù)詞的不同位置,權(quán)重應(yīng)該不同,比如標(biāo)題的詞權(quán)重明顯應(yīng)該大點(diǎn)。大數(shù)據(jù)量的余弦計(jì)算也要考慮很多簡化算法。
第十五章《矩陣運(yùn)算和文本處理中的兩個(gè)分類問題》:將大量的文本表示成文本和詞匯的矩陣,然后對(duì)該矩陣進(jìn)行奇異值SVD分解,可以得到隱含在其中的一些信息。計(jì)算余弦相似度的一次迭代時(shí)間和奇異值分解的時(shí)間復(fù)雜度在一個(gè)數(shù)量級(jí),但計(jì)算余弦相似度需要多次迭代。另外,奇異值分解的一個(gè)問題是存儲(chǔ)量大,而余弦定理的聚類則不需要。奇異值分解得到的結(jié)果略顯粗糙,實(shí)際工作中一般先進(jìn)行奇異值分解得到粗分類結(jié)果,在利用余弦計(jì)算得到比較精確地結(jié)果。我覺得這章講的SVD有些地方不是很清楚,已向吳軍老師請(qǐng)教了,等待回信。
第十六章《信息指紋及其應(yīng)用》:信息指紋可以作為信息的唯一標(biāo)識(shí)。有很多信息指紋的產(chǎn)生方法,互聯(lián)網(wǎng)加密要使用基于加密的偽隨機(jī)數(shù)產(chǎn)生器,常用的算法有MD5或者SHA—1等標(biāo)準(zhǔn)。信息指紋可以用來判定集合相同或基本相同。YouTobe就用信息指紋來反盜版。128位的指紋,1。8*10^19次才可能重復(fù)一次,所以重復(fù)的可能性幾乎為0。判定集合是否相同,從簡單的逐個(gè)比對(duì)到利用信息指紋,復(fù)雜度降低了很多很多。啟發(fā)我們有時(shí)候要用變通的思想來解決問題。
第十七章《由電視劇《**》所想到的——談?wù)劽艽a學(xué)的數(shù)學(xué)原理》:RSA加密算法,有兩個(gè)完全不同的鑰匙,一個(gè)用于加密,一個(gè)用于解密。該算法里面蘊(yùn)含著簡單但不好理解的數(shù)學(xué)思想。信息論在密碼設(shè)計(jì)中的應(yīng)用:當(dāng)密碼之間分布均勻并且統(tǒng)計(jì)**時(shí),提供的信息最少。均勻分布使得敵人無從統(tǒng)計(jì),而統(tǒng)計(jì)**能保證敵人即使知道了加密算法,也不能破譯另一段密碼。
第十八章《閃光的不一定是金子——談?wù)勊阉饕娣醋鞅讍栴}》:把搜索反作弊看成是通信模型,作弊當(dāng)做是加入的噪聲,解決噪聲的方法:從信息源出發(fā),增強(qiáng)排序算法的抗干擾能力;過濾掉噪聲,還原信息。只要噪聲不是完全隨機(jī)并且前后有相關(guān)性,就可以檢測到并消除。作弊者的方法不可能是隨機(jī)的,且不可能一天換一種方法,及作弊是時(shí)間相關(guān)的。因此在搜集一段時(shí)間的作弊信息后,就可以將作弊者抓出來,還原原有的排名。一般作弊都是針對(duì)市場份額較大的搜索引擎做的,因此,一個(gè)小的搜索引擎作弊少,并不一定是它的反作弊技術(shù)好,而是到它那里作弊的人少。
第十九章《談?wù)剶?shù)學(xué)模型的重要性》:早期的行星運(yùn)行模型用大圓套小圓的方法,精確地計(jì)算出了所有行星運(yùn)行的軌跡。但其實(shí)模型就是簡單的橢圓而已。一個(gè)正確的數(shù)學(xué)模型應(yīng)該在形式上是簡單的;一個(gè)正確的模型可能開始還不如一個(gè)精雕細(xì)琢過的錯(cuò)誤模型來的準(zhǔn)確,但是,如果我們認(rèn)定大方向是對(duì)的,就應(yīng)該堅(jiān)持下去;大量準(zhǔn)備的數(shù)據(jù)對(duì)研發(fā)很重要;正確的模型可能受到噪聲干擾,而顯得不準(zhǔn)確,這是不應(yīng)該用一種湊合的修正方法來彌補(bǔ)它,要找到噪聲的根源,這也許能通往重大的發(fā)現(xiàn)。
第二十章《不要把雞蛋放在一個(gè)籃子里——談?wù)勛畲箪啬P汀罚簩?duì)一個(gè)隨機(jī)事件預(yù)測時(shí),當(dāng)各種情況概率相等時(shí),信息熵達(dá)到最大,不確定性最大,預(yù)測的風(fēng)險(xiǎn)最小。最大熵模型的訓(xùn)練非常復(fù)雜,需要時(shí)查看資料做進(jìn)一步的理解。
第二十一章《拼音輸入法的數(shù)學(xué)原理》:輸入法經(jīng)歷了以自然音節(jié)編碼,到偏旁筆畫拆字輸入,再回歸自然音節(jié)輸入的過程。任何事物的發(fā)展,螺旋式的回歸不是簡單的重復(fù),而是一種升華。輸入法的速度取決于編碼的場地*尋找這個(gè)鍵的時(shí)間。傳統(tǒng)的雙拼,記住編碼太難,尋找每個(gè)鍵的時(shí)間太長,并且增加了編碼上的歧義。根據(jù)香農(nóng)第一定理可以計(jì)算理論上每個(gè)漢字的*均最短碼長。全拼不僅編碼*均長度較少,而且根據(jù)上下文的語言模型可以很好的解決歧義問題。利用統(tǒng)計(jì)語言模型可是實(shí)現(xiàn)拼音轉(zhuǎn)漢字的有效算法,而且可以轉(zhuǎn)換為動(dòng)態(tài)規(guī)劃求最短路徑問題。如今各家輸入法的效率基本在一個(gè)量級(jí),進(jìn)一步提升的關(guān)鍵就在于建立更好的語言模型?梢愿鶕(jù)每個(gè)用戶建立個(gè)性化的語言模型。輸入的過程本身就是人和計(jì)算機(jī)的通信,好的輸入法會(huì)自覺或者不自覺的的遵循通信的數(shù)學(xué)模型。要做出最有效的輸入法,應(yīng)該自覺使用信息論做指導(dǎo)。
第二十二章《自然語言處理的教父馬庫斯和他的優(yōu)秀弟子們》:將自然語言處理從基于規(guī)則到基于統(tǒng)計(jì),貢獻(xiàn)最大的兩個(gè)人,一個(gè)是前面介紹的賈里尼克教授,他是一個(gè)開創(chuàng)性任務(wù);另一個(gè)是將這個(gè)方法發(fā)揚(yáng)光大的米奇·馬庫斯。馬庫斯的貢獻(xiàn)在于建立了造福全世界研究者的賓夕法尼亞大學(xué)LDC語料庫以及他的眾多優(yōu)秀弟子。馬庫斯的影響力很大程度上是靠他的弟子傳播出去的。馬庫斯教授有很多值得欽佩的地方:給予他的博士研究生自己感興趣的課題的**,高屋建瓴,給學(xué)生關(guān)鍵的指導(dǎo);寬松的管理方式,培養(yǎng)各有特點(diǎn)的年輕學(xué)者;是一個(gè)有著遠(yuǎn)見卓識(shí)的管理者。他的學(xué)生為人做事風(fēng)格迥異,但都年輕有為,例如追求完美的邁克爾·柯林斯和尋求簡單美的艾克爾·*。大師之所以能成為大師,肯定有著一些優(yōu)秀的品質(zhì)和追求。
第***章《布隆過濾器》:判斷一個(gè)元素是否在一個(gè)集合當(dāng)中時(shí),用到了布隆過濾器,存儲(chǔ)量小而且計(jì)算快速。其原理是:建立一個(gè)很長的二進(jìn)制,將每個(gè)元素通過隨機(jī)數(shù)產(chǎn)生器產(chǎn)生一些信息指紋,再將這些信息指紋映射到一些自然數(shù)上,最后在建立的那個(gè)很長的二進(jìn)制上把這些自然數(shù)的位置都置為1。布隆過濾器的不足之處是它可能把不在集合中的元素錯(cuò)判成集合中的元素,但在某些條件下這個(gè)概率是很小的,補(bǔ)救措施是可以建立一個(gè)小的白名單,存儲(chǔ)那些可能誤判的元素。布隆過濾器背后的數(shù)學(xué)原理在于完全隨機(jī)的數(shù)字其沖突的可能性很小,可以用很少的空間存儲(chǔ)大量的信息,并且由于只進(jìn)行簡單的算術(shù)運(yùn)算,因此速度非?!毒幊讨榄^》中第一章的那個(gè)例子就是布隆過濾器的思想。開闊思維,尋找更好更簡單的方法。
第***章《馬爾科夫鏈的擴(kuò)展——貝葉斯網(wǎng)絡(luò)》:貝葉斯網(wǎng)絡(luò)是馬爾科夫鏈的擴(kuò)展,由簡單的線性鏈?zhǔn)疥P(guān)系擴(kuò)展為網(wǎng)絡(luò)的關(guān)系,但貝葉斯網(wǎng)絡(luò)仍然假設(shè)每一個(gè)狀態(tài)只與它直接相連的狀態(tài)相關(guān)。確定貝葉斯網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu)和各個(gè)狀態(tài)之間相關(guān)的概率也需要訓(xùn)練。在詞分類中,可以建立文章、主題和關(guān)鍵詞的貝葉斯網(wǎng)絡(luò),用來得到詞的分類。貝葉斯網(wǎng)絡(luò)的訓(xùn)練包括確定拓?fù)浣Y(jié)構(gòu)和轉(zhuǎn)移概率,比較復(fù)雜,后者可以參考最大熵訓(xùn)練的方法。貝葉斯網(wǎng)絡(luò)導(dǎo)出的模型是非常復(fù)雜的。
第二十五章《條件隨機(jī)場和句法分析》:句法分析是分析出一個(gè)句子的句子結(jié)構(gòu),對(duì)于不規(guī)則的句子,對(duì)其進(jìn)行深入的分析是很復(fù)雜的,而淺層的句法分析在很多時(shí)候已經(jīng)可以滿足要求了。條件隨機(jī)場就是進(jìn)行淺層句法分析的有效的數(shù)學(xué)模型。條件隨機(jī)場與貝葉斯網(wǎng)絡(luò)很像,不用之處在于,條件隨機(jī)場是無向圖,而貝葉斯網(wǎng)絡(luò)是有向圖。條件隨機(jī)場的訓(xùn)練很復(fù)雜,簡化之后可以參考最大熵訓(xùn)練的方法。對(duì)于條件隨機(jī)場的詳細(xì)參數(shù)及原理還不理解。
第二十六章《維特比和他的維特比算法》:維特比算法是一個(gè)動(dòng)態(tài)規(guī)劃算法,凡是使用隱馬爾科夫模型描述的問題都可以用它來解碼。維特比算法采用逐步漸進(jìn)的方法,計(jì)算到每步的最短距離,到下步的最短距離只用接著本步的計(jì)算即可,相比窮舉法,**縮短了計(jì)算的時(shí)間,并且基本可以實(shí)現(xiàn)實(shí)時(shí)的輸出,這看似簡單,但在當(dāng)時(shí)確是很了不起的。維特比并不滿足停留在算法本身,他將算法推廣出去,并應(yīng)用到了實(shí)際中,創(chuàng)立了高通公司,成為了世界上第二富有的數(shù)學(xué)家。高通公司在第二代移動(dòng)通信中并不占很強(qiáng)的市場地位,而其利用CDMA技術(shù)霸占了3G的市場,可見遠(yuǎn)見的洞察力是多么的重要。
第二十七章《再談文本分類問題——期望最大化算法》:該章講的其實(shí)就是K均值聚類問題,設(shè)置原始聚類中心,然后不斷迭代,直至收斂,將每個(gè)點(diǎn)分到一個(gè)類中。其實(shí)隱馬爾科夫模型的訓(xùn)練和最大熵的訓(xùn)練都是期望最大化算法(EM)。首先,根據(jù)現(xiàn)有的模型,計(jì)算各個(gè)觀測數(shù)據(jù)輸入到模型中的計(jì)算結(jié)果,這個(gè)過程稱為期望值計(jì)算過程,或E過程;接下來,重新計(jì)算模型參數(shù),以最大化期望值,這個(gè)過程稱為最大化的過程,或M過程。優(yōu)化的目標(biāo)函數(shù)如果是個(gè)凸函數(shù),則一定有全局最優(yōu)解,若不是凸函數(shù),則可能找到的是局部最優(yōu)解。在以后的一些問題求解過程中,應(yīng)該考慮其是否是EM問題,也可以考慮參考這種思想,不斷迭代以優(yōu)化目標(biāo)的過程。
第二十八章《邏輯回歸和搜索廣告》:雅虎和百度的競價(jià)排名廣告并不比谷歌的根據(jù)廣告的預(yù)估點(diǎn)擊率來客觀的推送廣告收入多。點(diǎn)擊預(yù)估率有很多影響因素,一種有效的方法是邏輯回歸模型,邏輯回歸模型是一種將影響概率的不同因素結(jié)合在一起的指數(shù)模型。其訓(xùn)練方法和最大熵模型相似。同樣不是很理解其具體內(nèi)涵。
第二十九章《各個(gè)擊破和Google云計(jì)算的基礎(chǔ)》:分而治之,各個(gè)擊破是一個(gè)很好的方法,Google開發(fā)的MapReduce算法就應(yīng)用了該方法。將一個(gè)大任務(wù)分成幾個(gè)小任務(wù),這個(gè)過程叫Map,將小任務(wù)的結(jié)果合并成最終結(jié)果,這個(gè)過程叫Reduce,該過程如何調(diào)度、協(xié)調(diào)就是工程上比較復(fù)雜的事情了?梢姶罅坑玫降、真正有用的方法往往簡單而又樸實(shí)。
附錄《計(jì)算復(fù)雜度》:計(jì)算機(jī)中復(fù)雜度是以O(shè)()來表示的,如果一個(gè)算法的計(jì)算量不超過N的多項(xiàng)式函數(shù),則稱算法為多項(xiàng)式函數(shù)復(fù)雜度的(P問題),是可以計(jì)算的。若比N的多項(xiàng)式函數(shù)還高,則是非多項(xiàng)式問題,實(shí)際上是不可計(jì)算的。非多項(xiàng)式問題中一種非確定的多項(xiàng)式問題(簡稱NP),是科學(xué)家研究的焦點(diǎn),因?yàn)楝F(xiàn)實(shí)中好多問題都是NP問題。另外還有NP—Complete問題(NP問題可以在多項(xiàng)式時(shí)間內(nèi)規(guī)約到該問題)和NP—Hard問題,對(duì)于這兩種問題,需要簡化找到近似解。
整體上,《數(shù)學(xué)之美》這本書讓我了解了很多文本處理,數(shù)據(jù)挖掘相關(guān)的知識(shí),學(xué)到了很多。其中,簡單美以及一些科學(xué)家的大師風(fēng)范讓我印象深刻!書中提到的一些思想(即道)讓我受益匪淺!
《數(shù)學(xué)之美》讀書筆記2
很多人都覺得,數(shù)學(xué)是一個(gè)太高深、太理論的學(xué)科,不接近生活,對(duì)我們大多數(shù)人來說*時(shí)也根本用不到,所以沒必要去理解數(shù)學(xué)。但事情真的是這樣嗎?
其實(shí)不然,數(shù)學(xué)一直滲透在我們生活的各個(gè)方面,尤其是在今天這個(gè)信息時(shí)代,很多簡單樸素的數(shù)學(xué)思想,能發(fā)揮一般人很難想象的巨大作用。比如,計(jì)算機(jī)處理自然語言,用到的最重要工具是統(tǒng)計(jì)學(xué)的思想;計(jì)算機(jī)對(duì)**內(nèi)容的分類,依靠的是數(shù)學(xué)里的余弦定理;而電子電路的基本邏輯,則來源于僅有0和1兩個(gè)數(shù)字的布爾代數(shù)。
在《數(shù)學(xué)之美》里,吳軍用自己在工作中使用數(shù)學(xué)的親身經(jīng)歷,為我們展現(xiàn)了數(shù)學(xué)的重要性,以及他對(duì)數(shù)學(xué)之美的理解。吳軍是“得到”App專欄《吳軍的谷歌方法論》的主理人。曾先后供職于谷歌和騰訊,是著名的.自然語言處理專家和搜索專家。同時(shí),他還是位暢銷書作家,除了這本《數(shù)學(xué)之美》以外,還寫過《文明之光》《智能時(shí)代》《浪潮之巔》等多本暢銷書。
《數(shù)學(xué)之美》讀書筆記3
《數(shù)學(xué)之美》是一本領(lǐng)域相關(guān)的數(shù)學(xué)概念書,生動(dòng)形象地講解了關(guān)于數(shù)據(jù)挖掘、文本檢索等方面的基礎(chǔ)知識(shí),可以作為數(shù)據(jù)挖掘、文本檢索的入門普及書。另外,就像作者吳軍老師提到的,關(guān)鍵是要從中學(xué)到道----解決問題的方法,而不僅僅是術(shù)。書中也啟發(fā)式的引導(dǎo)讀者形成自己解決問題的道。
下面記錄一下自己讀這本書的一些感想:
第一章《文字和語言vs數(shù)字和信息》:文字和語言中天然蘊(yùn)藏著一些數(shù)學(xué)思想,數(shù)學(xué)可能不僅僅的是一門非常理科的知識(shí),也是一種藝術(shù)。另外,遇到一個(gè)復(fù)雜的問題時(shí),可能生活中的一些常識(shí),一些簡單的思想會(huì)給你帶來解決問題的靈感。
第二章《自然語言處理----從規(guī)則到統(tǒng)計(jì)》:試圖模擬人腦處理語言的模式,基于語法規(guī)則,詞性等進(jìn)行語法分析、語義分析的自然語言處理有著很大的復(fù)雜度,而基于統(tǒng)計(jì)的語言模型很好的解決了自然語言處理的諸多難題。人們認(rèn)識(shí)這個(gè)過程,找到統(tǒng)計(jì)的方法經(jīng)歷了20多年,非常慶幸我們的前輩已經(jīng)幫我們找到了正確的方法,不用我們?cè)偃タ嗫嗝鳌A硗,這也說明在發(fā)現(xiàn)真理的過程中是充滿坎坷的,感謝那些曾經(jīng)奉獻(xiàn)了青春的科學(xué)家。自己以后遇到問題也不能輕易放棄,真正的成長是在解決問題的過程中。事情不可能****的,這是自然界的普遍真理吧!
第三章《統(tǒng)計(jì)語言模型》:自然語言的處理找到了一種合適的方法---基于統(tǒng)計(jì)的模型,概率論的知識(shí)開始發(fā)揮作用。二元模型、三元模型、多元模型,模型元數(shù)越多,計(jì)算量越大,簡單實(shí)用就是最好的。對(duì)于某些不出現(xiàn)或出現(xiàn)次數(shù)很少的詞,會(huì)有零概率問題,這是就要找到一數(shù)學(xué)方法給它一個(gè)很小的概率。以前學(xué)概率論的時(shí)候覺的沒什么用,現(xiàn)在開始發(fā)現(xiàn)這些知識(shí)可能就是你以后解決問題的利器。最后引用作者本章的最后一句話:數(shù)學(xué)的魅力就在于將復(fù)雜的問題簡單化。
第四章《談?wù)勚形姆衷~》:中文分詞是將一句話分成一些詞,這是以后進(jìn)一步處理的基礎(chǔ)。從開始的查字典到后來基于統(tǒng)計(jì)語言模型的分詞,如今的中文分詞算是一個(gè)已經(jīng)解決的問題。然而,針對(duì)不同的系統(tǒng)、不同的要求,分詞的粒度和方法也不盡相同,還是針對(duì)具體的問題,提出針對(duì)該問題最好的方法。沒有什么是絕對(duì)的,掌握其中的道才是核心。
第五章《隱馬爾科夫模型》:隱馬爾科夫模型和概率論里面的馬爾科夫鏈相似,就是該時(shí)刻的狀態(tài)僅與前面某幾個(gè)時(shí)刻的狀態(tài)有關(guān)。基于大量數(shù)據(jù)訓(xùn)練出相應(yīng)的隱馬爾科夫模型,就可以解決好多機(jī)器學(xué)習(xí)的問題,訓(xùn)練中會(huì)涉及到一些經(jīng)典的算法(維特比算法等)。關(guān)于這個(gè)模型,沒有實(shí)際實(shí)現(xiàn)過,所以感覺好陌生,只是知道了些概率論講過的原理而已。
第六章《信息的度量和作用》:信息論給出了信息的度量,它是基于概率的,概率越小,其不確定性越大,信息量就越大。引入信息量就可以消除系統(tǒng)的不確定性,同理自然語言處理的大量問題就是找相關(guān)的信息。信息熵的物理含義是對(duì)一個(gè)信息系統(tǒng)不確定性的度量,這一點(diǎn)與熱力學(xué)中的熵概念相同,看似不同的學(xué)科之間也會(huì)有著很強(qiáng)的相似性。事務(wù)之間是存在聯(lián)系的,要學(xué)會(huì)借鑒其他知識(shí)。
第七章《賈里尼克和現(xiàn)代語言處理》:賈里尼克是為世界級(jí)的大師,不僅在于他的學(xué)術(shù)成就,更在于他的風(fēng)范。賈里尼克教授少年坎坷,也并非開始就投身到自然語言方面的研究,關(guān)鍵是他的思想和他的道。賈里克尼教授治學(xué)嚴(yán)謹(jǐn)、用心對(duì)待自己的學(xué)生,對(duì)于學(xué)生的教導(dǎo),教授告訴你最多的是“什么方法不好”,這很像聽到的一句話“我不贊同你,但我**你”。賈里克尼教授一生專注學(xué)習(xí),最后在辦公桌前過世了。讀了這章我總結(jié)出的一句話是“思想決定一個(gè)人的高度”。
在這章中對(duì)于少年時(shí)的教育,以下幾點(diǎn)值得借鑒:
1、少年時(shí)期其實(shí)沒有必要花那么多時(shí)間讀書,他們的社會(huì)經(jīng)驗(yàn)、生活能力以及在那時(shí)樹立起的志向?qū)椭麄円簧?/p>
2、中學(xué)時(shí)花大量時(shí)間學(xué)會(huì)的內(nèi)容,在大學(xué)用非常短的時(shí)間就可以讀完,因?yàn)樵诖髮W(xué)階段,人的理解力要強(qiáng)很多。
3、學(xué)習(xí)(和教育)是一個(gè)人一輩子的過程。
4、書本的內(nèi)容可以早學(xué),也可以晚學(xué),但是錯(cuò)過了成長階段卻是無法補(bǔ)回來的。
第八章《簡單之美----布爾代數(shù)和搜索引擎的索引》:布爾是19世紀(jì)英國的一位中學(xué)教師,但他的公開身份是啤酒商,提出好的思想的人不一定是大師。簡單的建立索引可以根據(jù)一個(gè)詞是否在一個(gè)網(wǎng)頁中出現(xiàn)而設(shè)置為0和1,為了適應(yīng)索引訪問的速度、附加的信息、更新要快速,改進(jìn)了索引的建立,但原理上依然簡單,等價(jià)于布爾運(yùn)算。牛頓的一句話“(人們)發(fā)覺真理在形式上從來是簡單的,而不是復(fù)雜和含混的”。做好搜索,最基本的要求是每天分析10-20個(gè)不好的搜索結(jié)果,積累一段時(shí)間才有感覺。有時(shí)候,學(xué)習(xí)、處理問題,可以從不好的方面入手,效果可能更好。
第九章《圖論和網(wǎng)絡(luò)爬蟲》:圖的遍歷分為“廣度優(yōu)先搜索(Breadth-FirstSearch,簡稱BFS)”和“深度優(yōu)先搜索(Depth-FirstSearch,簡稱DFS);ヂ(lián)網(wǎng)上有幾百億的網(wǎng)頁,需要大量的服務(wù)器用來下載網(wǎng)頁,需要協(xié)調(diào)這些服務(wù)器的任務(wù),這就是網(wǎng)絡(luò)設(shè)計(jì)和程序設(shè)計(jì)的藝術(shù)了。另外對(duì)于簡單的網(wǎng)頁,沒必要下載。還需要存儲(chǔ)一張哈希表來記錄哪些網(wǎng)頁已經(jīng)存儲(chǔ)過(如果記錄每個(gè)網(wǎng)頁的url,數(shù)量太多,這里可以用后面提到的信息指紋,只需要一個(gè)很多位的數(shù)字即可),避免重復(fù)下載。另外,在圖論出現(xiàn)的很長一段時(shí)間里,實(shí)際需求的圖只有幾千個(gè)節(jié)點(diǎn),那時(shí)圖的遍歷很簡單,人們都沒有怎么專門研究這個(gè)問題,隨著互聯(lián)網(wǎng)的出現(xiàn),圖的遍歷一下子有了用武之地,很多數(shù)學(xué)方法就是這樣,看上去沒有什么用途,等到具體的應(yīng)用出來了一下子開始派上大用場了,這可能就是世界上很多人畢生研究數(shù)學(xué)的原因吧。一個(gè)系統(tǒng)看似整體簡單,但里面的每個(gè)東西都可能是一個(gè)復(fù)雜的東西,需要很好的設(shè)計(jì)。
第十章《PageRank----Google的**表決式網(wǎng)頁排名技術(shù)》:搜索返回了成千上萬條結(jié)果,如何為搜索結(jié)果排名?這取決與兩組信息:關(guān)于網(wǎng)頁的質(zhì)量信息以及這個(gè)查詢和每個(gè)網(wǎng)頁的相關(guān)性信息。PageRank算法來衡量一個(gè)網(wǎng)頁的質(zhì)量,該算法的思想是如果一個(gè)網(wǎng)頁被很多其他網(wǎng)頁所鏈接,說明它收到普遍的承認(rèn)和信賴,那么它的排名就高。谷歌的創(chuàng)始人佩奇和布林提出了該算法并用迭代的方法解決了這個(gè)問題。PageRank在Google所有的算法中依然是至關(guān)重要的。該算法并不難,可是當(dāng)時(shí)只有佩奇和布林想到了,為什么呢?
第十一章《如何確定網(wǎng)頁和查詢的相關(guān)性》:構(gòu)建一個(gè)搜索引擎的四個(gè)方面:如何自動(dòng)下載網(wǎng)頁、如何建立索引、如何衡量網(wǎng)頁的質(zhì)量以及確定一個(gè)網(wǎng)頁和某個(gè)查詢的相關(guān)性。搜索關(guān)鍵詞權(quán)重的科學(xué)度量TF—IDF,TF衡量一個(gè)詞在一個(gè)網(wǎng)頁中的權(quán)重,即詞頻。IDF衡量一個(gè)詞本身的權(quán)重,對(duì)主題的預(yù)測能力。一個(gè)查詢和該網(wǎng)頁的相關(guān)性公式由詞頻的簡單求和變成了加權(quán)求和,即TF1*IDF1+TF2*IDF2+...+TFN*IDFN?此茝(fù)雜的搜索引擎,里面的原理竟是這么簡單!
第十二章《地圖和本地搜索的最基本技術(shù)——有限狀態(tài)機(jī)和動(dòng)態(tài)規(guī)劃》:地址的解析依靠有限狀態(tài)機(jī),當(dāng)用戶輸入的地址不太標(biāo)準(zhǔn)或有錯(cuò)別字時(shí),希望進(jìn)行模糊匹配,提出了一種基于概率的有限狀態(tài)機(jī)。通用的有限狀態(tài)機(jī)的程序不是很好寫,要求很高,建議直接采用開源的代碼。圖論中的動(dòng)態(tài)規(guī)劃問題可以用來解決兩點(diǎn)間的最短路徑問題,可以將一個(gè)“尋找全程最短路線”的問題,分解成一個(gè)個(gè)尋找局部最短路線的小問題。有限狀態(tài)機(jī)和動(dòng)態(tài)規(guī)劃問題需要看相關(guān)的算法講解,才能深入理解,目前對(duì)其并未完全理解。
第十三章《GoogleAK-47的設(shè)計(jì)者——阿米特·辛格博士》:辛格堅(jiān)持選擇簡單方案的一個(gè)原因是容易解釋每一個(gè)步驟和方法背后的道理,這樣不僅便于出了問題時(shí)查錯(cuò),而且容易找到今后改進(jìn)的目標(biāo)。辛格要求對(duì)于搜索質(zhì)量的改進(jìn)方法都要能說清楚理由,說不清楚理由的改進(jìn)即使看上去有效也不會(huì)采用,因?yàn)檫@樣將來可能是個(gè)隱患。辛格非常鼓勵(lì)年輕人要不怕失敗,大膽嘗試。遵循簡單的哲學(xué)。
第十四章《余弦定理和**的分類》:將**根據(jù)詞的TF-IDF值組成**的特征向量,然后根據(jù)向量之間的余弦距離衡量兩個(gè)特征之間的相似度,將**自動(dòng)聚類。另外根據(jù)詞的不同位置,權(quán)重應(yīng)該不同,比如標(biāo)題的詞權(quán)重明顯應(yīng)該大點(diǎn)。大數(shù)據(jù)量的余弦計(jì)算也要考慮很多簡化算法。
第十五章《矩陣運(yùn)算和文本處理中的兩個(gè)分類問題》:將大量的文本表示成文本和詞匯的矩陣,然后對(duì)該矩陣進(jìn)行奇異值SVD分解,可以得到隱含在其中的一些信息。計(jì)算余弦相似度的一次迭代時(shí)間和奇異值分解的時(shí)間復(fù)雜度在一個(gè)數(shù)量級(jí),但計(jì)算余弦相似度需要多次迭代。另外,奇異值分解的一個(gè)問題是存儲(chǔ)量大,而余弦定理的聚類則不需要。奇異值分解得到的結(jié)果略顯粗糙,實(shí)際工作中一般先進(jìn)行奇異值分解得到粗分類結(jié)果,在利用余弦計(jì)算得到比較精確地結(jié)果。我覺得這章講的SVD有些地方不是很清楚,已向吳軍老師請(qǐng)教了,等待回信。
第十六章《信息指紋及其應(yīng)用》:信息指紋可以作為信息的唯一標(biāo)識(shí)。有很多信息指紋的產(chǎn)生方法,互聯(lián)網(wǎng)加密要使用基于加密的偽隨機(jī)數(shù)產(chǎn)生器,常用的算法有MD5或者SHA-1等標(biāo)準(zhǔn)。信息指紋可以用來判定集合相同或基本相同。YouTobe就用信息指紋來反盜版。128位的指紋,1.8*10^19次才可能重復(fù)一次,所以重復(fù)的可能性幾乎為0。判定集合是否相同,從簡單的逐個(gè)比對(duì)到利用信息指紋,復(fù)雜度降低了很多很多。啟發(fā)我們有時(shí)候要用變通的思想來解決問題。
第十七章《由電視劇《**》所想到的——談?wù)劽艽a學(xué)的數(shù)學(xué)原理》:RSA加密算法,有兩個(gè)完全不同的鑰匙,一個(gè)用于加密,一個(gè)用于解密。該算法里面蘊(yùn)含著簡單但不好理解的數(shù)學(xué)思想。信息論在密碼設(shè)計(jì)中的應(yīng)用:當(dāng)密碼之間分布均勻并且統(tǒng)計(jì)**時(shí),提供的信息最少。均勻分布使得敵人無從統(tǒng)計(jì),而統(tǒng)計(jì)**能保證敵人即使知道了加密算法,也不能破譯另一段密碼。
第十八章《閃光的不一定是金子——談?wù)勊阉饕娣醋鞅讍栴}》:把搜索反作弊看成是通信模型,作弊當(dāng)做是加入的噪聲,解決噪聲的方法:從信息源出發(fā),增強(qiáng)排序算法的抗干擾能力;過濾掉噪聲,還原信息。只要噪聲不是完全隨機(jī)并且前后有相關(guān)性,就可以檢測到并消除。作弊者的方法不可能是隨機(jī)的,且不可能一天換一種方法,及作弊是時(shí)間相關(guān)的。因此在搜集一段時(shí)間的作弊信息后,就可以將作弊者抓出來,還原原有的排名。一般作弊都是針對(duì)市場份額較大的搜索引擎做的,因此,一個(gè)小的搜索引擎作弊少,并不一定是它的反作弊技術(shù)好,而是到它那里作弊的人少。
第十九章《談?wù)剶?shù)學(xué)模型的重要性》:早期的行星運(yùn)行模型用大圓套小圓的方法,精確地計(jì)算出了所有行星運(yùn)行的軌跡。但其實(shí)模型就是簡單的橢圓而已。一個(gè)正確的數(shù)學(xué)模型應(yīng)該在形式上是簡單的;一個(gè)正確的模型可能開始還不如一個(gè)精雕細(xì)琢過的錯(cuò)誤模型來的準(zhǔn)確,但是,如果我們認(rèn)定大方向是對(duì)的,就應(yīng)該堅(jiān)持下去;大量準(zhǔn)備的數(shù)據(jù)對(duì)研發(fā)很重要;正確的模型可能受到噪聲干擾,而顯得不準(zhǔn)確,這是不應(yīng)該用一種湊合的修正方法來彌補(bǔ)它,要找到噪聲的根源,這也許能通往重大的發(fā)現(xiàn)。
第二十章《不要把雞蛋放在一個(gè)籃子里——談?wù)勛畲箪啬P汀罚簩?duì)一個(gè)隨機(jī)事件預(yù)測時(shí),當(dāng)各種情況概率相等時(shí),信息熵達(dá)到最大,不確定性最大,預(yù)測的風(fēng)險(xiǎn)最小。最大熵模型的訓(xùn)練非常復(fù)雜,需要時(shí)查看資料做進(jìn)一步的理解。
第二十一章《拼音輸入法的數(shù)學(xué)原理》:輸入法經(jīng)歷了以自然音節(jié)編碼,到偏旁筆畫拆字輸入,再回歸自然音節(jié)輸入的過程。任何事物的發(fā)展,螺旋式的回歸不是簡單的重復(fù),而是一種升華。輸入法的速度取決于編碼的場地*尋找這個(gè)鍵的時(shí)間。傳統(tǒng)的雙拼,記住編碼太難,尋找每個(gè)鍵的時(shí)間太長,并且增加了編碼上的歧義。根據(jù)香農(nóng)第一定理可以計(jì)算理論上每個(gè)漢字的*均最短碼長。全拼不僅編碼*均長度較少,而且根據(jù)上下文的語言模型可以很好的解決歧義問題。利用統(tǒng)計(jì)語言模型可是實(shí)現(xiàn)拼音轉(zhuǎn)漢字的有效算法,而且可以轉(zhuǎn)換為動(dòng)態(tài)規(guī)劃求最短路徑問題。如今各家輸入法的效率基本在一個(gè)量級(jí),進(jìn)一步提升的關(guān)鍵就在于建立更好的語言模型?梢愿鶕(jù)每個(gè)用戶建立個(gè)性化的語言模型。輸入的過程本身就是人和計(jì)算機(jī)的通信,好的輸入法會(huì)自覺或者不自覺的的遵循通信的數(shù)學(xué)模型。要做出最有效的輸入法,應(yīng)該自覺使用信息論做指導(dǎo)。
第二十二章《自然語言處理的教父馬庫斯和他的優(yōu)秀弟子們》:將自然語言處理從基于規(guī)則到基于統(tǒng)計(jì),貢獻(xiàn)最大的兩個(gè)人,一個(gè)是前面介紹的賈里尼克教授,他是一個(gè)開創(chuàng)性任務(wù);另一個(gè)是將這個(gè)方法發(fā)揚(yáng)光大的米奇·馬庫斯。馬庫斯的貢獻(xiàn)在于建立了造福全世界研究者的賓夕法尼亞大學(xué)LDC語料庫以及他的眾多優(yōu)秀弟子。馬庫斯的影響力很大程度上是靠他的弟子傳播出去的。馬庫斯教授有很多值得欽佩的地方:給予他的博士研究生自己感興趣的課題的**,高屋建瓴,給學(xué)生關(guān)鍵的指導(dǎo);寬松的管理方式,培養(yǎng)各有特點(diǎn)的年輕學(xué)者;是一個(gè)有著遠(yuǎn)見卓識(shí)的管理者。他的學(xué)生為人做事風(fēng)格迥異,但都年輕有為,例如追求完美的邁克爾·柯林斯和尋求簡單美的艾克爾·*。大師之所以能成為大師,肯定有著一些優(yōu)秀的品質(zhì)和追求。
第***章《布隆過濾器》:判斷一個(gè)元素是否在一個(gè)集合當(dāng)中時(shí),用到了布隆過濾器,存儲(chǔ)量小而且計(jì)算快速。其原理是:建立一個(gè)很長的二進(jìn)制,將每個(gè)元素通過隨機(jī)數(shù)產(chǎn)生器產(chǎn)生一些信息指紋,再將這些信息指紋映射到一些自然數(shù)上,最后在建立的那個(gè)很長的二進(jìn)制上把這些自然數(shù)的位置都置為1。布隆過濾器的不足之處是它可能把不在集合中的元素錯(cuò)判成集合中的元素,但在某些條件下這個(gè)概率是很小的,補(bǔ)救措施是可以建立一個(gè)小的白名單,存儲(chǔ)那些可能誤判的元素。布隆過濾器背后的數(shù)學(xué)原理在于完全隨機(jī)的數(shù)字其沖突的可能性很小,可以用很少的空間存儲(chǔ)大量的信息,并且由于只進(jìn)行簡單的算術(shù)運(yùn)算,因此速度非?!毒幊讨榄^》中第一章的那個(gè)例子就是布隆過濾器的思想。開闊思維,尋找更好更簡單的方法。
第***章《馬爾科夫鏈的擴(kuò)展——貝葉斯網(wǎng)絡(luò)》:貝葉斯網(wǎng)絡(luò)是馬爾科夫鏈的擴(kuò)展,由簡單的線性鏈?zhǔn)疥P(guān)系擴(kuò)展為網(wǎng)絡(luò)的關(guān)系,但貝葉斯網(wǎng)絡(luò)仍然假設(shè)每一個(gè)狀態(tài)只與它直接相連的狀態(tài)相關(guān)。確定貝葉斯網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu)和各個(gè)狀態(tài)之間相關(guān)的概率也需要訓(xùn)練。在詞分類中,可以建立文章、主題和關(guān)鍵詞的貝葉斯網(wǎng)絡(luò),用來得到詞的分類。貝葉斯網(wǎng)絡(luò)的訓(xùn)練包括確定拓?fù)浣Y(jié)構(gòu)和轉(zhuǎn)移概率,比較復(fù)雜,后者可以參考最大熵訓(xùn)練的方法。貝葉斯網(wǎng)絡(luò)導(dǎo)出的模型是非常復(fù)雜的。
第二十五章《條件隨機(jī)場和句法分析》:句法分析是分析出一個(gè)句子的句子結(jié)構(gòu),對(duì)于不規(guī)則的句子,對(duì)其進(jìn)行深入的分析是很復(fù)雜的,而淺層的句法分析在很多時(shí)候已經(jīng)可以滿足要求了。條件隨機(jī)場就是進(jìn)行淺層句法分析的有效的數(shù)學(xué)模型。條件隨機(jī)場與貝葉斯網(wǎng)絡(luò)很像,不用之處在于,條件隨機(jī)場是無向圖,而貝葉斯網(wǎng)絡(luò)是有向圖。條件隨機(jī)場的訓(xùn)練很復(fù)雜,簡化之后可以參考最大熵訓(xùn)練的方法。對(duì)于條件隨機(jī)場的詳細(xì)參數(shù)及原理還不理解。
第二十六章《維特比和他的維特比算法》:維特比算法是一個(gè)動(dòng)態(tài)規(guī)劃算法,凡是使用隱馬爾科夫模型描述的問題都可以用它來解碼。維特比算法采用逐步漸進(jìn)的方法,計(jì)算到每步的最短距離,到下步的最短距離只用接著本步的計(jì)算即可,相比窮舉法,**縮短了計(jì)算的時(shí)間,并且基本可以實(shí)現(xiàn)實(shí)時(shí)的輸出,這看似簡單,但在當(dāng)時(shí)確是很了不起的。維特比并不滿足停留在算法本身,他將算法推廣出去,并應(yīng)用到了實(shí)際中,創(chuàng)立了高通公司,成為了世界上第二富有的數(shù)學(xué)家。高通公司在第二代移動(dòng)通信中并不占很強(qiáng)的市場地位,而其利用CDMA技術(shù)霸占了3G的市場,可見遠(yuǎn)見的洞察力是多么的重要。
第二十七章《再談文本分類問題——期望最大化算法》:該章講的其實(shí)就是K均值聚類問題,設(shè)置原始聚類中心,然后不斷迭代,直至收斂,將每個(gè)點(diǎn)分到一個(gè)類中。其實(shí)隱馬爾科夫模型的訓(xùn)練和最大熵的訓(xùn)練都是期望最大化算法(EM)。首先,根據(jù)現(xiàn)有的模型,計(jì)算各個(gè)觀測數(shù)據(jù)輸入到模型中的計(jì)算結(jié)果,這個(gè)過程稱為期望值計(jì)算過程,或E過程;接下來,重新計(jì)算模型參數(shù),以最大化期望值,這個(gè)過程稱為最大化的過程,或M過程。優(yōu)化的目標(biāo)函數(shù)如果是個(gè)凸函數(shù),則一定有全局最優(yōu)解,若不是凸函數(shù),則可能找到的是局部最優(yōu)解。在以后的一些問題求解過程中,應(yīng)該考慮其是否是EM問題,也可以考慮參考這種思想,不斷迭代以優(yōu)化目標(biāo)的過程。
第二十八章《邏輯回歸和搜索廣告》:雅虎和百度的競價(jià)排名廣告并不比谷歌的根據(jù)廣告的預(yù)估點(diǎn)擊率來客觀的推送廣告收入多。點(diǎn)擊預(yù)估率有很多影響因素,一種有效的方法是邏輯回歸模型,邏輯回歸模型是一種將影響概率的不同因素結(jié)合在一起的指數(shù)模型。其訓(xùn)練方法和最大熵模型相似。同樣不是很理解其具體內(nèi)涵。
第二十九章《各個(gè)擊破和Google云計(jì)算的基礎(chǔ)》:分而治之,各個(gè)擊破是一個(gè)很好的方法,Google開發(fā)的MapReduce算法就應(yīng)用了該方法。將一個(gè)大任務(wù)分成幾個(gè)小任務(wù),這個(gè)過程叫Map,將小任務(wù)的結(jié)果合并成最終結(jié)果,這個(gè)過程叫Reduce,該過程如何調(diào)度、協(xié)調(diào)就是工程上比較復(fù)雜的事情了?梢姶罅坑玫降摹⒄嬲杏玫姆椒ㄍ唵味謽銓(shí)。
附錄《計(jì)算復(fù)雜度》:計(jì)算機(jī)中復(fù)雜度是以O(shè)()來表示的,如果一個(gè)算法的計(jì)算量不超過N的多項(xiàng)式函數(shù),則稱算法為多項(xiàng)式函數(shù)復(fù)雜度的(P問題),是可以計(jì)算的。若比N的多項(xiàng)式函數(shù)還高,則是非多項(xiàng)式問題,實(shí)際上是不可計(jì)算的。非多項(xiàng)式問題中一種非確定的多項(xiàng)式問題(簡稱NP),是科學(xué)家研究的焦點(diǎn),因?yàn)楝F(xiàn)實(shí)中好多問題都是NP問題。另外還有NP-Complete問題(NP問題可以在多項(xiàng)式時(shí)間內(nèi)規(guī)約到該問題)和NP-Hard問題,對(duì)于這兩種問題,需要簡化找到近似解。
整體上,《數(shù)學(xué)之美》這本書讓我了解了很多文本處理,數(shù)據(jù)挖掘相關(guān)的知識(shí),學(xué)到了很多。其中,簡單美以及一些科學(xué)家的大師風(fēng)范讓我印象深刻!書中提到的一些思想(即道)讓我受益匪淺!
《數(shù)學(xué)之美》讀書筆記4
這本書一共31章,主要介紹了這些數(shù)學(xué)方法:統(tǒng)計(jì)方法、統(tǒng)計(jì)語言模型、中文信息處理、隱含馬爾科夫模型、布爾代數(shù)、圖論、網(wǎng)頁排名技術(shù)、信息論、動(dòng)態(tài)規(guī)劃、余弦定理、矩陣運(yùn)算、信息指紋、密碼學(xué)、搜索技術(shù)、數(shù)學(xué)模型、最大熵模型、拼音輸入法、貝葉斯網(wǎng)絡(luò)、句法分析、維特比算法、各個(gè)擊破算法等。從第一章開始其明了幽默的語言就深深的吸引了我,讓我覺得如果早一點(diǎn)看這本書,也許數(shù)學(xué)之于我就是另一番天地。
第一章里作者從原始人類的通信方式開始入手,人類最早利用聲音進(jìn)行的通信依賴于開篇給出的"編碼-傳輸-解碼"的基本原理,指出原始人的通信方式和今天的通信方式?jīng)]什么不同,這世界上近現(xiàn)代最普遍的原理大部分都在人類發(fā)展的歷史上被無意識(shí)的使用著。
第六章信息論給出了信息的度量,它是基于概率的,概率越小,其不確定性越大,信息量就越大。引入信息量就可以消除系統(tǒng)的不確定性,同理自然語言處理的'大量問題就是找相關(guān)的信息。信息熵的物理含義是對(duì)一個(gè)信息系統(tǒng)不確定性的度量,這一點(diǎn)與熱力學(xué)中的熵概念相同,看似不同的學(xué)科之間也會(huì)有著很強(qiáng)的相似性。事務(wù)之間是存在聯(lián)系的,要學(xué)會(huì)借鑒其他知識(shí)。
這本書里也能找到不少在學(xué)的課程知識(shí),如大學(xué)專業(yè)課里,數(shù)電總是要比模電簡單不少,而自然界里大部分的信號(hào)都屬于模擬信號(hào)。所謂模擬信號(hào),是指從時(shí)間和數(shù)值兩種維度上看來都是連續(xù)變化的信號(hào)。在實(shí)際電路中,模/數(shù)轉(zhuǎn)換是一個(gè)很重要的過程,將預(yù)處理的模擬信號(hào)經(jīng)過模/數(shù)變換為數(shù)字信號(hào),然后進(jìn)行數(shù)字信號(hào)處理。而數(shù)字化處理有很多優(yōu)點(diǎn),比如功能強(qiáng)大、抗干擾能力強(qiáng)、易于傳輸?shù)取?/p>
簡而言之,如果沒有數(shù)學(xué),就沒有數(shù)字信號(hào)處理和傳輸?shù)母拍,而?shù)字信號(hào)傳輸在當(dāng)下大規(guī)模的集成電路里是必不可少的,這是通信成功的基本要求。
作者把生活中遇到的復(fù)雜的問題,以簡單清晰,直觀的模型或者公式展現(xiàn)出來。我們可能過于注意生活中的種種奇妙現(xiàn)象,往往忽略了追求其理論邏輯的演繹,而這也是大部分問題的主要根源。
羅素曾經(jīng)說過:"數(shù)學(xué),如果正確地看,不但擁有真理,而且也具有至高的美";愛因斯坦也曾說過:"純數(shù)學(xué)使我們能夠發(fā)現(xiàn)概念和聯(lián)系這些概念的規(guī)律,這些概念和規(guī)律給了我們理解自然現(xiàn)象的鑰匙。"數(shù)學(xué)在所有科學(xué)領(lǐng)域起著基礎(chǔ)和根本的作用。"哪里有數(shù),哪里就有美".在這里,我也想把《數(shù)學(xué)之美》真誠推薦給每一位對(duì)自然、科學(xué)、生活有興趣有熱情的朋友,不管你是從事職業(yè),讀一讀它,會(huì)讓你受益良多。
吳軍老師在《數(shù)學(xué)之美》中提到:"這本書的目的是講道而不是講術(shù)。很多具體的搜索技術(shù)很快會(huì)從獨(dú)門絕技到普及,再到落伍,追求術(shù)的人一輩子工作很辛苦。只有掌握了搜索的本質(zhì)和精髓才能永遠(yuǎn)游刃有余".回到我們?nèi)粘5纳钪,需要學(xué)習(xí)的東西、技術(shù)太多太多,如果一味地只為去追技術(shù)的腳步,那么我們也會(huì)很累很累。然而基本的原理卻是沒有怎么變化的。只見森林,不見樹木,難免迷失;站在高處向下看,也許我們一直看不到底,但是站在底處卻是可以看見底的。
《數(shù)學(xué)之美》讀書筆記5
我是在讀了吳軍博士的《浪潮之巔》之后,發(fā)現(xiàn)推薦了《數(shù)學(xué)之美》這本書。我到豆瓣讀書上看了看評(píng)價(jià),就果斷在當(dāng)當(dāng)上下單買了一本研讀。本來我以為這是一本充滿各種數(shù)學(xué)專業(yè)術(shù)語的書,讀后讓我非常震撼的是吳軍博士居然能用非常通俗的語言將自然語言處理等高深理論解釋的相當(dāng)簡單。在李開復(fù)博士之后,吳軍博士又成為了目前備受矚目的具有深厚技術(shù)背景的作家。對(duì)于我來說,讀這本書有掃盲的功效,讓我知道了很多以前不知道的東西。我的想法是在研究生階段,不只局限于導(dǎo)師的研究方向,通過更加廣泛的涉獵知識(shí),去尋找一個(gè)自己喜歡的研究領(lǐng)域。如果找到了這樣一個(gè)領(lǐng)域,那么我就讀博士。如果沒有的話,那么我想還是工作算了。
1、學(xué)科之間的聯(lián)系是如此的重要
全書主要是圍繞著吳軍博士所研究的自然語言處理方向來講述一些應(yīng)用在這個(gè)研究領(lǐng)域的數(shù)學(xué)知識(shí),用了很大篇幅講解了將通信的原理應(yīng)用到自然語言處理上所取得的'巨大成功。以前學(xué)習(xí)計(jì)算機(jī)網(wǎng)絡(luò)的時(shí)候,學(xué)過一個(gè)香農(nóng)定理。對(duì)香農(nóng)的認(rèn)識(shí)就從香農(nóng)定理開始,因?yàn)榭佳袝?huì)考相關(guān)的計(jì)算題?戳诉@本書才知道,香農(nóng)的《信息論》對(duì)今天的影響真的是不可估量。通過這樣一個(gè)過程,我也對(duì)以前的本科學(xué)校的學(xué)科建設(shè)產(chǎn)生了一些憂慮。對(duì)于培養(yǎng)計(jì)算機(jī)人才來說,無論是培養(yǎng)應(yīng)用型人才,還是培養(yǎng)研究型人才,都應(yīng)該與電子、通信有一定的交叉,這樣對(duì)學(xué)生思考問題的啟發(fā)與視野的開闊有著重要的作用。計(jì)算機(jī)本身就是從電子、通信、數(shù)學(xué)等學(xué)科中抽出來的新興的學(xué)科,在發(fā)展了多年之后,我們發(fā)現(xiàn)它仍然需要繼承一些傳統(tǒng);叵胱约旱谋究扑哪,上的更多的課時(shí)
語言類、技術(shù)類的課程,這些課程的確對(duì)提升學(xué)生的就業(yè)有很大幫助。但是我想說的是,一個(gè)忽視數(shù)學(xué)基礎(chǔ)、學(xué)科交叉的學(xué)校,他無法成為一所**的一流大學(xué)。作為一個(gè)母校培養(yǎng)的學(xué)生,我深知**的阻力與困難,但是我希望母校的計(jì)算機(jī)學(xué)院能越辦越好。我們現(xiàn)在已經(jīng)培養(yǎng)出很多高薪優(yōu)秀的技術(shù)人才,我希望將來也能培養(yǎng)出更多的研究型人才。
2、看起來很牛的東西卻用著難以置信的簡單數(shù)學(xué)原理
在整本書中讓我最為印象深刻的是解釋Google搜索的原理,居然就是簡單的布爾代數(shù)運(yùn)算。這個(gè)的確讓我大跌眼鏡,我一直認(rèn)為搜索時(shí)一個(gè)非常復(fù)雜而龐大的問題,其數(shù)學(xué)原理也是相當(dāng)高深的,但是吳軍博士的解釋讓我大開眼界。與此同時(shí)也知道了Google為什么牛,牛在哪了。搜索的原理雖然非常簡單,但是搜索是一個(gè)需要對(duì)海量數(shù)據(jù)進(jìn)行操作的工作。Google在海量數(shù)據(jù)的處理方面的確是相當(dāng)先進(jìn)的,MapReduce、BigTable等等一些技術(shù)的發(fā)明與應(yīng)用使得Google在搜索上無出其右。目前分布式存儲(chǔ)、分布式計(jì)算、數(shù)據(jù)倉庫與存儲(chǔ)等研究領(lǐng)域近些年來的大熱也說明Google在引領(lǐng)研究方向上的超凡本領(lǐng)。
3、感謝概率老師的教誨
在大二的時(shí)候,有一個(gè)在我們學(xué)生中聲望很高的概率老師,他在課程即將結(jié)束的時(shí)候跟我們說我們將的是前幾章,這些事概率論與數(shù)理統(tǒng)計(jì)的基礎(chǔ)。對(duì)于你們計(jì)算機(jī)的學(xué)生來時(shí),后面的章節(jié)才是最有用的,以后一定要好好的研究,弄上一兩個(gè)在你的畢業(yè)設(shè)計(jì)上就會(huì)讓你畢業(yè)設(shè)計(jì)提升一個(gè)檔次,有可能驗(yàn)收你畢業(yè)設(shè)計(jì)的老師也不懂。我當(dāng)時(shí)對(duì)他的話沒有特別在意,我只關(guān)心期末考試要考哪些題目,因?yàn)槲夷莻(gè)學(xué)期的概率課基本上都在睡覺,只有他講笑話的時(shí)候不睡。我看《數(shù)學(xué)之美》后發(fā)現(xiàn)馬爾科夫鏈、貝葉斯網(wǎng)絡(luò)之后,對(duì)以前的概率老師充滿無限的敬意。我發(fā)現(xiàn)我們?cè)俦究齐A段學(xué)習(xí)的《高等數(shù)學(xué)》、《線性代數(shù)》、《概率論與數(shù)理統(tǒng)計(jì)》在計(jì)算機(jī)學(xué)科應(yīng)用較多的要數(shù)概率論與數(shù)理統(tǒng)計(jì),還有一門我學(xué)的不好的《離散數(shù)學(xué)》在計(jì)算機(jī)中也是有著舉足輕重的地位。我在看米歇爾的《機(jī)器學(xué)習(xí)》時(shí)也發(fā)現(xiàn)很多熟悉的概率論與數(shù)理統(tǒng)計(jì)的知識(shí),這讓我不得不開始考慮重新彌補(bǔ)自己的數(shù)學(xué)短板。我的想法是在研一這一年把概率論與數(shù)理統(tǒng)計(jì)、線性代數(shù)、離散數(shù)學(xué)盡我最大的努力補(bǔ)一補(bǔ),希望他們對(duì)我今后的學(xué)習(xí)有所幫助。
4、說說作者吳軍博士
吳軍博士寫的書對(duì)于學(xué)習(xí)計(jì)算機(jī)的學(xué)生來說,讀起來有種說不出的親切感?赡苓@跟他是技術(shù)出身的原因有關(guān),流暢的文筆、質(zhì)樸的文風(fēng)也讓人讀起來很舒服?**松在優(yōu)酷上的《曉說》就知道,在硅谷有著眾多的華裔工程師,他們很多都來自清華、北大等**的名牌大學(xué),這些人在**實(shí)現(xiàn)著自己的夢想。吳軍博士也曾是這其中的一員,我非常希望那些像吳軍博士一樣的牛人們能夠?qū)憰蛘邅?*的大學(xué)做一些演講、論壇等等,開闊一下我們的視野,傳授一下做學(xué)問的經(jīng)驗(yàn)。與此同時(shí),我也在想為什么我們國家那么多優(yōu)秀的IT人才都去了**。
這個(gè)問題在我去蘋果公司在東軟信息學(xué)院**的培訓(xùn)過程中得到了答案,那個(gè)南京郵電的老師講了講*為什么不像**那么有創(chuàng)造力。我們*人并不缺乏創(chuàng)造力,很多時(shí)候是我們所處的外部環(huán)境恰恰阻礙了創(chuàng)新。我想那么多優(yōu)秀的清華北大學(xué)子紛紛到大洋彼岸的**,正是被**開放的學(xué)術(shù)環(huán)境、創(chuàng)新氛圍所吸引,每個(gè)人都有自己的夢想,他們?nèi)?*也是為了能實(shí)現(xiàn)自己的夢想。以前都覺得他們是不愛國,現(xiàn)在長大了,對(duì)于這個(gè)問題看得更清楚了一點(diǎn)。
我想說我們的祖國在經(jīng)歷了**開放30多年的飛速發(fā)展之后,目前正處于一個(gè)關(guān)鍵和脆弱的時(shí)期。我們靠著人口紅利取得了巨大的成就,我們能不能憑借人才紅利取得更大的成就還是未知。希望有更多的人才能像李開復(fù)博士、吳軍博士那樣,為我們這個(gè)民族青年的成長和國家發(fā)展做出貢獻(xiàn)。
《數(shù)學(xué)之美》讀書筆記6
讀完本書,第一感受:次奧!原來數(shù)學(xué)如此多的原理模型概念都可以用去解決各種IT技術(shù)問題啊。特別是語言識(shí)別和自然語言處理這類問題完全就是建立在數(shù)學(xué)原理之上的?傊,這本書就是用非常深入淺出的話去說明如何用數(shù)學(xué)方法去解決計(jì)算機(jī)的各種工程問題。這是一本講道,而不是術(shù)的書。 要完全讀懂這本書,我覺得至少需要掌握這三門課:高等數(shù)學(xué),離散數(shù)學(xué),還有概率論與數(shù)理統(tǒng)計(jì)。唉..我當(dāng)初數(shù)學(xué)學(xué)得太水了,還掛了高數(shù)啊...有好的概念沒看懂,以后有時(shí)間在好好看吧。如果想搞計(jì)算機(jī)研究的話,數(shù)學(xué)基礎(chǔ)必不可少,別總在抱怨各種數(shù)學(xué)課上的東西一輩子都用不著。
發(fā)現(xiàn)作者對(duì)人類自然發(fā)展的認(rèn)識(shí)非常深,其從語言,文字,數(shù)學(xué)的產(chǎn)生發(fā)展,信息的傳播記錄得出了這個(gè)結(jié)論:信息的產(chǎn)生傳播接收反饋,和今天最先進(jìn)的通信在原理上沒有任何差別。就算是科學(xué)上最高深的技術(shù),那也是模擬我們生活中的一些基本原理。
我們今天使用的十進(jìn)制,就是我們扳手指扳了十次,就進(jìn)一次位。而瑪雅文明他們數(shù)完了手指和腳指才開始進(jìn)位,所以他們用的是二十進(jìn)制。實(shí)際上*數(shù)字是古印度人發(fā)明的,只是歐洲人不知道這些數(shù)字的真正發(fā)明人是古印度,而就把這功勞該給了“二道販子”*人。
語言的數(shù)學(xué)本質(zhì)
任何一種語言都是一種編碼方式,比如我們把一個(gè)要表達(dá)的意思,通過語言一句話表達(dá)出來,就是利用編碼方式對(duì)頭腦中的信息做了一次編碼,編碼的結(jié)果就是一串文字,聽者則用這語言的解碼方法獲得說話者要表達(dá)的信息。
自然語言處理模型
計(jì)算機(jī)是很笨的,他們唯一會(huì)做的就是計(jì)算。自然語言處理在數(shù)學(xué)模型上是基于統(tǒng)計(jì)的,說一個(gè)句子是否合理,就看看他出現(xiàn)的可能性大小如何,可能性就是用概率來衡量,比如一個(gè)句子,出現(xiàn)的概率為1/10^10,另一個(gè)句子出現(xiàn)的概率為1/10^20,那么我們就可以說第一個(gè)句子比第二個(gè)句子更加合理。當(dāng)然這要求有足夠的觀測值,他有大數(shù)定理在背后**。
最早的中文分詞方法
這句話:“同學(xué)們呆在圖書館看書”,如何分詞?應(yīng)該是這樣:同學(xué)們/呆在/圖書館/看書.最先的方法是北航一老師提出的查字典方法,就是把句子從左道右掃描一遍,遇到字典里面出現(xiàn)的詞就標(biāo)示出來,遇到復(fù)合詞如(**大學(xué))就按照最長的分詞匹配,遇到不認(rèn)識(shí)的字串就分割成單個(gè)字,于是中文的分詞就完成了。但是這只能解決78成的分詞問題,但是“像發(fā)展*家”這種短語它是分不出來的。后來**用基于統(tǒng)計(jì)語言模型方法才解決了。
隱含馬可夫模型(沒這么看懂)
一直被認(rèn)為是解決打多數(shù)自然語言處理問題最為快速有效的方法,大致意思是:隨機(jī)過程中各個(gè)狀態(tài)的概率分布,只與他的前一個(gè)狀態(tài)有關(guān)。比如對(duì)于天氣預(yù)報(bào),我們只假設(shè)今天的氣溫只與昨天有關(guān)而與前天沒有關(guān)系,這雖然不完美,但是以前不好解決的問題都可以給出近視值了。
一個(gè)讓我印象深刻的觀點(diǎn):
小學(xué)生和中學(xué)生其實(shí)沒有必要花那么多時(shí)間去讀書,其覺得最主要的是孩子們的社會(huì)經(jīng)驗(yàn),生活能力,和那時(shí)候樹立起來的志向,這將幫助他們一生。而中學(xué)生階段花很多時(shí)間比同伴多讀的課程,在大學(xué)以后可以用非常短的時(shí)間就可以讀完。因?yàn)樵诖髮W(xué)階段,人的理解能力要強(qiáng)很多,比如中學(xué)要花500小時(shí)才能搞明白的內(nèi)容,大學(xué)可能花100小時(shí)就搞定了。學(xué)習(xí)和教育是一個(gè)人一輩子的事情,很多中學(xué)成績好的人進(jìn)入大學(xué)后有些就表現(xiàn)不太好了,要有不斷學(xué)習(xí)的動(dòng)力才行。
余弦定理和**分類
我在新浪干過一年多**,這篇認(rèn)真看了一篇,很吃驚原理cos x與**分析也有關(guān)系啊。google的**服務(wù)是由計(jì)算機(jī)自動(dòng)整理分類的。而傳統(tǒng)的**如***站是讓編輯讀懂**,找到主題,再分類分級(jí)別的,真苦逼啊...計(jì)算機(jī)自動(dòng)分類原理是這樣:如一篇**有10000個(gè)詞,組成一個(gè)萬維向量,這個(gè)向量就**這篇**,可以通過某種算法表達(dá)這個(gè)**主題的類型,如果兩個(gè)向量的方向一致,說明對(duì)應(yīng)的**用詞一致,方向可用夾角表示,夾角可用余弦定理表示,所以當(dāng)夾角的余弦值接近于1時(shí),這兩篇**就可以歸為一類了。
沒看懂的東西:
布爾代數(shù):布爾代數(shù)把邏輯學(xué)和數(shù)學(xué)合二為一,給了我們一個(gè)全新的視角看世界...
網(wǎng)絡(luò)爬蟲的基本原來是利用了圖論的廣度優(yōu)先搜索和深度優(yōu)先搜索...
搜索引擎的結(jié)果排名用了稀疏矩陣的計(jì)算...
地圖最基本的計(jì)算是利用了有限狀態(tài)機(jī)和圖論的最短路徑...
密碼學(xué)原理,最大熵模型,拼音輸入法的數(shù)學(xué)模型,布隆過濾器,貝葉斯網(wǎng)絡(luò)等等...
任何事物都有它的發(fā)展規(guī)律,當(dāng)我們認(rèn)識(shí)了規(guī)律后,應(yīng)當(dāng)在生活工作中遵循規(guī)律,希望大家透過IT規(guī)律的認(rèn)識(shí),可 以舉一反三的總結(jié)學(xué)習(xí)認(rèn)識(shí)規(guī)律,這樣有助于自己的境界提升一個(gè)層次。
任何問題總是能找到相應(yīng)的準(zhǔn)確數(shù)學(xué)模型,一個(gè)正確的數(shù)學(xué)模型在形式上應(yīng)當(dāng)是簡單的,一個(gè)好的方法在形式上應(yīng)當(dāng)也是簡單的。簡單才是美。
《數(shù)學(xué)之美》讀書筆記7
《數(shù)學(xué)之美》,一個(gè)從事多年工作的谷歌研究員眼中的數(shù)學(xué)。令我大飽眼福的是,大學(xué)里面的數(shù)學(xué)知識(shí)竟能如此廣泛運(yùn)用到了計(jì)算機(jī)行業(yè)中。
在語音識(shí)別、翻譯,還有密碼學(xué)領(lǐng)域,有著許多基于概率統(tǒng)計(jì)的模型和思想。當(dāng)然,貝葉斯公式是基礎(chǔ),應(yīng)用到隱含馬爾科夫鏈模型,神經(jīng)網(wǎng)絡(luò)模型。
在搜索中,一些相關(guān)性的計(jì)算,無不用到了概率的知識(shí)。在**分類中,用到了一些有關(guān)矩陣特征值、相似對(duì)角化的知識(shí)。當(dāng)然,在圖像處理方面,矩陣變換可謂是無處不在。另外,在識(shí)別方面,有一些通信模型,涉及到了信道、誤碼率、信息熵。
最近剛開學(xué)也沒什么事,所以就想隨便找?guī)妆緯匆幌,但最好別是那種太艱深晦澀的書。8月份一直到現(xiàn)在,吳軍寫的這本12年5月出版的《數(shù)學(xué)之美》一直盤踞京東、亞馬遜等各大網(wǎng)上商城科技類圖書的榜首,當(dāng)然,還有早些時(shí)候出版的《浪潮之巔》也排在很靠前的位置。心想市場的力量應(yīng)該能幫我挑出好書吧,于是就從圖書館借了一本來,一直到今天晚上把它給看完了。
因此想寫一點(diǎn)東**總結(jié)、反思一下,反正剛開完班會(huì)也沒什么事干。
寫在前面的建議:如果你不討厭數(shù)學(xué)的話,強(qiáng)烈推薦這本書,網(wǎng)上也可以下到電子版,不過閱讀感覺上還是很不一樣的。
廢話就不多說了,《數(shù)學(xué)之美》其實(shí)是一本科普類的讀物,所面向的是接受過普通高等教育的人,完全不需要在特定領(lǐng)域有很深的造詣就可以看懂,大概懂一點(diǎn)線性代數(shù)、概率統(tǒng)計(jì)、組合數(shù)學(xué)、信息論、計(jì)算機(jī)算法、模式識(shí)別最好(雖然列舉了這么多,其實(shí)有些不懂也沒關(guān)系……),所以尤其適合信科的人看。內(nèi)容大部分是和人工智能、計(jì)算機(jī)相關(guān)的,這并非我所學(xué)的專業(yè),但作者比較擅長將看似復(fù)雜的原理用簡明的語言表達(dá)出來,所以可讀性還是很好的。
吳軍是清華大學(xué)畢業(yè)的,之前任職于Google,后來到了騰訊,這些文章都是發(fā)表在Google黑板報(bào)上的,后來經(jīng)過了重寫,所以網(wǎng)上下載的和書本內(nèi)容有所差異。由于吳軍本人是研究自然語言處理和語音識(shí)別的,所以統(tǒng)計(jì)語言模型的東西可能會(huì)多一點(diǎn),不過我覺得這絲毫不妨礙全書數(shù)學(xué)之美的展現(xiàn)……感覺收獲還是挺多的,知識(shí)上的有一些,但更多還是思維方式上的。作者舉了很多例子試圖讓人明白很多看似復(fù)雜的高科技背后,基本原理其實(shí)是出乎意料簡單的(當(dāng)然,必須承認(rèn)第一個(gè)想到這些方法的人還是非常了不起的……)。比如高準(zhǔn)確率的機(jī)器翻譯,看上去好像是計(jì)算機(jī)能夠理解各國語言,隱藏在背后的卻是很多具有大學(xué)理科**的人都非常清楚的統(tǒng)計(jì)模型和概率模型;再比如拼音輸入法的數(shù)學(xué)原理,早期的研究主要集中在縮短*均編碼長度,比如曾經(jīng)流行一時(shí)的五筆輸入法,而現(xiàn)今真正實(shí)用的輸入法卻是有很多信息冗余、編碼長度比較長的拼音輸入法,作者從信息論和市場的角度做了簡單的闡述;又比如**的自動(dòng)分類,許多非IT領(lǐng)域的人可能會(huì)認(rèn)為計(jì)算機(jī)可以讀懂**并進(jìn)行分類,而實(shí)際上只是特征向量的抽取、多維空間中向量夾角的計(jì)算,非常非常簡單,但凡學(xué)過一點(diǎn)線性代數(shù)的人絕對(duì)是一看就懂的……當(dāng)然,完美的實(shí)現(xiàn)還需要考慮很多細(xì)節(jié)和現(xiàn)實(shí)的情況,但這并不是這本書所關(guān)注的地方,數(shù)學(xué)之美在于其簡潔而不是繁瑣。
除了對(duì)于具體信息技術(shù)的剖析之外,作者還花了很大篇幅來講一些杰出人士的成長過程,特別是把這些人的成長經(jīng)歷和*學(xué)生的成長經(jīng)歷作對(duì)比。雖然作者并沒有明說,但字里行間多少流露出對(duì)于*高等教育以及很多*企業(yè)的批評(píng),一是教育的功利性,缺乏寬松的**思考的環(huán)境,即使學(xué)了一堆理論也難有用武之地,自然也就缺乏創(chuàng)新性的成果;二是*企業(yè)的短視,大部分都不舍得在新框架開發(fā)上投資,而是坐享學(xué)術(shù)界和**企業(yè)的研究成果。
總結(jié)一下呢,《數(shù)學(xué)之美》事實(shí)上不能帶給你編程能力的提升,也沒法讓人的數(shù)學(xué)水*有顯著的提升,但它在很大程度上讓你跳出教科書式的繁瑣細(xì)節(jié)的束縛,能夠從更宏觀的角度來思考信息世界背后的數(shù)學(xué)引擎的運(yùn)行原理,讓人明白看似很高級(jí)、復(fù)雜的東西背后其實(shí)并不如我們所想象的那樣復(fù)雜,而我們所學(xué)的“枯燥”的數(shù)學(xué)真的可以“四兩撥千斤”,改變億萬人的生活。
《數(shù)學(xué)之美》讀書筆記8
《數(shù)學(xué)之美》是一本領(lǐng)域相關(guān)的數(shù)學(xué)概念書,生動(dòng)形象地講解了關(guān)于數(shù)據(jù)挖掘、文本檢索等方面的基礎(chǔ)知識(shí),可以作為數(shù)據(jù)挖掘、文本檢索的入門普及書。另外,就像作者吳軍老師提到的,關(guān)鍵是要從中學(xué)到道----解決問題的方法,而不僅僅是術(shù)。書中也啟發(fā)式的引導(dǎo)讀者形成自己解決問題的道。
下面記錄一下自己讀這本書的一些感想:
第一章《文字和語言vs數(shù)字和信息》:文字和語言中天然蘊(yùn)藏著一些數(shù)學(xué)思想,數(shù)學(xué)可能不僅僅的是一門非常理科的知識(shí),也是一種藝術(shù)。另外,遇到一個(gè)復(fù)雜的問題時(shí),可能生活中的一些常識(shí),一些簡單的思想會(huì)給你帶來解決問題的靈感。
第二章《自然語言處理----從規(guī)則到統(tǒng)計(jì)》:試圖模擬人腦處理語言的模式,基于語法規(guī)則,詞性等進(jìn)行語法分析、語義分析的自然語言處理有著很大的復(fù)雜度,而基于統(tǒng)計(jì)的語言模型很好的解決了自然語言處理的諸多難題。人們認(rèn)識(shí)這個(gè)過程,找到統(tǒng)計(jì)的方法經(jīng)歷了20多年,非常慶幸我們的前輩已經(jīng)幫我們找到了正確的方法,不用我們?cè)偃タ嗫嗝。另外,這也說明在發(fā)現(xiàn)真理的過程中是充滿坎坷的,感謝那些曾經(jīng)奉獻(xiàn)了青春的科學(xué)家。自己以后遇到問題也不能輕易放棄,真正的成長是在解決問題的過程中。事情不可能****的,這是自然界的普遍真理吧!
第三章《統(tǒng)計(jì)語言模型》:自然語言的處理找到了一種合適的方法---基于統(tǒng)計(jì)的模型,概率論的知識(shí)開始發(fā)揮作用。二元模型、三元模型、多元模型,模型元數(shù)越多,計(jì)算量越大,簡單實(shí)用就是最好的。對(duì)于某些不出現(xiàn)或出現(xiàn)次數(shù)很少的詞,會(huì)有零概率問題,這是就要找到一數(shù)學(xué)方法給它一個(gè)很小的概率。以前學(xué)概率論的時(shí)候覺的沒什么用,現(xiàn)在開始發(fā)現(xiàn)這些知識(shí)可能就是你以后解決問題的利器。最后引用作者本章的最后一句話:數(shù)學(xué)的魅力就在于將復(fù)雜的問題簡單化。
第四章《談?wù)勚形姆衷~》:中文分詞是將一句話分成一些詞,這是以后進(jìn)一步處理的基礎(chǔ)。從開始的查字典到后來基于統(tǒng)計(jì)語言模型的分詞,如今的中文分詞算是一個(gè)已經(jīng)解決的問題。然而,針對(duì)不同的系統(tǒng)、不同的要求,分詞的粒度和方法也不盡相同,還是針對(duì)具體的問題,提出針對(duì)該問題最好的方法。沒有什么是絕對(duì)的,掌握其中的道才是核心。
第五章《隱馬爾科夫模型》:隱馬爾科夫模型和概率論里面的馬爾科夫鏈相似,就是該時(shí)刻的狀態(tài)僅與前面某幾個(gè)時(shí)刻的狀態(tài)有關(guān);诖罅繑(shù)據(jù)訓(xùn)練出相應(yīng)的隱馬爾科夫模型,就可以解決好多機(jī)器學(xué)習(xí)的問題,訓(xùn)練中會(huì)涉及到一些經(jīng)典的算法(維特比算法等)。關(guān)于這個(gè)模型,沒有實(shí)際實(shí)現(xiàn)過,所以感覺好陌生,只是知道了些概率論講過的原理而已。
第六章《信息的度量和作用》:信息論給出了信息的度量,它是基于概率的,概率越小,其不確定性越大,信息量就越大。引入信息量就可以消除系統(tǒng)的不確定性,同理自然語言處理的大量問題就是找相關(guān)的信息。信息熵的物理含義是對(duì)一個(gè)信息系統(tǒng)不確定性的度量,這一點(diǎn)與熱力學(xué)中的熵概念相同,看似不同的學(xué)科之間也會(huì)有著很強(qiáng)的相似性。事務(wù)之間是存在聯(lián)系的,要學(xué)會(huì)借鑒其他知識(shí)。
第七章《賈里尼克和現(xiàn)代語言處理》:賈里尼克是為世界級(jí)的大師,不僅在于他的學(xué)術(shù)成就,更在于他的風(fēng)范。賈里尼克教授少年坎坷,也并非開始就投身到自然語言方面的研究,關(guān)鍵是他的思想和他的道。賈里克尼教授治學(xué)嚴(yán)謹(jǐn)、用心對(duì)待自己的學(xué)生,對(duì)于學(xué)生的教導(dǎo),教授告訴你最多的是“什么方法不好”,這很像聽到的一句話“我不贊同你,但我**你”。賈里克尼教授一生專注學(xué)習(xí),最后在辦公桌前過世了。讀了這章我總結(jié)出的一句話是“思想決定一個(gè)人的高度”。
在這章中對(duì)于少年時(shí)的教育,以下幾點(diǎn)值得借鑒:
1、少年時(shí)期其實(shí)沒有必要花那么多時(shí)間讀書,他們的社會(huì)經(jīng)驗(yàn)、生活能力以及在那時(shí)樹立起的志向?qū)椭麄円簧?/p>
2、中學(xué)時(shí)花大量時(shí)間學(xué)會(huì)的內(nèi)容,在大學(xué)用非常短的時(shí)間就可以讀完,因?yàn)樵诖髮W(xué)階段,人的理解力要強(qiáng)很多。
3、學(xué)習(xí)(和教育)是一個(gè)人一輩子的過程。
4、書本的內(nèi)容可以早學(xué),也可以晚學(xué),但是錯(cuò)過了成長階段卻是無法補(bǔ)回來的。
第八章《簡單之美----布爾代數(shù)和搜索引擎的索引》:布爾是19世紀(jì)英國的一位中學(xué)教師,但他的公開身份是啤酒商,提出好的思想的人不一定是大師。簡單的建立索引可以根據(jù)一個(gè)詞是否在一個(gè)網(wǎng)頁中出現(xiàn)而設(shè)置為0和1,為了適應(yīng)索引訪問的速度、附加的信息、更新要快速,改進(jìn)了索引的建立,但原理上依然簡單,等價(jià)于布爾運(yùn)算。牛頓的一句話“(人們)發(fā)覺真理在形式上從來是簡單的,而不是復(fù)雜和含混的”。做好搜索,最基本的要求是每天分析10-20個(gè)不好的搜索結(jié)果,積累一段時(shí)間才有感覺。有時(shí)候,學(xué)習(xí)、處理問題,可以從不好的方面入手,效果可能更好。
第九章《圖論和網(wǎng)絡(luò)爬蟲》:圖的遍歷分為“廣度優(yōu)先搜索(Breadth-FirstSearch,簡稱BFS)”和“深度優(yōu)先搜索(Depth-FirstSearch,簡稱DFS);ヂ(lián)網(wǎng)上有幾百億的網(wǎng)頁,需要大量的服務(wù)器用來下載網(wǎng)頁,需要協(xié)調(diào)這些服務(wù)器的任務(wù),這就是網(wǎng)絡(luò)設(shè)計(jì)和程序設(shè)計(jì)的藝術(shù)了。另外對(duì)于簡單的網(wǎng)頁,沒必要下載。還需要存儲(chǔ)一張哈希表來記錄哪些網(wǎng)頁已經(jīng)存儲(chǔ)過(如果記錄每個(gè)網(wǎng)頁的url,數(shù)量太多,這里可以用后面提到的信息指紋,只需要一個(gè)很多位的數(shù)字即可),避免重復(fù)下載。另外,在圖論出現(xiàn)的很長一段時(shí)間里,實(shí)際需求的圖只有幾千個(gè)節(jié)點(diǎn),那時(shí)圖的遍歷很簡單,人們都沒有怎么專門研究這個(gè)問題,隨著互聯(lián)網(wǎng)的出現(xiàn),圖的遍歷一下子有了用武之地,很多數(shù)學(xué)方法就是這樣,看上去沒有什么用途,等到具體的應(yīng)用出來了一下子開始派上大用場了,這可能就是世界上很多人畢生研究數(shù)學(xué)的原因吧。一個(gè)系統(tǒng)看似整體簡單,但里面的每個(gè)東西都可能是一個(gè)復(fù)雜的東西,需要很好的設(shè)計(jì)。
第十章《PageRank----Google的**表決式網(wǎng)頁排名技術(shù)》:搜索返回了成千上萬條結(jié)果,如何為搜索結(jié)果排名?這取決與兩組信息:關(guān)于網(wǎng)頁的質(zhì)量信息以及這個(gè)查詢和每個(gè)網(wǎng)頁的相關(guān)性信息。PageRank算法來衡量一個(gè)網(wǎng)頁的質(zhì)量,該算法的思想是如果一個(gè)網(wǎng)頁被很多其他網(wǎng)頁所鏈接,說明它收到普遍的承認(rèn)和信賴,那么它的排名就高。谷歌的創(chuàng)始人佩奇和布林提出了該算法并用迭代的方法解決了這個(gè)問題。PageRank在Google所有的算法中依然是至關(guān)重要的。該算法并不難,可是當(dāng)時(shí)只有佩奇和布林想到了,為什么呢?
第十一章《如何確定網(wǎng)頁和查詢的相關(guān)性》:構(gòu)建一個(gè)搜索引擎的四個(gè)方面:如何自動(dòng)下載網(wǎng)頁、如何建立索引、如何衡量網(wǎng)頁的質(zhì)量以及確定一個(gè)網(wǎng)頁和某個(gè)查詢的相關(guān)性。搜索關(guān)鍵詞權(quán)重的科學(xué)度量TF—IDF,TF衡量一個(gè)詞在一個(gè)網(wǎng)頁中的權(quán)重,即詞頻。IDF衡量一個(gè)詞本身的權(quán)重,對(duì)主題的預(yù)測能力。一個(gè)查詢和該網(wǎng)頁的相關(guān)性公式由詞頻的簡單求和變成了加權(quán)求和,即TF1*IDF1+TF2*IDF2+...+TFN*IDFN?此茝(fù)雜的搜索引擎,里面的原理竟是這么簡單!
第十二章《地圖和本地搜索的最基本技術(shù)——有限狀態(tài)機(jī)和動(dòng)態(tài)規(guī)劃》:地址的解析依靠有限狀態(tài)機(jī),當(dāng)用戶輸入的地址不太標(biāo)準(zhǔn)或有錯(cuò)別字時(shí),希望進(jìn)行模糊匹配,提出了一種基于概率的有限狀態(tài)機(jī)。通用的有限狀態(tài)機(jī)的程序不是很好寫,要求很高,建議直接采用開源的代碼。圖論中的動(dòng)態(tài)規(guī)劃問題可以用來解決兩點(diǎn)間的最短路徑問題,可以將一個(gè)“尋找全程最短路線”的問題,分解成一個(gè)個(gè)尋找局部最短路線的小問題。有限狀態(tài)機(jī)和動(dòng)態(tài)規(guī)劃問題需要看相關(guān)的算法講解,才能深入理解,目前對(duì)其并未完全理解。
第十三章《GoogleAK-47的設(shè)計(jì)者——阿米特·辛格博士》:辛格堅(jiān)持選擇簡單方案的一個(gè)原因是容易解釋每一個(gè)步驟和方法背后的道理,這樣不僅便于出了問題時(shí)查錯(cuò),而且容易找到今后改進(jìn)的目標(biāo)。辛格要求對(duì)于搜索質(zhì)量的改進(jìn)方法都要能說清楚理由,說不清楚理由的改進(jìn)即使看上去有效也不會(huì)采用,因?yàn)檫@樣將來可能是個(gè)隱患。辛格非常鼓勵(lì)年輕人要不怕失敗,大膽嘗試。遵循簡單的哲學(xué)。
第十四章《余弦定理和**的分類》:將**根據(jù)詞的TF-IDF值組成**的特征向量,然后根據(jù)向量之間的余弦距離衡量兩個(gè)特征之間的相似度,將**自動(dòng)聚類。另外根據(jù)詞的不同位置,權(quán)重應(yīng)該不同,比如標(biāo)題的詞權(quán)重明顯應(yīng)該大點(diǎn)。大數(shù)據(jù)量的余弦計(jì)算也要考慮很多簡化算法。
第十五章《矩陣運(yùn)算和文本處理中的兩個(gè)分類問題》:將大量的文本表示成文本和詞匯的矩陣,然后對(duì)該矩陣進(jìn)行奇異值SVD分解,可以得到隱含在其中的一些信息。計(jì)算余弦相似度的一次迭代時(shí)間和奇異值分解的時(shí)間復(fù)雜度在一個(gè)數(shù)量級(jí),但計(jì)算余弦相似度需要多次迭代。另外,奇異值分解的一個(gè)問題是存儲(chǔ)量大,而余弦定理的聚類則不需要。奇異值分解得到的結(jié)果略顯粗糙,實(shí)際工作中一般先進(jìn)行奇異值分解得到粗分類結(jié)果,在利用余弦計(jì)算得到比較精確地結(jié)果。我覺得這章講的SVD有些地方不是很清楚,已向吳軍老師請(qǐng)教了,等待回信。
第十六章《信息指紋及其應(yīng)用》:信息指紋可以作為信息的唯一標(biāo)識(shí)。有很多信息指紋的產(chǎn)生方法,互聯(lián)網(wǎng)加密要使用基于加密的偽隨機(jī)數(shù)產(chǎn)生器,常用的算法有MD5或者SHA-1等標(biāo)準(zhǔn)。信息指紋可以用來判定集合相同或基本相同。YouTobe就用信息指紋來反盜版。128位的指紋,1.8*10^19次才可能重復(fù)一次,所以重復(fù)的可能性幾乎為0。判定集合是否相同,從簡單的逐個(gè)比對(duì)到利用信息指紋,復(fù)雜度降低了很多很多。啟發(fā)我們有時(shí)候要用變通的思想來解決問題。
第十七章《由電視劇《**》所想到的——談?wù)劽艽a學(xué)的數(shù)學(xué)原理》:RSA加密算法,有兩個(gè)完全不同的鑰匙,一個(gè)用于加密,一個(gè)用于解密。該算法里面蘊(yùn)含著簡單但不好理解的數(shù)學(xué)思想。信息論在密碼設(shè)計(jì)中的應(yīng)用:當(dāng)密碼之間分布均勻并且統(tǒng)計(jì)**時(shí),提供的信息最少。均勻分布使得敵人無從統(tǒng)計(jì),而統(tǒng)計(jì)**能保證敵人即使知道了加密算法,也不能破譯另一段密碼。
第十八章《閃光的不一定是金子——談?wù)勊阉饕娣醋鞅讍栴}》:把搜索反作弊看成是通信模型,作弊當(dāng)做是加入的噪聲,解決噪聲的方法:從信息源出發(fā),增強(qiáng)排序算法的抗干擾能力;過濾掉噪聲,還原信息。只要噪聲不是完全隨機(jī)并且前后有相關(guān)性,就可以檢測到并消除。作弊者的方法不可能是隨機(jī)的,且不可能一天換一種方法,及作弊是時(shí)間相關(guān)的。因此在搜集一段時(shí)間的作弊信息后,就可以將作弊者抓出來,還原原有的排名。一般作弊都是針對(duì)市場份額較大的搜索引擎做的,因此,一個(gè)小的搜索引擎作弊少,并不一定是它的反作弊技術(shù)好,而是到它那里作弊的人少。
第十九章《談?wù)剶?shù)學(xué)模型的重要性》:早期的行星運(yùn)行模型用大圓套小圓的方法,精確地計(jì)算出了所有行星運(yùn)行的軌跡。但其實(shí)模型就是簡單的橢圓而已。一個(gè)正確的數(shù)學(xué)模型應(yīng)該在形式上是簡單的;一個(gè)正確的模型可能開始還不如一個(gè)精雕細(xì)琢過的錯(cuò)誤模型來的準(zhǔn)確,但是,如果我們認(rèn)定大方向是對(duì)的,就應(yīng)該堅(jiān)持下去;大量準(zhǔn)備的數(shù)據(jù)對(duì)研發(fā)很重要;正確的模型可能受到噪聲干擾,而顯得不準(zhǔn)確,這是不應(yīng)該用一種湊合的修正方法來彌補(bǔ)它,要找到噪聲的根源,這也許能通往重大的發(fā)現(xiàn)。
第二十章《不要把雞蛋放在一個(gè)籃子里——談?wù)勛畲箪啬P汀罚簩?duì)一個(gè)隨機(jī)事件預(yù)測時(shí),當(dāng)各種情況概率相等時(shí),信息熵達(dá)到最大,不確定性最大,預(yù)測的風(fēng)險(xiǎn)最小。最大熵模型的訓(xùn)練非常復(fù)雜,需要時(shí)查看資料做進(jìn)一步的理解。
第二十一章《拼音輸入法的數(shù)學(xué)原理》:輸入法經(jīng)歷了以自然音節(jié)編碼,到偏旁筆畫拆字輸入,再回歸自然音節(jié)輸入的過程。任何事物的發(fā)展,螺旋式的回歸不是簡單的重復(fù),而是一種升華。輸入法的速度取決于編碼的場地*尋找這個(gè)鍵的時(shí)間。傳統(tǒng)的雙拼,記住編碼太難,尋找每個(gè)鍵的時(shí)間太長,并且增加了編碼上的歧義。根據(jù)香農(nóng)第一定理可以計(jì)算理論上每個(gè)漢字的*均最短碼長。全拼不僅編碼*均長度較少,而且根據(jù)上下文的語言模型可以很好的解決歧義問題。利用統(tǒng)計(jì)語言模型可是實(shí)現(xiàn)拼音轉(zhuǎn)漢字的有效算法,而且可以轉(zhuǎn)換為動(dòng)態(tài)規(guī)劃求最短路徑問題。如今各家輸入法的效率基本在一個(gè)量級(jí),進(jìn)一步提升的關(guān)鍵就在于建立更好的語言模型?梢愿鶕(jù)每個(gè)用戶建立個(gè)性化的語言模型。輸入的過程本身就是人和計(jì)算機(jī)的通信,好的輸入法會(huì)自覺或者不自覺的的遵循通信的數(shù)學(xué)模型。要做出最有效的輸入法,應(yīng)該自覺使用信息論做指導(dǎo)。
第二十二章《自然語言處理的教父馬庫斯和他的優(yōu)秀弟子們》:將自然語言處理從基于規(guī)則到基于統(tǒng)計(jì),貢獻(xiàn)最大的兩個(gè)人,一個(gè)是前面介紹的賈里尼克教授,他是一個(gè)開創(chuàng)性任務(wù);另一個(gè)是將這個(gè)方法發(fā)揚(yáng)光大的米奇·馬庫斯。馬庫斯的貢獻(xiàn)在于建立了造福全世界研究者的賓夕法尼亞大學(xué)LDC語料庫以及他的眾多優(yōu)秀弟子。馬庫斯的影響力很大程度上是靠他的弟子傳播出去的。馬庫斯教授有很多值得欽佩的地方:給予他的博士研究生自己感興趣的課題的**,高屋建瓴,給學(xué)生關(guān)鍵的指導(dǎo);寬松的管理方式,培養(yǎng)各有特點(diǎn)的年輕學(xué)者;是一個(gè)有著遠(yuǎn)見卓識(shí)的管理者。他的學(xué)生為人做事風(fēng)格迥異,但都年輕有為,例如追求完美的邁克爾·柯林斯和尋求簡單美的艾克爾·*。大師之所以能成為大師,肯定有著一些優(yōu)秀的品質(zhì)和追求。
第***章《布隆過濾器》:判斷一個(gè)元素是否在一個(gè)集合當(dāng)中時(shí),用到了布隆過濾器,存儲(chǔ)量小而且計(jì)算快速。其原理是:建立一個(gè)很長的二進(jìn)制,將每個(gè)元素通過隨機(jī)數(shù)產(chǎn)生器產(chǎn)生一些信息指紋,再將這些信息指紋映射到一些自然數(shù)上,最后在建立的那個(gè)很長的二進(jìn)制上把這些自然數(shù)的位置都置為1。布隆過濾器的不足之處是它可能把不在集合中的元素錯(cuò)判成集合中的元素,但在某些條件下這個(gè)概率是很小的,補(bǔ)救措施是可以建立一個(gè)小的白名單,存儲(chǔ)那些可能誤判的元素。布隆過濾器背后的數(shù)學(xué)原理在于完全隨機(jī)的數(shù)字其沖突的可能性很小,可以用很少的空間存儲(chǔ)大量的信息,并且由于只進(jìn)行簡單的算術(shù)運(yùn)算,因此速度非?!毒幊讨榄^》中第一章的那個(gè)例子就是布隆過濾器的思想。開闊思維,尋找更好更簡單的方法。
第***章《馬爾科夫鏈的擴(kuò)展——貝葉斯網(wǎng)絡(luò)》:貝葉斯網(wǎng)絡(luò)是馬爾科夫鏈的擴(kuò)展,由簡單的線性鏈?zhǔn)疥P(guān)系擴(kuò)展為網(wǎng)絡(luò)的關(guān)系,但貝葉斯網(wǎng)絡(luò)仍然假設(shè)每一個(gè)狀態(tài)只與它直接相連的狀態(tài)相關(guān)。確定貝葉斯網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu)和各個(gè)狀態(tài)之間相關(guān)的概率也需要訓(xùn)練。在詞分類中,可以建立文章、主題和關(guān)鍵詞的貝葉斯網(wǎng)絡(luò),用來得到詞的分類。貝葉斯網(wǎng)絡(luò)的訓(xùn)練包括確定拓?fù)浣Y(jié)構(gòu)和轉(zhuǎn)移概率,比較復(fù)雜,后者可以參考最大熵訓(xùn)練的方法。貝葉斯網(wǎng)絡(luò)導(dǎo)出的模型是非常復(fù)雜的。
第二十五章《條件隨機(jī)場和句法分析》:句法分析是分析出一個(gè)句子的句子結(jié)構(gòu),對(duì)于不規(guī)則的句子,對(duì)其進(jìn)行深入的分析是很復(fù)雜的,而淺層的句法分析在很多時(shí)候已經(jīng)可以滿足要求了。條件隨機(jī)場就是進(jìn)行淺層句法分析的有效的數(shù)學(xué)模型。條件隨機(jī)場與貝葉斯網(wǎng)絡(luò)很像,不用之處在于,條件隨機(jī)場是無向圖,而貝葉斯網(wǎng)絡(luò)是有向圖。條件隨機(jī)場的訓(xùn)練很復(fù)雜,簡化之后可以參考最大熵訓(xùn)練的方法。對(duì)于條件隨機(jī)場的詳細(xì)參數(shù)及原理還不理解。
第二十六章《維特比和他的維特比算法》:維特比算法是一個(gè)動(dòng)態(tài)規(guī)劃算法,凡是使用隱馬爾科夫模型描述的問題都可以用它來解碼。維特比算法采用逐步漸進(jìn)的方法,計(jì)算到每步的最短距離,到下步的最短距離只用接著本步的計(jì)算即可,相比窮舉法,**縮短了計(jì)算的時(shí)間,并且基本可以實(shí)現(xiàn)實(shí)時(shí)的輸出,這看似簡單,但在當(dāng)時(shí)確是很了不起的.。維特比并不滿足停留在算法本身,他將算法推廣出去,并應(yīng)用到了實(shí)際中,創(chuàng)立了高通公司,成為了世界上第二富有的數(shù)學(xué)家。高通公司在第二代移動(dòng)通信中并不占很強(qiáng)的市場地位,而其利用CDMA技術(shù)霸占了3G的市場,可見遠(yuǎn)見的洞察力是多么的重要。
第二十七章《再談文本分類問題——期望最大化算法》:該章講的其實(shí)就是K均值聚類問題,設(shè)置原始聚類中心,然后不斷迭代,直至收斂,將每個(gè)點(diǎn)分到一個(gè)類中。其實(shí)隱馬爾科夫模型的訓(xùn)練和最大熵的訓(xùn)練都是期望最大化算法(EM)。首先,根據(jù)現(xiàn)有的模型,計(jì)算各個(gè)觀測數(shù)據(jù)輸入到模型中的計(jì)算結(jié)果,這個(gè)過程稱為期望值計(jì)算過程,或E過程;接下來,重新計(jì)算模型參數(shù),以最大化期望值,這個(gè)過程稱為最大化的過程,或M過程。優(yōu)化的目標(biāo)函數(shù)如果是個(gè)凸函數(shù),則一定有全局最優(yōu)解,若不是凸函數(shù),則可能找到的是局部最優(yōu)解。在以后的一些問題求解過程中,應(yīng)該考慮其是否是EM問題,也可以考慮參考這種思想,不斷迭代以優(yōu)化目標(biāo)的過程。
第二十八章《邏輯回歸和搜索廣告》:雅虎和百度的競價(jià)排名廣告并不比谷歌的根據(jù)廣告的預(yù)估點(diǎn)擊率來客觀的推送廣告收入多。點(diǎn)擊預(yù)估率有很多影響因素,一種有效的方法是邏輯回歸模型,邏輯回歸模型是一種將影響概率的不同因素結(jié)合在一起的指數(shù)模型。其訓(xùn)練方法和最大熵模型相似。同樣不是很理解其具體內(nèi)涵。
第二十九章《各個(gè)擊破和Google云計(jì)算的基礎(chǔ)》:分而治之,各個(gè)擊破是一個(gè)很好的方法,Google開發(fā)的MapReduce算法就應(yīng)用了該方法。將一個(gè)大任務(wù)分成幾個(gè)小任務(wù),這個(gè)過程叫Map,將小任務(wù)的結(jié)果合并成最終結(jié)果,這個(gè)過程叫Reduce,該過程如何調(diào)度、協(xié)調(diào)就是工程上比較復(fù)雜的事情了?梢姶罅坑玫降、真正有用的方法往往簡單而又樸實(shí)。
附錄《計(jì)算復(fù)雜度》:計(jì)算機(jī)中復(fù)雜度是以O(shè)()來表示的,如果一個(gè)算法的計(jì)算量不超過N的多項(xiàng)式函數(shù),則稱算法為多項(xiàng)式函數(shù)復(fù)雜度的(P問題),是可以計(jì)算的。若比N的多項(xiàng)式函數(shù)還高,則是非多項(xiàng)式問題,實(shí)際上是不可計(jì)算的。非多項(xiàng)式問題中一種非確定的多項(xiàng)式問題(簡稱NP),是科學(xué)家研究的焦點(diǎn),因?yàn)楝F(xiàn)實(shí)中好多問題都是NP問題。另外還有NP-Complete問題(NP問題可以在多項(xiàng)式時(shí)間內(nèi)規(guī)約到該問題)和NP-Hard問題,對(duì)于這兩種問題,需要簡化找到近似解。
整體上,《數(shù)學(xué)之美》這本書讓我了解了很多文本處理,數(shù)據(jù)挖掘相關(guān)的知識(shí),學(xué)到了很多。其中,簡單美以及一些科學(xué)家的大師風(fēng)范讓我印象深刻!書中提到的一些思想(即道)讓我受益匪淺!
《數(shù)學(xué)之美》讀書筆記9
最近看了這本《數(shù)學(xué)之美》,不得不感嘆一句,可惜早已身不在起點(diǎn)。
我讀書的時(shí)候,數(shù)學(xué)成績一直都很好,雖然離開學(xué)校已經(jīng)10多年,自覺當(dāng)初的知識(shí)還是記得很多,6~7年前再考線性代數(shù)和概率論,還是得到了很高的分?jǐn)?shù)。不過我也和大部分人一樣,覺得數(shù)學(xué)沒有太多用處,特別是高中和大學(xué)里面學(xué)的,那些三角函數(shù),向量,大數(shù)定律,解析幾何,除了在考試的題目里面用一下,*時(shí)又有什么地方可以用呢?
看了《數(shù)學(xué)之美》,驚嘆于數(shù)學(xué)的浩瀚和簡單,說它浩瀚,是因?yàn)樗姆种Шw了科學(xué)的方方面面,是所有科學(xué)的理論基礎(chǔ),說它簡單,無論多復(fù)雜的問題,最后總結(jié)的數(shù)學(xué)公式都簡單到只有區(qū)區(qū)幾個(gè)符號(hào)和字母。
這本書介紹數(shù)學(xué)理論在互聯(lián)網(wǎng)上的運(yùn)用,*時(shí)我們?cè)谑褂没ヂ?lián)網(wǎng)搜索或者翻譯功能的時(shí)候,時(shí)常會(huì)感嘆電腦對(duì)自己的了解和它的聰明,其實(shí)背后的原理就是一個(gè)個(gè)精美的算法和大量數(shù)據(jù)的訓(xùn)練。那些或者熟悉或者陌生的數(shù)學(xué)知識(shí)(聯(lián)合概率分布,維特比算法,期望最大化,貝葉斯網(wǎng)絡(luò),隱形馬爾可夫鏈,余弦定律,etc),一步步構(gòu)建了我們現(xiàn)在所賴以生存的網(wǎng)上世界。
之所以覺得自己早已身不在起點(diǎn),是因?yàn)樯厦孢@些數(shù)學(xué)知識(shí),早已經(jīng)不在我的知識(shí)框架之內(nèi),就算曾經(jīng)學(xué)過,也不過是囫圇吞棗一樣的強(qiáng)記硬背,沒有領(lǐng)會(huì)過其中的真正意義。而今天想重頭在來學(xué)一次,其實(shí)已經(jīng)不可能了。且不說要花費(fèi)多少的精力和時(shí)間,還需要的是領(lǐng)悟力。而這一些,已經(jīng)不是我可以簡單付出的。
不像物理、化學(xué)需要復(fù)雜的實(shí)驗(yàn)來驗(yàn)證,很多數(shù)學(xué)的證明,幾乎只要有一顆聰明的頭腦和無數(shù)的草稿紙,可是光是這顆聰明的頭腦,就可以阻攔掉很多人。有人說多讀書就會(huì)聰明,我不否認(rèn),書本的確會(huì)提供很多知識(shí),可是不同的人讀同一本書也會(huì)有不同的收貨,這就限制于每個(gè)人的知識(shí)框架和認(rèn)知水*。就如一個(gè)數(shù)學(xué)功底好過我的人,看這本書,就會(huì)更容易理解里面的公式和推導(dǎo)出這些公式的其他運(yùn)用點(diǎn),而我,只能站在數(shù)學(xué)的門口,感嘆一句,它真的好美吧。
當(dāng)然,我暫時(shí)無法在實(shí)際生活中運(yùn)用這些數(shù)學(xué)公式,可是書中提到的一些方法論,還是很有幫助的
1)一個(gè)產(chǎn)業(yè)的顛覆或者創(chuàng)新,大部分來自于外部的力量,比如用統(tǒng)計(jì)學(xué)原理做自然語言處理。
2)基礎(chǔ)知識(shí)和基礎(chǔ)數(shù)據(jù)是很重要性,只有足夠多和足夠廣的數(shù)據(jù),才可以提供有效的分析,和驗(yàn)證分析方法的好壞。
3)先幫用戶解決80%的問題,在慢慢解決剩下的20%的問題;
4)不要等一個(gè)東西完美了,才發(fā)布;
5)簡單是美,堅(jiān)持選擇簡單的做法,這樣會(huì)容易解釋每一個(gè)步驟和方法背后的道理,也便于查錯(cuò)。
6)正確的模型也可能受噪音干擾,而顯得不準(zhǔn)確;這時(shí)不應(yīng)該用一種湊合的修正方法加以彌補(bǔ),而是要找到噪音的根源,從根本上修正它。
7)一個(gè)人想要在自己的領(lǐng)域做到世界一流,他的周圍必須有非常多的一流人物。
《數(shù)學(xué)之美》讀書筆記10
很多人都覺得,數(shù)學(xué)是一個(gè)太高深、太理論的學(xué)科,不接近生活,對(duì)我們大多數(shù)人來說*時(shí)也根本用不到,所以沒必要去理解數(shù)學(xué)。但事情真的是這樣嗎?
其實(shí)不然,數(shù)學(xué)一直滲透在我們生活的各個(gè)方面,尤其是在今天這個(gè)信息時(shí)代,很多簡單樸素的數(shù)學(xué)思想,能發(fā)揮一般人很難想象的巨大作用。比如,計(jì)算機(jī)處理自然語言,用到的最重要工具是統(tǒng)計(jì)學(xué)的思想;計(jì)算機(jī)對(duì)**內(nèi)容的分類,依靠的是數(shù)學(xué)里的余弦定理;而電子電路的基本邏輯,則來源于僅有0和1兩個(gè)數(shù)字的布爾代數(shù)。
在《數(shù)學(xué)之美》里,吳軍用自己在工作中使用數(shù)學(xué)的親身經(jīng)歷,為我們展現(xiàn)了數(shù)學(xué)的重要性,以及他對(duì)數(shù)學(xué)之美的理解。吳軍是“得到”App專欄《吳軍的谷歌方法論》的主理人。曾先后供職于谷歌和騰訊,是著名的自然語言處理專家和搜索專家。同時(shí),他還是位暢銷書作家,除了這本《數(shù)學(xué)之美》以外,還寫過《文明之光》《智能時(shí)代》《浪潮之巔》等多本暢銷書。
朱光潛《談美書簡》讀書筆記10篇(擴(kuò)展6)
——最新的談生命讀書筆記
最新的談生命讀書筆記1
冰心用清新、明麗的筆調(diào)寫了談生命一問,此文用形象的比喻闡述了人的生命歷程,除了給讀者語言美的享受之外,哲理性的語言還給讀者生命上的`啟迪。
其中最讓我百讀不厭的句子是:“不是每一道江流都能入海,不流動(dòng)的便成了死湖;不是每一粒種子都能成樹,不生長的便成了空殼!生命中不是永遠(yuǎn)快樂,也不是永遠(yuǎn)痛苦,快樂和痛苦是相生相成的。等于水道要經(jīng)過不同的*,樹木要經(jīng)過常變的四時(shí)。在快樂中我們?cè)诟兄x生命,在痛苦中我們要感謝生命。快樂固然興奮,痛苦又何嘗不美麗?我曾讀到一個(gè)警句,是”愿你生命中有夠多的云翳,來造成一個(gè)美麗的黃昏“。
世界、國家和個(gè)人的生命中的云翳沒有比今天再多的了!蔽页3T谧x之后,內(nèi)心對(duì)生命的認(rèn)識(shí)仿佛又打開了一扇門,是啊!生命的歷程是曲折的,它伴隨著快樂和痛苦,雖然我們都不愿意生命中有痛苦,但少了他,我們的生命色調(diào)太單一,我們的人生就失去了完美,因此重要的是我們?nèi)绾稳ッ鎸?duì)快樂和痛苦。
我們會(huì)享受生命中的快樂,也要學(xué)會(huì)面對(duì)生命中的痛苦,痛苦中的傷心、流淚都是沒用的,因此,一次痛苦的經(jīng)歷我們要從中感悟生命,學(xué)會(huì)在逆境中生存,向著目的執(zhí)著的拼搏!
版權(quán)聲明:本文內(nèi)容由互聯(lián)網(wǎng)用戶自發(fā)貢獻(xiàn),該文觀點(diǎn)僅代表作者本人。本站僅提供信息存儲(chǔ)空間服務(wù),不擁有所有權(quán),不承擔(dān)相關(guān)法律責(zé)任。如發(fā)現(xiàn)本站有涉嫌抄襲侵權(quán)/違法違規(guī)的內(nèi)容, 請(qǐng)發(fā)送郵件至 yyfangchan@163.com (舉報(bào)時(shí)請(qǐng)帶上具體的網(wǎng)址) 舉報(bào),一經(jīng)查實(shí),本站將立刻刪除