推荐一下吴军博士的《数学之美》

2016/11/12

近来无心复习,乱翻闲书,吴军博士的这本《数学之美》网上评价甚高,去图书馆借来,读后大呼过瘾,改变自己不少观点,特地购买一本收藏,并撰文荐之。

cover

(封面图片来自当当网)

作者吴军博士,清华大学本科毕业后,进入约翰·霍普金斯大学 CLSP 实验室攻读博士学位,师从著名的自然语言处理专家弗里德里克·贾里尼克博士,毕业后加入 Google,主持设计了 Google 的搜索反作弊系统,也是 Google 中日韩文搜索算法的主要设计者。 本书主要讲述数学理论与模型在计算机科学领域的应用,作者凭借他在自然语言处理和搜索技术等方面的造诣,指出许多看似复杂的现实问题背后简洁清晰的数学模型,特别适合我这个身在数学学院、一心想学计算机的人,个人以为,数学专业的、计算机专业的甚至非相关专业的,都可以读一读此书。

说来惭愧,作为一个数学专业的学生,虽然对学科的知识结构有粗略的认识,但一直没有了解过学习它们的用处(能从推导数学公式中获得快感的学神请无视),以为不过是玩一些“这也要证?”、“这也能证?”推理游戏罢了,甚至一度认为,对于计算机的很多领域来说,除了部分线性代数和离散数学知识,其他内容充其量作为一个思维训练罢了。因此,在学习计算机时,我知道每一块理论在知识架构中的位置和应用,因此会千方百计(软院专业课/MOOC/经典教材等等)把它们学好,而本专业的课程,大抵就是以混过考试为目标了。做个没有数据支持的猜测,其实很多学生,不论大学是否是数学专业,从小学学到大学的数学,仅仅是用来应付考试而不是一件有用的工具,作者在书中也坦诚,当年他读本科时同样不知那些数学课程有何意义,不得不说是一件很悲哀的事。

而他的这本《数学之美》,却让我有幸在大二时就对自己学习的专业知识的应用有了粗浅的认识,书中具体而又生动地诠释了数学在计算机科学领域的巨大影响,其中不少模型,我这个大二本科生都已经耳熟能详。上世纪70年代,基于文法规则进行的自然语言分析走入了死胡同,相反基于统计学模型的方法,却后来居上,而这个统计学模型,其实质就是条件概率公式的应用而已。同样,基于隐含马尔克夫模型解决了很多通信解码和自然语言处理问题、基于矩阵运算和余弦定理完成了文本的相关性分析、基于费马小定理设计了RSA密码系统(谨此纪念周一数论考试)、基于最大熵模型解决了句法分析机器翻译等问题······很多看上去无从下手或是极其复杂的现实问题,被吴军博士抽象成数学模型后,就变得十分简单明了了。在被一大堆公式定理证明淹没的日常学习中,不妨跳到高处看一看,能让苦逼的生活有趣不少,比如我在期中复习之余读读此书,就极大减缓了扔掉让我一脸茫然的数分数论常微分概率论课本的进程。

值得数学系学生注意的是,书中的许多数学模型并没有给出严格的、充满学院派风格的理论证明,我想跟它作为一本通俗读物的定位有关,不过书中给出的关于这些公式的说明,大多数足以说服我了,个人以为,在数学研究之外的实际应用中,一些公式和定理的解释,只要能让自己和别人信服,也就足够了。如果阅读过程中实在懒得推敲这些理论,也不妨跳过那些说明,同样可以领略“数学之美”。

Jelinek

(弗里德里克·贾里尼克博士)

此书还有一个值得称道的地方,就是书中花了不少篇幅讲述了计算机科学领域的前辈们的故事,不同于其他人维基百科式的描述,作者把自己与他们在工作、研究中的实际接触和他们的成就结合在一起书写,让我看到的是一个个活生生的人,而非一群只能膜拜无法却窥得一二的神。弗里德里克·贾里尼克博士、阿米特·辛格博士、马库斯、布莱尔、柯林斯等一个个熠熠生辉的名字,作者把他们的求学的生涯、研究时的轶事、在学术界或工业界的成就娓娓道来,让人不时赞叹他们的一些解决方法的精妙,也展示了研究问题、改进解决方案的乐趣。毫不夸张地说,本书让我第一次有了读几年 Phd,混几年实验室的想法(以及“凡今谁是出群雄”的谜之自信)。

读完此书,推的了公式,证的了定理,解的了方程,建的了模型,写的了代码,成了我这个数学学院的计算机鱼的最大心愿, 可惜啊,这些任务并不能拆分成一堆不相关子任务,丢给一群(小)大金鱼去并行计算。熬过还剩一周的期中考试,还有这么多有趣的东西等着本鱼单进程单线程地去学习。

Post Directory