雙十一、不如買一本書吧
我的第一本書出版了:《人工智能數(shù)學(xué)基礎(chǔ)與Python機(jī)器學(xué)習(xí)實(shí)戰(zhàn)》。

內(nèi)容簡(jiǎn)介
通常來說,人工智能(Artificial Intelligence,AI)是研究、開發(fā)用于模擬、延伸和擴(kuò)展人的智能的理論、方法、技術(shù)及應(yīng)用系統(tǒng)的一門新的技術(shù)科學(xué)。人工智能的研究領(lǐng)域包括機(jī)器人、語音識(shí)別、圖像識(shí)別、自然語言處理和專家系統(tǒng)等。
機(jī)器學(xué)習(xí)就是用算法解析數(shù)據(jù),不斷學(xué)習(xí),對(duì)世界中發(fā)生的事做出判斷和預(yù)測(cè)的一項(xiàng)技術(shù)。生活中很多機(jī)器學(xué)習(xí)的書籍只注重算法理論方法,并沒有注重算法的落地。本書是初學(xué)者非常期待的入門書,書中有很多的示例可以幫助初學(xué)者快速上手。
本書包括3個(gè)部分:
第1部分介紹基本的數(shù)學(xué)工具和機(jī)器學(xué)習(xí)的概念;
第2部分系統(tǒng)深入地講解現(xiàn)今已成熟的機(jī)器學(xué)習(xí)方法和技術(shù);
第3部分介紹了SparkSpark機(jī)器學(xué)習(xí)
本書適合各類讀者閱讀,包括相關(guān)專業(yè)的大學(xué)生或研究生,以及不具有機(jī)器學(xué)習(xí)或統(tǒng)計(jì)背景、但是想要快速補(bǔ)充深度學(xué)習(xí)知識(shí),以便在實(shí)際產(chǎn)品或平臺(tái)中應(yīng)用的軟件工程師。

本書特色
有些讀者在學(xué)習(xí)時(shí)會(huì)有這樣一種感覺:一門課學(xué)完了、考試過了,卻不知道學(xué)了有什么用,尤其是數(shù)學(xué)類的課程。這是因?yàn)閭鹘y(tǒng)教材大多數(shù)是按照“定義—例題—計(jì)算”的步驟來大篇幅羅列數(shù)學(xué)概念,偏重理論定義和運(yùn)算技巧,不注重梳理學(xué)科內(nèi)在的邏輯脈絡(luò),更沒能深刻挖掘出本學(xué)科與當(dāng)下前沿技術(shù)的交匯點(diǎn)。因此,本書采用了很多的案例和代碼,不局限于算法本身,更注重于實(shí)踐方面。
本書具有以下特點(diǎn):。
脈絡(luò)清晰:數(shù)學(xué)基礎(chǔ)、算法詳解和持續(xù)探索。
系統(tǒng)全面:網(wǎng)羅監(jiān)督學(xué)習(xí)回歸、監(jiān)督學(xué)習(xí)分類、無監(jiān)督學(xué)習(xí)、半監(jiān)督學(xué)習(xí)等機(jī)器學(xué)習(xí)算法。
注重實(shí)戰(zhàn):使用Python進(jìn)行機(jī)器學(xué)習(xí)的項(xiàng)目實(shí)戰(zhàn),使用sklearn實(shí)現(xiàn)算法模型的搭建。
緊跟發(fā)展:不局限于Python中的sklearn的學(xué)習(xí),還緊跟大數(shù)據(jù)時(shí)代的發(fā)展。
知識(shí)范圍廣:本書的知識(shí)廣度比較大,涉及了高等數(shù)學(xué)、線性代數(shù)、概率論、數(shù)據(jù)處理和機(jī)器學(xué)習(xí)算法等方面。
具體大綱
下面是本書的具體具體大綱
第一章:走進(jìn)機(jī)器學(xué)習(xí)的世界
1.1 機(jī)器學(xué)習(xí)概述 1.1.1 什么是機(jī)器學(xué)習(xí) 1.1.2 機(jī)器學(xué)習(xí)的分類 1.2 Python編程語言 1.2.1 Python環(huán)境搭建 1.2.2 機(jī)器學(xué)習(xí)相關(guān)軟件包介紹 1.3 機(jī)器學(xué)習(xí)的數(shù)學(xué)知識(shí) 1.3.1 導(dǎo)數(shù) 1.3.2 基本函數(shù)的求導(dǎo)公式 1.3.3 求導(dǎo)法則 1.3.4 Python實(shí)現(xiàn)求導(dǎo) 1.3.5 泰勒展開式 1.3.6 微積分基本定理 1.3.7 基本函數(shù)的積分公式 1.3.8 Python實(shí)現(xiàn)積分
第二章:人工智能數(shù)學(xué)基礎(chǔ)
2.1 線性代數(shù) 2.1.1 向量及其線性運(yùn)算 2.1.2 矩陣及其線性運(yùn)算 2.2 隨機(jī)變量 2.2.1 離散型隨機(jī)變量 2.2.2 連續(xù)型隨機(jī)變量 2.3 隨機(jī)變量概率分布 2.3.1 伯努利分布 2.3.2 泊松分布 2.3.3 指數(shù)分布 2.3.4 二項(xiàng)分布 2.3.5 正態(tài)分布 2.3.6 伽馬分布 2.3.7 貝塔分布 2.3.8 卡方分布 2.3.9 t分布 2.3.10 F分布
第三章:數(shù)據(jù)獲取和預(yù)處理
3.1 數(shù)據(jù)獲取 3.1.1 自帶和下載數(shù)據(jù)集 3.1.2 創(chuàng)建數(shù)據(jù)集 3.1.3數(shù)據(jù)集 3.2 標(biāo)準(zhǔn)化 3.2.1 z-score標(biāo)準(zhǔn)化 3.2.2 Min-max標(biāo)準(zhǔn)化 3.3二值化 3.3.1 特征二值化 3.3.2 標(biāo)簽二值化 3.4 特征處理 3.4.1 獨(dú)熱編碼 3.4.2 多項(xiàng)式特征 3.4.3 PCA降維 3.5 數(shù)據(jù)消洗 3.5.1 Pandas數(shù)據(jù)消洗 3.5.2 sklearn處理缺失值 3.6 文本特征提取 3.6.1 字典提取器 3.6.2 詞袋模型 3.6.3 權(quán)重向量 3.7 圖像特征提取 3.7.1 提取像素矩陣 3.7.2 提取角點(diǎn) 3.7.3 提取輪廓 3.7.4 提取局部特征點(diǎn) 3.8 特征選擇 3.8.1 Filter過濾去 3.8.2 Wrapper包裝法 3.8.3 Embedded嵌入法
第4章:線性回歸和邏輯回歸
4.1 線性回歸 4.1.1 最小二乘法 4.1.2 梯度下降法 4.1.3 線性回歸實(shí)現(xiàn) 4.1.4 Lasso回歸和嶺回歸 4.1.5 回歸模型評(píng)估 4.1.6 多項(xiàng)式回歸 4.2 邏輯回歸 4.2.1 邏輯回歸算法 4.2.2 邏輯回歸實(shí)現(xiàn) 4.2.3 分類模型評(píng)估
第5章 KNN和貝葉斯分類算法
5.1 KNN算法 5.1.1 KNN算法的距離度量 5.1.2 KNN算法的代碼實(shí)現(xiàn) 5.1.3 交叉驗(yàn)證 5.1.4 KD樹 5.2 貝葉斯分類算法 5.2.1 貝葉斯定理 5.2.2 高斯樸素貝葉斯 5.2.3 多項(xiàng)式樸素貝葉斯 5.2.4 伯努利樸素貝葉斯
第6章 決策樹和隨機(jī)森林
6.1 決策樹 6.1.1 熵 6.1.2 決策樹算法 6.1.3 剪枝算法 6.2 決策樹代碼實(shí)現(xiàn) 6.2.1 可視化決策樹 6.2.2 分類樹 6.2.3 回歸樹 6.3 隨機(jī)森林 6.3.1 集成學(xué)習(xí)算法 6.3.2 隨機(jī)森林分類 6.3.3 隨機(jī)森林回歸
第7章 支持向量機(jī)
7.1 SVM核心概念 7.1.1 線性可分 7.1.2 核函數(shù) 7.1.3 剪枝算法 7.2 SVM代碼實(shí)現(xiàn) 7.2.1 SVC 7.2.2 SVM人臉識(shí)別 7.2.3 SVR
第8章 聚類算法
8.1 K-means聚類算法 8.1.1 K- means聚類算法原理 8.1.2 模型評(píng)估 8.1.3 圖像處理 8.1.4 K-means聚類算法實(shí)例 8.2.1 層次聚類算法原理 8.2.2 層次聚類算法實(shí)例 層次聚類算法 8.3 密度聚類算法 8.3.1 密度聚類算法原理 8.3.2 密度聚類算法實(shí)例
第9章 EM和HMM聚類算法
9.1 EM聚類算法 9.1.1 最大似然估計(jì) 9.1.2 詹森不等式 9.1.3 EM算法原理 9.2 EM算法代碼實(shí)現(xiàn) 9.3 HMM聚類算法 9.3.1 馬爾可夫過程 9.3.2 隱馬爾可夫模型
第10章 主題模型
10.1 LDA主題模型 10.1.1 Dirichlet分布 10.1.2 LDA貝葉斯模型 10.2 自然語言處理常用工具包 10.2.1 NLTK 10.2.2 spacy 10.2.3 Gensim 10.2.4 jieba 10.2.5 Stanford nlp 10.2.6 Fuzzywuzzy 10.2.7 Hanlp 10.3 LDA主題模型實(shí)例
第11章 推薦算法
11.1關(guān)聯(lián)規(guī)則 11.1.1 置信度 11.1.2 支持度 11.1.3 提升度 11.1.4 代碼實(shí)現(xiàn) 11.2 基于用戶行為的推薦算法 11.2.1 矩陣分解 11.2.2 SVD代碼實(shí)現(xiàn) 11.3 基于評(píng)分的推薦算法 11.3.1 Slope One算法 11.3.2 Slopeonef代碼實(shí)現(xiàn) 11.4 協(xié)同過濾
第12章 數(shù)據(jù)建模
12.1 監(jiān)督學(xué)習(xí) 12.1.1 監(jiān)督學(xué)習(xí)回歸 12.1.2 監(jiān)督學(xué)習(xí)分類 12.2 半監(jiān)督學(xué)習(xí) 12.2.1 標(biāo)簽傳播算法 12.2.2 半監(jiān)督學(xué)習(xí)分類 11.3 保存模型 12.3.1 pickle 12.3.2 joblib 12.3.3 sklearn2pmml 第12章 數(shù)據(jù)建模 12.1 監(jiān)督學(xué)習(xí) 12.1.1 監(jiān)督學(xué)習(xí)回歸 12.1.2 監(jiān)督學(xué)習(xí)分類 12.2 半監(jiān)督學(xué)習(xí) 12.2.1 標(biāo)簽傳播算法 12.2.2 半監(jiān)督學(xué)習(xí)分類 12.3 保存模型 12.3.1 pickle 12.3.2 joblib 12.3.3 sklearn2pmml
第13章 Spark機(jī)器學(xué)習(xí)
13.1 Spak分布式集群搭建 13.1.1 創(chuàng)建Centos7虛擬機(jī) 13.1.2 設(shè)置靜態(tài)ip 13.1.3 配置SSH服務(wù) 13.1.4 安裝Java 13.1.5 搭建三臺(tái)Centos7主機(jī) 13.1.6 修改hosts文件 13.1.7 ?配置SSH免密碼登錄 13.1.8 搭建Hadoop集群 13.1.9 搭建Zookeeper集群 13.1.10 啟動(dòng)Hadoop和Zookeeper集群 13.1.11 搭建Spark集群 13.2 Hadoop和Spark的基礎(chǔ)知識(shí) 13.2.1 HDFS 13.2.2 Spark Shell 13.2.3 RDD編程 13.2.4 Spark SQL 13.3 Spark mllib 13.3.1 回歸模型 13.3.2 分類模型
筆者感觸
筆者:劉潤(rùn)森,熟悉PyTorch、TensorFlow等深度學(xué)習(xí)框架,對(duì)計(jì)算機(jī)視覺、機(jī)器學(xué)習(xí)和深度學(xué)習(xí)有深入研究
筆者最早從大一下學(xué)期開始接續(xù)學(xué)習(xí)機(jī)器學(xué)習(xí),也曾在 CSDN 中分享一些相關(guān)機(jī)器學(xué)習(xí)的教程和其他IT領(lǐng)域的學(xué)習(xí)筆記,因此有出版社的朋友找到筆者,希望可以將這些內(nèi)容整理成書,于是就有 了這本書。
對(duì)筆者而言,本書也是對(duì)自己學(xué)習(xí)成果的總結(jié)。大家千萬不要認(rèn)為學(xué)習(xí)機(jī)器學(xué)習(xí)就是調(diào)包,而忽視了里面數(shù)學(xué)的美,也不要過于在意里面的復(fù)雜算法。就國(guó)內(nèi)而言,除少數(shù)公司的少數(shù)機(jī)器學(xué)習(xí)部門是推公式、做理論優(yōu)化外,大部分機(jī)器學(xué)習(xí)崗位都是在用成熟的工具做開發(fā)、搞特征、調(diào)模型、上線產(chǎn)品。
例如,阿里云機(jī)器學(xué)習(xí)PAI平臺(tái),封裝了上百種算法,提供了完整的機(jī)器學(xué)習(xí)鏈路,重點(diǎn)是具有可視化操作界面,通過拖曳操作,進(jìn)行少量配置,即可完成業(yè)務(wù)處理。這里提醒一句,數(shù)學(xué)對(duì)于機(jī)器學(xué)習(xí)來說也是非常重要的。同時(shí),數(shù)據(jù)分析也很重要,這里包括對(duì)數(shù)據(jù)的理解、對(duì)統(tǒng)計(jì)學(xué)的認(rèn)知等,可以說,一個(gè)好的機(jī)器學(xué)習(xí)算法工程師也一定是一個(gè)好的數(shù)據(jù)分析師。
購買鏈接
下面是這本書在京東上的購買鏈接,淘寶天貓等購物平臺(tái)均有銷售,喜歡就看看,不喜歡靜靜走開即可。

更多的詳情,點(diǎn)擊閱讀原文查看
