一、培訓(xùn)簡(jiǎn)述
課程中通過細(xì)致講解,使學(xué)員掌握該技術(shù)的本質(zhì)。具體收益包括:
1.掌握NLP基礎(chǔ)
2.關(guān)鍵詞提取與文本分類方法
3.文本向量化與句法分析方法
4.NLP與深度學(xué)習(xí)技術(shù)的相應(yīng)算法
5.掌握?qǐng)D像識(shí)別技術(shù)
二、培訓(xùn)特色
本次培訓(xùn)從實(shí)戰(zhàn)的角度對(duì)自然語言處理(NLP)進(jìn)行了全面的剖析,并結(jié)合實(shí)際案例分析和探討NLP的應(yīng)用場(chǎng)景,給NLP相關(guān)從業(yè)人員以指導(dǎo)和啟迪。
三、培訓(xùn)時(shí)長(zhǎng)
共計(jì)3天,每天6課時(shí)
四、培訓(xùn)大綱
單元 |
培訓(xùn)模塊 |
培訓(xùn)內(nèi)容 |
第一單元 |
NLP入門與基礎(chǔ)介紹(一) |
- NLP的基本概念
- NLP的發(fā)展歷程
- NLP主要研究方向
- 句法語義分析
- 信息抽取
- 文本挖掘
- 機(jī)器翻譯
- 信息檢索
- 問答系統(tǒng)
- 對(duì)話系統(tǒng)
|
第二單元 |
NLP入門與基礎(chǔ)介紹(二) |
- NLP的基礎(chǔ)
- 分詞
- 正向最大匹配算法
- 逆向最大匹配算法
- 雙向最大匹配算法
- 基于N-gram語言模型的分詞
- 基于HMM的分詞方法
- 基于CRF的分詞法法
- 文本基本處理
- 文本提取
- 正在表達(dá)式
- 本文統(tǒng)計(jì)
- 詞性標(biāo)注
- 基于最大熵的詞性標(biāo)注
- 基于統(tǒng)計(jì)最大概率輸出詞性
- 基于HMM詞性標(biāo)注
- 基于CRF的詞性標(biāo)注
- 命名實(shí)體識(shí)別
- 案例
- 在線中文分詞系統(tǒng)實(shí)戰(zhàn)
- 命名實(shí)體識(shí)別接口開發(fā)
- 基于詞性標(biāo)注的關(guān)鍵詞提取
|
第三單元 |
關(guān)鍵詞提取與文本分類(一) |
- 關(guān)鍵詞提取概述
- 關(guān)鍵詞提取算法
- TF-IDF
- LSA/LSI算法
- PLSA算法
- LDA算法
|
第四單元 |
關(guān)鍵詞提取與文本分類(二) |
- 文本分類算法
- 樸素貝葉斯
- 線性分類器
- 支持向量機(jī)
- Bagging模型
- Boosting模型
- 淺層神經(jīng)網(wǎng)絡(luò)
- 案例
- 新聞主題提取
- 新聞分類實(shí)戰(zhàn)
|
第五單元 |
文本向量化與句法分析(一) |
- 文本向量化概述
- 文本向量化常用算法
- 詞袋算法
- HashTF算法
- Word2Vec算法
- Glove算法
|
第六單元 |
文本向量化與句法分析(二) |
- 句法分析概述
- 句法分析常用算法
- PCFG算法
- 條件隨機(jī)場(chǎng)算法
- 案例
- 文本情感分析的開發(fā)示例
- 基于依存句法分詞的問句相似度計(jì)算
|
第七單元 |
圖像識(shí)別項(xiàng)目 |
- 介紹Google圖像識(shí)別模型Inception-v3
- 使用Inception-v3做圖像識(shí)別
|
第八單元 |
貓狗分類項(xiàng)目 |
1.圖像數(shù)據(jù)預(yù)處理
2.貓狗分類-簡(jiǎn)單CNN
3.貓狗分類-VGG16-bottleneck
4.貓狗分類-VGG16-Finetune |
第九單元 |
驗(yàn)證碼識(shí)別項(xiàng)目 |
1.多任務(wù)學(xué)習(xí)介紹
2.驗(yàn)證碼識(shí)別項(xiàng)目 |
第十單元 |
目標(biāo)檢測(cè)項(xiàng)目 |
1.目標(biāo)檢測(cè)任務(wù)介紹
2.RCNN/Fast-RCNN/Faster-RCNN算法介紹
3.YOLO算法介紹
4.SSD算法介紹
5.目標(biāo)檢測(cè)項(xiàng)目實(shí)戰(zhàn) |
第十一單元 |
目標(biāo)分割項(xiàng)目 |
1.目標(biāo)分割任務(wù)介紹
2.全卷積網(wǎng)絡(luò)
3.雙線性上采樣
4.特征金字塔
5.Mask RCNN算法介紹
6.目標(biāo)分割項(xiàng)目實(shí)戰(zhàn) |
第十二單元 |
圖像風(fēng)格遷移項(xiàng)目 |
1.圖像風(fēng)格遷移介紹
2.圖像風(fēng)格遷移項(xiàng)目實(shí)戰(zhàn) |
第十三單元 |
GAN項(xiàng)目 |
1.生成式對(duì)抗網(wǎng)絡(luò)GAN介紹
2.生成式對(duì)抗網(wǎng)絡(luò)GAN項(xiàng)目實(shí)戰(zhàn) |
總結(jié)與考核 |
(注:大綱還可根據(jù)需求進(jìn)行調(diào)整)
第二部分 師資簡(jiǎn)介
覃棅豐
創(chuàng)業(yè)公司技術(shù)負(fù)責(zé)人。機(jī)器學(xué)習(xí),深度學(xué)習(xí)領(lǐng)域多年一線開發(fā)研究經(jīng)驗(yàn),精通算法原理與編程實(shí)踐。曾使用Tensorflow,Caffe,Keras等深度學(xué)習(xí)框架完成過多項(xiàng)圖像,語音,nlp,搜索相關(guān)的人工智能實(shí)際項(xiàng)目,研發(fā)經(jīng)驗(yàn)豐富。擁有兩項(xiàng)國家專利,同時(shí)具有多年授課培訓(xùn)經(jīng)驗(yàn),講課通熟易懂,代碼風(fēng)格簡(jiǎn)潔清晰。
人工智能相關(guān)工作經(jīng)歷:
上海希格斯網(wǎng)絡(luò)科技有限公司 數(shù)據(jù)挖掘工程師
1.負(fù)責(zé)深度學(xué)習(xí)NLP算法的研究和實(shí)現(xiàn)。
2.負(fù)責(zé)搜索引擎的實(shí)現(xiàn)和優(yōu)化。
上海索洛信息技術(shù)有限公司 高級(jí)算法工程師
1.負(fù)責(zé)深度學(xué)習(xí)圖像算法的研究和實(shí)現(xiàn)。
2.負(fù)責(zé)深度學(xué)習(xí)語音算法的研究和實(shí)現(xiàn)。
人工智能相關(guān)項(xiàng)目經(jīng)驗(yàn):
人崗匹配項(xiàng)目 負(fù)責(zé)算法實(shí)現(xiàn)
● 收集了10萬份JD。
● 基于Tensorflow平臺(tái)使用LSTM+Attention算法。
● 使用JD訓(xùn)練職位推薦模型。訓(xùn)練好的模型可用于分析簡(jiǎn)歷描述,并根據(jù)簡(jiǎn)歷描述推薦一個(gè)或多個(gè)適合的職位。
項(xiàng)目關(guān)鍵詞提取項(xiàng)目 負(fù)責(zé)算法實(shí)現(xiàn)
● 收集了10萬份項(xiàng)目描述,并標(biāo)記好項(xiàng)目中的關(guān)鍵詞。
● 基于Tensorflow平臺(tái)使用seq2seq模型。
● 從簡(jiǎn)歷的項(xiàng)目描述中提取出該項(xiàng)目中的重點(diǎn)詞匯。可用于優(yōu)化簡(jiǎn)歷項(xiàng)目搜索結(jié)果。
人才搜索引擎項(xiàng)目 負(fù)責(zé)搜索引擎的實(shí)現(xiàn)和優(yōu)化
● 搭建簡(jiǎn)歷搜索引擎服務(wù)。
● 完成學(xué)校名,專業(yè),公司,行業(yè)等模塊的搜索策略
● 完成搜索結(jié)果高亮服務(wù)。
● 修改搜索bug優(yōu)化搜索算法。
寵物臉識(shí)別項(xiàng)目 負(fù)責(zé)數(shù)據(jù)處理,算法實(shí)現(xiàn)
● 收集了5萬張狗/貓的照片,并標(biāo)記好它們臉部的區(qū)域。
● 在Linux下基于Caffe平臺(tái)使用Faster-rcnn實(shí)現(xiàn)狗/貓臉檢測(cè)算法。
● 推出了一款在線小游戲,用戶上傳自己家狗/貓的照片,服務(wù)器接收到照片之后用訓(xùn)練好的模型檢測(cè)照片中狗/貓的臉,并把狗/貓的臉框出來,給它們的長(zhǎng)相打一上個(gè)分?jǐn)?shù),再把處理后的照片反饋給用戶。
寵物品種識(shí)別項(xiàng)目 負(fù)責(zé)數(shù)據(jù)處理,算法實(shí)現(xiàn)
● 收集了19種貓和27種狗的照片,共3萬多張,并做好分類標(biāo)簽。
● 基于Caffe平臺(tái)使用AlexNet,GoogleNet以及自己設(shè)計(jì)的網(wǎng)絡(luò)實(shí)現(xiàn)寵物品種分類算法。
● 推出了一款在線小游戲,用戶上傳自己家狗/貓的照片,服務(wù)器接收到照片之后用訓(xùn)練好的模型檢測(cè)照片中狗/貓的品種,不同寵物的品種會(huì)對(duì)應(yīng)不同明星的臉,再把與寵物品種相似的明星臉反饋給用戶。
寵物叫聲情感分類項(xiàng)目 負(fù)責(zé)數(shù)據(jù)處理,算法實(shí)現(xiàn)
● 收集了1萬6千條狗叫聲,分成8個(gè)類別。
● 基于Tensorflow平臺(tái)使用CNN,LSTM實(shí)現(xiàn)狗叫聲情感分類算法。
● 將訓(xùn)練好的模型放到嵌入式設(shè)備中,實(shí)時(shí)判斷當(dāng)前場(chǎng)景是否有狗叫聲,有狗叫聲的話是屬于什么分類。