AI語言與文字探勘先修班



自然語言處理(NLP)為人工智慧(AI)與語言學結合的重要科學領域。NLP主要任務在探討如何讓電腦認知與理解人類自然語言的語意,重要應用範圍包括:文字分類、文字探勘、情輿分析、對話機器人、自動翻譯、摘要生成、機器問答、語音辨識等。自然語言處理領域不斷的發展,從早期的語言模型、機器學習到近年的深度學習技術。然而實務上,技術的使用必須考量應用任務的不同而做出正確的選擇。

然而自然語言處理中第一步的重要工作是:如何將文字轉換成電腦可儲存、讀取、計算與分析的形式,這一系列的工作包含:文字斷詞、建立文字索引清單、辨識特定名詞、詞性標記、同義詞轉換、同位詞辨識、文件表示法等,然後再搭配適當的機器學習演算法進行文字的分類與預測。而機器學習又分為監督式分類與非監督式分群技術。因此,要進入NLP的研究領域或成為一位NLP工程研發人員,必須在這些步驟當中了解所有相關的技術與解決方式,未來在面對不同領域的資料,例如金融大數據、醫療大數據、智慧客服等,才有能力判斷在哪個步驟當中需要使用哪種合適的技術以獲得正確與有效的巨量資料分析結果。


課程目標

  1. 了解自然語言處理與文字探勘之商業應用。
  2. 了解文字前處理之基本流程。
  3. 了解文字、文件向量空間表示法。
  4. 了解基本機器學習技術與應用。
  5. 執行文字探勘應用之基礎實作流程。
  6. 檢驗實作成效與解讀商業應用可行性。

課程將以個案方式探討文字探勘之實務應用,進而了解自然語言處理之必要性及文字前處理之基本流程。同時,本課程將依不同任務之個案討論機器學習技術之適用性,以及如何有效檢驗結果。本課程將介紹:文字斷詞、建立文字索引清單、詞性標記、文件表示法、詞嵌入、文字分類器、分監督式技術於文字探勘應用等。
本課程之實作內容將以Python程式語言為主,課程也將介紹文字處理之基本套件與實作開發所需之工具。因此本課程之學員將習得文字探勘與NLP基礎理論及基礎實作。期待學員們能將本課程所學之內容套用至與文字處理相關之應用。


 

  • ● 各種領域背景之學術研究人員 (如大專院校教師、博士生、研究生等)
  • ● 進行資料處理與分析之從業人員
  • ● 對大數據分析與文字探勘有興趣之個人


 

 
上課日期 課程目標 授課內容
上午
(3小時)
文字前處理流程
自然語言處理工作
文字表示法與詞嵌入
  1. 基礎文字前處理、停止詞、同義詞、詞性標記、名詞辨識
  2. 向量空間模型、nGram
  3. 類神經網路概論、詞嵌入模型
下午
(3小時)
文字與機器學習實務應用
  1. 機器學習技術概論 (文字分類)
  2. 個案討論
  3. 實務應用 (客戶評論)
 

  • 最近開課梯次:有意願進修者,歡迎先報名卡位。
每日9:00-16:00  (6小時/天)


 
收費方案 定價 早鳥 舊生
在職人士 $7,000 折$500 折$300


【優惠方式】
 - 凡有參加過ERP中心任一培訓課程,可再享舊生優惠折扣
 - 需提出培訓證明
 - 早鳥及舊生優惠,可同時使用




電話:(03) 422-7151 #66603 黃小姐
E-mail:ncuerp@mgt.ncu.edu.tw


入校停車費用:學員申請停車證另有優惠,若有需要請洽專員。
住宿資訊:中央大學中大會館(均為2人房): 1100元/晚,欲申請住宿者,請於報名表中註明
交通資訊:http://www.ncu.edu.tw/visitors/traffic​


1.線上完成課程報名,近日將有課程專員與您電話聯繫確認報名資訊。
2.報名資訊確認無誤,將以E-mail及簡訊通知繳費(若確定開班)。
3.課前通知,將於課前三天E-mail及簡訊通知。
4.BIG DATA系列課程,學員若上課總時數超過2/3,將提供完訓證明以茲鼓勵。

5.本中心得保留修訂課程及未達最低開課人數時取消課程之權利。
6.主辦單位:中央大學ERP中心。
7.退費說明:
- 實際開課日前第30日以前要求退費者,可全額退還;
- 實際開課日前第29日至前第1日,退還費用總額90%;
- 實際開課日後但未逾全期(或總課程時數)三分之ㄧ者;應退還費用總額50%;
- 實際開課日後已逾全期(或總課程時數)三分之ㄧ者,得全數不予退還。
- 因故未能開班上課,則全額退還已繳費用。