自然語言處理
注意
❯
- 領域專長課程可能有先修科目或開放對象之限制,選課前請先到臺大課程網確認。
- 領域專長的施行學期若晚於畢業當學期,學生即使修習專長課程且成績及格,仍無法取得認證。
施行學期:110-2 主責單位:資訊工程學系
基本資訊
主責教師
姓名
陳縕儂
email
yvchen@csie.ntu.edu.tw
聯絡窗口
姓名
曾詩婷
email
sttseng@csie.ntu.edu.tw
學習目標
本領域專長模組針對自然語言處理等技術與背景進行學習,並且著重於各式前瞻應用,讓學生可以具備理論與實務兼具之能力。
在完成基礎課程(Level 1)後,我們預期學生得以具備基礎程式與資料結構之實作能力。在擁有從基礎課程學習到的基本知識,我們期望在完成方法課程(Level 2)後,學生可以具備(1)語言處理之各式應用及相關方法、(2)應用於大規模資料之技術與實作。
在深入的進階課程中(Level 3),學生將得以將在前兩個模組學習到的基本知識與實作能力應用在解決實務問題上。我們預期在完成該階段後,學生將得以(1)根據觀察到的實務問題,規劃出對應之自然語言處理任務,並提出解決方法及實作相關模型、(2)在前瞻之研究部分,學生能夠閱讀並理解自然語言處理相關領域之文獻中,思考可能的研究方向與相關價值、(3)有能力與相關產業合作,並達到實質上的貢獻,或者能夠與此領域相關學者或研究者合作,共同產出具有在國際會議或者期刊發表潛能之深入研究。
課程架構
修課指引
修習此領域專長之同學需具備幾門先修課程之能力,已具備足夠能力修習此領域專長之課程模組,包含:機率、線性代數、程式設計。
基礎課程(Level 1)除本系(資訊工程學系)必修之基礎課程外,主要之基礎課程為開設於本系的「資料結構與演算法」。「資料結構與演算法」主要以基本的資料結構為經,相對應的演算法為緯,由具體實作中,逐步引入各種的理論分析工具,講授如何在不同情境下,選擇最適當的資料結構與演算法,並評估各種選擇的優劣性,不但涵蓋了資訊領域的基本技術,也教導學生如何表現並存取與處理各式的資料,以銜接當代以資料所驅動的各類人工智慧技術。
方法課程(Level 2)教授學生此領域之基礎理論及相關方法,涵蓋的課程為開設於本系的「自然語言處理」與「網路資訊檢索與探勘」。「自然語言處理」又稱計算語言學或人類語言技術,課程主要的目標是學習了解和產生自然語言的電腦系統,讓電腦像人一樣處理任何形式的對話工作。由於大量知識的機器可讀形式是以自然語言來呈現,很多實際應用應運而生。以文件分析、自動問答、和機器翻譯等三個應用為例。在文件分析,自然語言處理技術由部落格、微博、論壇等不同形式的媒體中,擷取知識以支援多樣化的應用。在自動問答,自然語言處理技術分析問題以了解問題核心,分析內容以擷取正確答案。在機器翻譯,自然語言處理技術分析來源語言,掌握語言之差異,以生成目標語言。本課程分詞彙、語法、語義、語用、和應用等五個面向,教授自然語言處相關理論和技術。而「網路資訊檢索與探勘」則專注於網路上大規模各式資料之擷取與利用,課程內容會介紹如何於大規模網路資訊中檢索特定訊息 (Information Retrieval; IR),如何在不同類型之資料中探勘並發現存在之知識 (Web Mining)。此課程會從典型之資料檢索系統開始介紹,並且拓展至現今前瞻自然語言技術應用於資訊檢索之情境,讓學生學習到現今大規模資料下之各式語言處理技術之應用,累積相關經驗與實作能力。
由於此領域與許多實務應用相關,故 Level 3針對實務與進階應用之面相強化學生之相關能力,包含「深度學習之應用」,此課程主要內容從深度學習之基礎理論開始介紹,讓學生可以透過詳細的模型解說深入了解背後之設計概念,一路衍伸至深度學習應用於自然語言處理之前瞻技術,包含許多新發展之進階模型介紹及作業之實作,讓學生可透過此課程訓練許多實務應用之技巧,並累積相關經驗。經過此進階課程,學生應具備足夠深入之技術與背景,可銜接相關領域之國內外碩博士學位,並進行相關之研究技術發展。
課程資訊 修習課程說明
編號
課程識別碼
課程名稱
學分數
備註
【落日條款】
- 適用對象: 112-1 入學之學生。
- 適用範圍: 112-1 (含) 以前終止之領域專長,詳見首頁最新消息。
【修習課程說明】
- 取得本領域專長認證須修習英語授課之班次
- 英語授課之課程識別碼第 4 碼為 E