- 教師: b06001 王昱鈞
王昱鈞
本課程之目標希望學生在修習本課程後,教導學生了解如何進行大量數位資料的處理與分析,能運用基本程式語言與工具,擷取並剖析資料,並能熟悉如何使用數位工具進行數位化文獻之統計分析、分類分群及探勘等研究。
在數位文本資料的分析上,我們需要從文獻的文本內容之中找出我們所關心的資訊,從而進行資料文本的統計分析、分類,並呈現解讀分析結果之意義。本課程從大量數位文本的抓取出發,了解網路爬蟲技術、網頁內容解析、文本預處理、詞頻分析統計等方法。並介紹Pandas這個非常熱門,功能強大的數據分析工具,學習如何進行統計分析與圖表視覺化呈現,讓學生對於資料處理與分析之方法有概觀性的認識,熟悉既有數位工具之操作並實際應用於數位文本之分析。
上課教材(Texts):
上課用書:
- 平時成績或報告(paper & presentation):40.00%
- 期中考試、報告或課堂討論(mid-term exam & class participation):30.00%
- 期末考試、報告或其他(final exam & others):30.00%
課程英文名稱(Engilsh Course Title):Web Crawler and Big Data Analysis
上課時間(Time)四): 06-08 GC204電腦教室
學分數(Credit Courses):3.00學分
選修別(Elective Discriminability):專業選修
學期別(Terminal Discriminability):學期
修課條件(Prerequisites):無,但有Python程式語言基本概念,或曾修習程式語言入門課程更佳
是否開放隨班附讀生選修(Is the course open to of the Continuing Education Center):開放(Yes)
是否與性平教育相關Is the course related to gender equality issue):不相關(No)
授課方式(Tuituinal Method):
■課堂講授(lecture)
■實習(pratice)
■課堂報告與討論(seminar)
使用教具(Classroom Equipment):電腦、投影機、自編講義
