Python 學生團隊
成立目標
- 研究型團隊,提供教材資源,讓學員能自主性研究並和其他團員討論
- 透過Python工具訓練學生資料分析基本能力、學習資料科學相關知識。
團隊特色
- 本社團採學長姐傳承的方式,主要教學由學長姐負責,企業資源規劃暨大數據分析中心(以下簡稱ERP中心)協助規劃。
- Python團隊整體課程規劃包含完整的資料分析步驟:資料收集、資料整理、資料分析、資料視覺化。
- 修課期滿時,符合標準可取得ERP中心開立之技能核定證書
- 擔任講師,驗收自我前一年的學習成果
課程大綱
- 資料爬蟲
- HTML+CSS
首先認識網頁架構組成,實際製作簡單網頁,了解基礎HTML文本解析一些常見的元素,提取一些關鍵的信息以利後續爬蟲處理。 - Web Crawler
在web crawler課程裡,你將領略到如何通過Python代碼從網路上獲取有趣的數據,並透過實戰練習,帶你學會爬取網頁文字資料並解析其結構與內容,再運用簡單的資料視覺化與資料分析,實際了解資料分析的歷程。
- HTML+CSS
- 資料清理
- Basic Python
Python 是目前資料處理的主流語言之一,因此是本團隊的核心重點之一。
本階段將會教您基本的 python 邏輯及規則,以銜接後續的內容。
預計 4 堂課約 12 小時由淺入深,讓完全沒有程式基礎的初學者也能掌握一門重要的程式語言。 - Data Clean
如何在有限的資源與時間下,進行有效的資料探勘,首先必須做資料前處理,資料探勘模型才會準確,進而提高資料探勘結果的正確性。本階段課程教授你如何使用Python函式庫提供的Numpy、Pandas、Matplotlib等套件,學會快速清理資料,奠定機器學習的必備技能。
- Basic Python
- 資料分析
- Scikit-learn
Scikit-learn 是Python當中所會使用的免費機器學習程式庫。
其中含有分類( Classification)、回歸(Regression)、分群(Clustering)演算法如支援向量機(SVM)、隨機森林(Random forests)、k-means等方法。
本節將會與大家討論有關於基本的機器學習相關理論,並且使用到Sklearn當中的演算法將前章用Pandas等套件所整理出來的乾淨資料進行分析、預測。最後將使用預測結果推斷出可能發生的故事與實際應用之方法。 - Tensorflow
TensorFlow為一個開源軟體庫,用於各種感知與語言理解任務的機器學習,多為業界所使用。
本階段課程將教授深度學習(deep learning)基礎概念,並介紹最近當紅的卷積神經網路(CNN)和遞迴神經網路(RNN)概念,並利用TensorFlow搭配keras套件實作圖像辨識與情感分析。
- Scikit-learn
- 資料視覺化
- Matplotlib
Matplotlib應用於全世界的資料科學和機器學習視覺化,同時也是經典的Python視覺化套件。
課程將著重於Matplotlib的兩個經典模組:Pylab與Pyplot,幫助觀察資料的走向或者相關度。 - Seaborn
Seaborn是基於Python且非常受歡迎的視覺化套件,在Matplotlib的基礎上,進行了更高級的封裝,使得作圖更加方便快捷,方便做出具有分析價值而又十分美觀的圖形。
課程目的在於將上段課程分析的資料與結果去做視覺化互動的呈現,以及更多加值型的應用
- Matplotlib
其他團隊
-
GA視覺化 學生團隊2022.03.19/0 Comments
-
微軟機器學習(Azure) 學生團隊2022.03.19/
-
R 學生團隊2022.03.05/