Python 學生團隊
Established Goals
- 透過Python工具訓練學生資料分析基本能力、學習資料科學相關知識。
- 促進團隊參與數據分析的產學合作案,增加學生實務經驗。
團隊特色
- 本社團採學長姐傳承的方式,主要教學由學長姐負責,企業資源規劃暨大數據分析中心協助規劃。
- Python團隊整體課程規劃包含完整的資料分析步驟:資料收集、資料整理、資料分析、資料視覺化。
- 當有資料分析的產學案時,會從社團中擇優秀學生參與執行。
- 修課期滿時,符合標準可取得本中心開立之技能核定證書。
團隊介紹
- 本社團採學長姐傳承的方式,主要教學由學長姐負責,ERP暨大數據中心協助規劃。
- Python團隊整體課程規劃包含完整的資料分析步驟:資料收集、資料整理、資料分析、資料視覺化。
- 當有資料分析的產學案時,會從社團中擇優秀學生參與執行。
- 修課期滿時,符合標準可取得本中心開立之技能核定證書。
課程大綱
- 資料爬蟲
- HTML+CSS
首先認識網頁架構組成,實際製作簡單網頁,了解基礎HTML文本解析一些常見的元素,提取一些關鍵的信息以利後續爬蟲處理。 - Web Crawler
在web crawler課程裡,你將領略到如何通過Python代碼從網路上獲取有趣的數據,並透過實戰練習,帶您學會爬取網頁文字資料並解析其結構與內容,再運用簡單的資料視覺化與資料分析,實際了解資料分析的歷程。
- HTML+CSS
- 資料清理
- Basic Python
Python 是目前資料處理的主流語言之一,因此是本團隊的核心重點之一。
本階段將會教您基本的 python 邏輯及規則,以銜接後續的內容。
預計 4 堂課約 12 小時由淺入深,讓完全沒有程式基礎的初學者也能掌握一門重要的程式語言。 - Data Clean
如何在有限的資源與時間下,進行有效的資料探勘,首先必須做資料前處理,資料探勘模型才會準確,進而提高資料探勘結果的正確性。本階段課程教授你如何使用Python函式庫提供的Numpy、Panda、Matplotlib等套件,學會快速清理資料,奠定機器學習的必備技能。
- Basic Python
- 資料分析
- Scikit-learn
Scikit-learn 是Python當中所會使用的免費機器學習程式庫。
其中含有分類( Classification)、回歸(Regression)、分群(Clustering)演算法如支援向量機(SVM)、隨機森林(Random forests)、k-means等方法。
本節將會與大家討論有關於基本的機器學習相關理論,並且使用到Sklearn當中的演算法將前章用Pandas等套件所整理出來的乾淨資料進行分析、預測。最後將使用預測結果推斷出可能發生的故事與實際應用之方法。 - Tensorflow
TensorFlow為一個開源軟體庫,用於各種感知與語言理解任務的機器學習,多為業界所使用。
本階段課程將教授深度學習(deep learning)基礎概念,並介紹最近當紅的卷積神經網路(CNN)和遞迴神經網路(RNN)概念,並利用TensorFlow搭配keras套件實作圖像辨識與情感分析。 - TextMining
多數的資料探勘技術都是利用數值資料進行分析,若想提取文本資料中模模糊糊清清楚楚的消費者意見或情感,需要經過許多前處理的步驟。
在此課程中我們學習使用NLTK套件進行文字探勘,他是一套基於Pyhon的自然語言處理工具箱,介紹的範圍會包含典型斷詞、詞性標註、模塊分析等,也能針對語句詞性結構進行篩選,是一個很方便的套件。
- Scikit-learn
- 資料視覺化
- Matplotlib
Matplotlib應用於全世界的資料科學和機器學習視覺化,同時也是經典的Python視覺化套件。
課程將著重於Matplotlib的兩個經典模組:Pylab與Pyplot,幫助觀察資料的走向或者相關度。 - Seaborn
Seaborn是基於Python且非常受歡迎的視覺化套件,在Matplotlib的基礎上,進行了更高級的封裝,使得作圖更加方便快捷,方便做出具有分析價值而又十分美觀的圖形。
課程目的在於將上段課程分析的資料與結果去做視覺化互動的呈現,以及更多加值型的應用
- Matplotlib
其他團隊
-
GA視覺化 學生團隊2022.03.19/0 Comments
-
微軟機器學習(Azure) 學生團隊2022.03.19/
-
R 學生團隊2022.03.05/