Python組 - 國立中央大學企業資源規劃暨大數據分析中心

成立目標

研究型團隊，提供教材資源，讓學員能自主性研究並和其他團員討論
透過Python工具訓練學生資料分析基本能力、學習資料科學相關知識。

團隊特色

本社團採學長姐傳承的方式，主要教學由學長姐負責，企業資源規劃暨大數據分析中心(以下簡稱ERP中心)協助規劃。
Python團隊整體課程規劃包含完整的資料分析步驟：資料收集、資料整理、資料分析、資料視覺化。
修課期滿時，符合標準可取得ERP中心開立之技能核定證書
擔任講師，驗收自我前一年的學習成果

課程大綱

資料爬蟲‌
- HTML+CSS
  首先認識網頁架構組成，實際製作簡單網頁，了解基礎HTML文本解析一些常見的元素，提取一些關鍵的信息以利後續爬蟲處理。
- Web Crawler
  在web crawler課程裡，你將領略到如何通過Python代碼從網路上獲取有趣的數據，並透過實戰練習，帶你學會爬取網頁文字資料並解析其結構與內容，再運用簡單的資料視覺化與資料分析，實際了解資料分析的歷程。
資料清理‌
- Basic Python
  Python 是目前資料處理的主流語言之一，因此是本團隊的核心重點之一。
  本階段將會教您基本的 python 邏輯及規則，以銜接後續的內容。
  預計 4 堂課約 12 小時由淺入深，讓完全沒有程式基礎的初學者也能掌握一門重要的程式語言。
- Data Clean
  如何在有限的資源與時間下，進行有效的資料探勘，首先必須做資料前處理，資料探勘模型才會準確，進而提高資料探勘結果的正確性。本階段課程教授你如何使用Python函式庫提供的Numpy、Pandas、Matplotlib等套件，學會快速清理資料，奠定機器學習的必備技能。
資料分析‌
- Scikit-learn
  Scikit-learn 是Python當中所會使用的免費機器學習程式庫。
  其中含有分類( Classification）、回歸（Regression）、分群（Clustering）演算法如支援向量機(SVM)、隨機森林(Random forests)、k-means等方法。
  本節將會與大家討論有關於基本的機器學習相關理論，並且使用到Sklearn當中的演算法將前章用Pandas等套件所整理出來的乾淨資料進行分析、預測。最後將使用預測結果推斷出可能發生的故事與實際應用之方法。
- Tensorflow
  TensorFlow為一個開源軟體庫，用於各種感知與語言理解任務的機器學習，多為業界所使用。
  本階段課程將教授深度學習(deep learning)基礎概念，並介紹最近當紅的卷積神經網路(CNN)和遞迴神經網路(RNN)概念，並利用TensorFlow搭配keras套件實作圖像辨識與情感分析。
資料視覺化‌
- Matplotlib
  Matplotlib應用於全世界的資料科學和機器學習視覺化，同時也是經典的Python視覺化套件。
  課程將著重於Matplotlib的兩個經典模組：Pylab與Pyplot，幫助觀察資料的走向或者相關度。
- Seaborn
  Seaborn是基於Python且非常受歡迎的視覺化套件，在Matplotlib的基礎上，進行了更高級的封裝，使得作圖更加方便快捷，方便做出具有分析價值而又十分美觀的圖形。
  課程目的在於將上段課程分析的資料與結果去做視覺化互動的呈現，以及更多加值型的應用

成立目標

團隊特色

課程大綱

其他團隊

聯絡我們

追蹤我們

相關連結