R 學生團隊

成立目標

透過R工具訓練學生資料分析基本能力、學習資料科學相關知識。
促進團隊參與數據分析的產學合作案,增加學生實務經驗。
希望能將其所學應用在未來職涯或研究所生涯之上。
 

團隊特色

本社團採學長姐傳承的方式,主要教學由學長姐負責,ERP暨大數據中心協助規劃。
R團隊整體課程規劃包含完整的資料分析步驟:資料整理、資料分析、資料視覺化,。
而對於模型方面,下學期也有Rapid Miner相關課程,即使不太熟悉程式操作也能夠上手
當有資料分析的產學案時,會從社團中擇優秀學生參與執行。
修課期滿時,符合標準可取得中大ERP中心開立之技能核定證書。
 

團隊介紹

上學期 : 結合統計、機器學習、資料視覺化,這幾個資料科學家常用的主題,從觀念到實作一次到位。
下學期 : 著重於機器學習,並且加入了深度學習的課程與應用(分類預測、辨識圖像等等),並且也有時下流行的網頁爬蟲、文字探勘等,讓學員能夠快速蒐集資料並進行分析。

適合:想發展分析應用為主且不排斥程式的同學加入,無程式背景者亦可參加。
 

課程介紹

以訓練學員擁有獨立完成一份專案分析為目標,除了教學各種資料分析必須的各項能力外,也會藉由案例教學來示範執行一份專案的過程。
 
  1. 資料探索與資料視覺化
    • 教學各項R語言的基礎語法及邏輯,更會藉由視覺化套件ggplot2,來協助我們探索資料及呈現資料。
    •  
  2. 資料清理
    • 透過tidyverse套件,協助我們清理、轉換、整理資料成具有分析價值的資料
    •  
  3. 資料分析
    • 利用決策樹、迴歸模型、deep learning等多項的模型運用,協助我們進行統計分析、資料分群等應用。並且也有rapid miner的課程,能讓學員們透過不同方法完成資料分析
    •  
  4. 爬蟲及文字探勘
    • 課程內容手把手習得「動靜皆宜」的爬蟲技巧,並透過可能遇到的狀況講解讓學員爬取大部分的網頁資料都能迎刃而解,且透過課程範例讓大家練習如何處理爬下來的文字資料以利後續進行文字探勘
    •  
  5. H2o Spark平台應用
    • 透過在本機架設端口透過本機電腦編寫程式,利用h2o spark等在遠端的電腦上跑數據,利用這兩項工具即可解決數據龐大的問題。