BD-101 Big Data 移動實驗室
隨著大數據應用面的激增, 當今的就業市場對數據科學家與資料分析師的需求正成指數型的成長中,成為最熱門的領域之一。 BD-101 大數據實驗平台系統是一台輕量化的大數據設備。相較於一般傳統的大數據設備,採用機櫃化的活動式設計,不會佔據太大的空間,也具備設備可移動性,在實際教學上充滿靈活與使用彈性,並提供迅速除錯功能,強化了設備在維護上的穩定性與方便性,更提供了完整的大數據實驗手冊,引領式的實驗設計,讓學生可以循序漸進認識整個大數據生態圈,以及如何運用各種演算法分析大數據。
產品特色
- 獨立式移動系統
• 可獨立運作,不須額外安裝硬體或軟體即可使用,可在區網下工作不受限網際網路頻寬影響。
• 移動式機櫃架構,可供老師在任一間教室進行教學,無須額外規畫專屬教室。 - 24H 監控系統
• 可透過 24 小時監控系統,隨時掌握目前 CPU、網路、硬碟等使用狀況。
• 設有 refresh 按鈕,可透過此按鈕刷新監控面板的數值。 - 完整 Big Data Ecosystem 教學
• 精心設計大數據資料庫伺服器,提供超過 20 種實驗案例,配合實驗手冊引領式學習。
• 唯一包含所有大數據必備服務介紹的教學系統,包含 Hadoop、Yarn、Spark、Hive、HBase 等服務。 - 輕鬆上手
不用設定繁雜的參數以及系統設定,可直接透過 web-IDE 進行實驗。 - 迅速除錯
透過還原系統,可輕鬆將有問題的節點還原至出廠狀態,不用花費大量時間尋找問題原因。 - 隨機資料產生器
透過 6 種不同模型的隨機資料生成,可以一鍵生成出符合演算法資料集的資料。 - 大數據及 AI 延伸
• 結合 AI 實例,學習大數據與 AI 之間的關係。
• 亦可成為系統工具,透過其他領域所分析的資料,為其設計一套演算法來分析該資料。
產品規格
實驗項目
- Python 實驗
• Python 介紹與操作
• Python 網路爬蟲
• 資料清洗、正規化與標準化 - Yarn 實驗
• Yarn 組態設定
• 終止程序
• 不同組態對比實驗 - Hive/HBase 實驗
• Hive/MySQL
• HBase/NoSQL
• 不同資料庫對比實驗 - Spark & Zeppelin 實驗
• Alternating Least Squares matrix factorization
• 決策樹
• Pipeline
• Resilient distributed DataSet (RDD)
• 支援向量機演算法-鳶尾花實驗
• 二元分類演算法-鐵達尼號實驗
• 單純貝式二元分類演算法-鳶尾花實驗
• Mean-shift 群聚演算法-特徵空間分析法
• 回歸樹演算法-學習決策規則 - AI 相關實驗
• 類神經網路
• 人臉辨識