大規模成本導向分類演算法之設計與測試

計畫名稱:大規模成本導向分類演算法之設計與測試

所屬單位:資訊系

研究團隊:計算學習實驗室

計畫主持人:林軒田

研究人員:馮俊菘

資源需求:matlab, java, gcc

使用期間:2009/03~

研究主題:
大規模成本導向分類演算法之設計與測試

研究內容概述:
錯誤成本(misclassification cost)在機器學習的自動分類問題中,是效果衡量的重要指標。在許多的應用裡,都希望能對不同類型的分類錯誤,課以不同的錯誤成本,我們稱之為成本導向 分類問題(cost-sensitive classification)。舉例來說,在醫療應用中,將一名傳染病患者錯誤歸類為健康人士,對於公共衛生的影響,可能遠大於將一名健康人士歸類為傳 染病患者。成本導向分類還可以應用在個人化廣告推播、詐欺分析、電腦視覺等項目。這些眾多的應用說明了成本導向分類問題的重要性,也使得此問題近年來成為 機器學習領域之熱門問題。雖然現存有數種成本導向分類的方法,然而,這些方法的理論基礎及實用價值尚未被完整評估。此外,當要分類的類別極多的時候,這些 方法通常表現得並不理想。因此,我們希望能用更嚴謹的方式,來為不同類型的應用需求,開發更快更好的成本導向分類演算法。本研究計畫之初步成果,已於 2008/09 在資訊工程系與全系師生研討如附件,我們預期利用計算機中心的豐富計算資源,能在更大規模的資料上,有更好的結果。

詳細計畫內容 回到上一頁