The VC Dimension
Recap
由於 lecture 6 被跳過了,所以這裡先講講 lecture 6 的結論。
- 當 有 break point 時 (),我們會得到 upper bound: 也就是說我們有夠小的
- 透過一串騷操作,我們可以將原本「得到 bad data 的機會」的 upper bound 換成 (which is called VC bound):
綜合以上兩點,當 有 break point 且 足夠大的時候,我們就能說 is possible。
然後當 可以從 裡挑出一個好的 (有小的 ),我們就能說 應該也是小的,因此 可能相當接近理想中的 。
VC Dimension
VC Dimension 的定義為: largest for which (也就是 maximum non-break point, 可以 shatter 的最大 input 數)
VC Dimension and Learning
從定義我們可以得到: if ,
因此當我們能找到 finite 的 時,就代表任何 都會符合
此時我們需要考慮的就只剩下 了:
VC Dimension of Perceptrons
到目前為止,我們已經證明了 2D PLA 是可行的:
接下來,我們要來找出當 的有超過兩個 features 時, 應該長怎樣。
根據經驗,我們可以假設 -D perceptrons 的 ,我們分成兩部分來證明這個式子。
證明
也就是說,我們可以 shatter 某些 inputs 組合。
我們先假設一個特殊的有 個點的 input :
如果很難想像的話,在 2D () 的時候,這個 在空間中會長這樣:

由於這個 是可逆的,所以不管 長怎樣,我們都能夠讓 ,這樣一來 ,也就是說這個 是可以被 shatter 的,因此 。
證明
考慮有 個點的 general :
由於 rows () 比 columns () 還多,所以我們要考慮 linear dependence 的問題:
其中 代表該 的 sign。
現在假設只有 是 ,其他 到 都是 的情況,我們會發現如果有個 可以準確分類 到 的話,則該 就不可能讓 被分類正確:
因此,在有 個點的情況下,不管 長怎樣,一定都會有一個 找不到對應的 ,因此不能被 shatter,也就是說 。
解讀 VC Dimension
Degrees of Freedom
degrees of freedom (DOF) 代表在 hypothesis function 內的 independent parameters 的數量,通常這會和 的 parameters 的維度相近,但不一定相等。
舉例來說,假設模型有三個參數 ,但我們加了一個約束條件:
因此 必須根據 的選擇來計算,也就是說我們不能「自由」的調整它,因此雖然 的維度是 3,但是 DOF 卻是 2。
DOF 越高,代表模型越靈活,越能夠擬合資料,但有可能 over-fitting。
Powerfulness of H
有了 DOF 的概念,(在 binary classification 上) 的意義相當於是一個 的effective DOF,於是,我們可以用 來衡量一個 (在 binary classification 上) 的能力有多強。
所謂的 effective DOF 是指最後真正對模型產生影響的 independent parameters 的數量,通常會和 DOF 相近,但不一定相等。
當然,在 PLA 的例子裡, 的維度 = DOF = Effective DOF = =
Trade-off on VC Dimension
Lecture 5 的一開始我們有提到兩個問題:
- 如果確保 和 足夠接近?
- 如何讓 足夠小?
這兩個問題除了和 (size of ),也和 有關:
- small :
- Yes: 誤差
- No: 能力不夠強
- large :
- No
- Yes: 能力很強
因此選擇合適的 (or ) 相當重要。
Penalty for Model Complexity
回到這個式子:
我們現在將右項替換成 (confidence level),然後做一些轉換可以得到 和 的誤差實際上會等於:
這誤差又叫做 generalization error,而我們又再給他一個更簡單的代號:
而這個 被稱為 penalty for model complexity。
The VC Message
Sample Complexity
現在假設條件 ,則我們需要多少 sample 才能讓 (誤差的 upper bound 在信任水準內)。
理論上而言,我們需要 才能讓 upper bound 為 ,也就是需要 。
不過,實務上大概只要抓 就夠了,為什麼?

source: https://www.youtube.com/live/3zbhL1Q7nu0 p.24