Tube Regression.
Tube Regression是一种对outlier不敏感的回归方法。在计算样本点的回归误差时,在回归线上下分别划定一个区域(中立区),如果数据点分布在这个区域内,则不计算误差;只有分布在中立区域之外才计算误差。
假设中立区的宽度为$2ε$,则回归误差(上图标红的线段)写作:
\[\text{err}(x) = \begin{cases} 0, & | w^Tx-y | ≤ ε \\ | w^Tx-y | - ε, & | w^Tx-y | > ε \end{cases} = \max(0,| w^Tx-y | - ε)\]上述误差也被称作ε-不敏感损失(ε-insensitive loss)。
比较tube误差和平方误差,两者是类似的,但tube误差对outlier不敏感: