Embedding
Embedding
嵌入层:将高维空间中离散变量映射为低维稠密 embedding 向量表示
embedding 向量更能体现样本之间关联
- 內积(內积)体现样本之间接近程度
- 可通过可视化方法体现样本差异
embedding 向量更适合某些模型训练
- 模型不适合高维稀疏向量
- embedding 向量矩阵可以联合模型整体训练,相当于提取特征
- embedding 向量也可能类似迁移学习独立训练之后直接融入模型中
- Embedding:将度量空间中对象映射到另个(低维)度量空间,并尽可能保持不同对象之间拓扑关系,如 Word-Embedding
Embedding表示
特征不分组表示
- $E$:embedding向量矩阵
- $M$:特征数量
- $v_i$:$k$维embedding向量
- $x_i$:特征取值,对0/1特征仍等价于查表,只需考虑非0特征
- $x_{M_i}$:第$j$个非0特征,编号为$M_i$
- $m$:非零特征数量
- $\varepsilon_x$:特征向量集合
特征分组表示
- $G$:特征组数量
- $V_i$:第$i$特征组特征向量矩阵
- $g_i$:第$i$特征组特征取值向量