失效链接处理 |
机器学习基础_数据的降维及实战 PDF 下载
本站整理下载:
相关截图:
![]()
主要内容:
数据的降维
数据的降维是数据预处理中至关重要的一部分。当拥有非常高纬度的数据
集时,给数据降低纬度对于分析来说是非常重要的。
数据降维的概念
维度指的是特征的维度。数据的降维指的是要最大程度降低数据特征(剔
除无用特征)的同时,尽可能多的保留原数据中包含的信息。简单的说降
维指的是特征的数量减少。
数据降维的意义
当我们拿到多特征的数据时,有一些字段的数据对于结果是没有意义,或
者意义极小,但是在做机器学习的过程中也会参与计算,对我们最终分析
结果造成不利影响,我们要根据实际情况,把数据进行降维,使得计算过
程更轻便。
数据降维的方法
常用的数据降维方法有两种:
特征选择
主成分分析
特征选择 特征选择的概念
特征选择指的是在所有特征中 选择部分特征 作为训练集特征,选择后特征
的值不改变,但是选择后的特征维数会降低。
特征选择的目的
当数据的特征较多时,特征量达到成百上千时,会极大的消耗计算性能。
并且,有许多无用的特征,也会给计算带来一定的麻烦。
例如,给出一系列猫的数据,我们需要根据特征对猫进行分类,其中
有‘是否有爪子’,‘爪子的长度’,‘眼睛的颜色’,‘毛的长度’四
个特征。
|