您好,欢迎访问三七文档
当前位置:首页 > 行业资料 > 国内外标准规范 > (含答案)机器学习第一阶段测试题
机器学习第一阶段测试题一、选择题1.以下带佩亚诺余项的泰勒展开式错误的一项是(D)A.)x(ox!x!xex33231211B.)x(ox*xxarcsin33321C.)x(ox!x!xxsin5535131D.)x(ox!x!xcos44241211分析:)x(ox!x!xcos442412112.以下关于凸优化的说法错误的一项是(C)A.集合C任意两点间线段均在集合C内,则C为凸集B.集合C的凸包是能够包含C的最小凸集C.多面体不一定是凸集D.线性变换能保持原集合的凸性分析:多面体是指有限半空间和超平面的交集,多面体一定是凸集3.以下说法错误的一项是(C)A.当目标函数是凸函数时,梯度下降法的解是全局最优解B.进行PCA降维时需要计算协方差矩阵C.沿负梯度下降的方向一定是最优的方向D.利用拉格朗日函数能解带约束的优化问题分析:沿负梯度方向是函数值下降最快的方向但不一定是最优方向4.K-means无法聚以下哪种形状样本?()A.圆形分布B.螺旋分布C.带状分布D.凸多边形分布分析:基于距离的聚类算法不能聚非凸形状的样本,因此选B5.若X1,X2,...Xn独立同分布于(2σ,μ),以下说法错误的是(C)A.若前n个随机变量的均值,对于任意整数ε,有:B.随机变量的收敛到标准正态分布C.随机变量收敛到正态分布D.样本方差其中样本均值分析:A:大数定理概念;B、C:中心极限定理概念;C错,应该收敛到正态分布D:样本的统计量公式二、公式推理题1.请写出标准正态分布的概率密度函数、期望、以及方差分析:概率密度函数:2221xeπ)x(f;期望:0)x(E;方差:1)x(D2.请根据表中的分类结果混淆矩阵给出查准率(准确率)P和查全率(召回率)R的计算公式真实情况预测结果正例反例正例TP(真正例)FN(假反例)反例FP(假正例)TN(真反例)分析:FPTPTPP,NFTPTPR三、简答题1.求函数ylnx)y,x(f32的梯度向量分析:)y)y,x(f,x)y,x(f()y,x(f,所以答案为(2x,3/y)niinXnY111}ε|μY{|PlimnnσnμnXYniin1niinXY1)σ,μ(N2nii)XX(nS1211)σn,μn(N2niiXnX112.列举你知道的无约束最优化方法(至少三个),并选一种方法进行详细介绍分析:梯度下降法,牛顿法,拟牛顿法,共轭梯度法...(介绍略)3.请简要叙述正则化项中的L1和L2方法分析:1正则化和L2正则化可以看做是损失函数的惩罚项。L1正则化是指权值向量w中各个元素的绝对值之和,通常表示为||w||1。L2正则化是指权值向量w中各个元素的平方和然后再求平方根(可以看到Ridge回归的L2正则化项有平方符号),通常表示为||w||2。L1正则化可以产生稀疏权值矩阵,即产生一个稀疏模型,可以用于特征选择L2正则化可以防止模型过拟合;一定程度上,L1也可以防止过拟合4.简述k-means的主要优缺点及针对缺点的优化方案分析:优点:经典、简单、快速、对密集簇效果较好缺点:对K值敏感,且只适用于能求距离均值的应用,不适合非凸簇或大小差别很大的簇改进:二分k-means,k-means++...5.简述UserCF的主要步骤分析:一、找到和目标用户兴趣相似的用户集合——计算两个用户的兴趣相似度二、找到这个集合中的用户喜欢的,且目标用户没有听说过的物品推荐给目标用户——找出物品推荐
本文标题:(含答案)机器学习第一阶段测试题
链接地址:https://www.777doc.com/doc-1807256 .html