当前位置: 首页 > news >正文

个人网站建设 实验报告体验营销策略

个人网站建设 实验报告,体验营销策略,做vi 设计国外网站,武汉市中国建设银行网站目录:缺失值处理和拉格朗日插值法一、前言二、理论知识三、代码实现一、前言 对于含有缺失值的数据集,如果通过删除小部分记录达到既定的目标,那么删除含有缺失值的记录的方法是最有效的。然而,这种方法也有很多问题,…

目录:缺失值处理和拉格朗日插值法

  • 一、前言
  • 二、理论知识
  • 三、代码实现

一、前言

对于含有缺失值的数据集,如果通过删除小部分记录达到既定的目标,那么删除含有缺失值的记录的方法是最有效的。然而,这种方法也有很多问题,删除缺失值的同时也会损失一定的信息,对于那些数据集较小的来说这是影响很大的。

所以可以对这些缺失值进行填充。

最简单的处理原则:

  1. 缺失值少于20%

连续变量使用均值或者中位数填补;

分类变量不需要填补,单算一类即可,或者用众数填补。

  1. 缺失值在20%-80%

填补方法同上;

另外每个有缺失值的变量生成一个指示哑变量,参与后续的建模。

  1. 缺失值大于80%

每个有缺失值的变量生成一个指示哑变量,参与后续的建模,原始变量不使用。

也可以用最近邻插补法,可以在数据集中寻找与该样本除掉缺失属性最相近的样本,用相似的样本的属性值代替,求相似度可以采用聚类方法。

其次还有回归方法和插值法,回归方法及时建立回归模型,用已有的数据训练模型然后再预测。

插值法就有朗日插值法和牛顿插值法,这里就介绍一下拉格朗日插值法。

二、理论知识

下面是拉格朗日函数:
f(x)=∑i=1i=3yi∗∏i≠j1≤j≤3x−xjxi−xjf(x)=\sum_{i=1}^{i=3}y_i * \prod_{i\neq j}^{1\leq j \leq 3}\frac{x-x_j}{x_i-x_j} f(x)=i=1i=3yii=j1j3xixjxxj
如何得到这个函数的,分为下面几步:

三个点(x1,y1),(x2,y2),(x3,y3)(x_1,y_1),(x_2,y_2),(x_3,y_3)(x1,y1),(x2,y2),(x3,y3)可以确定一条二次多项式的函数。这需要把三个点带入多项式然后解出各个系数。

但是拉格朗日的这个解法就不一样了。

第一步构建了一个函数:
f1(x)=(x−x2)(x−x3)(x1−x2)(x1−x3)f_1(x)=\frac{(x-x_2)(x-x_3)}{(x_1-x_2)(x_1-x_3)} f1(x)=(x1x2)(x1x3)(xx2)(xx3)
这个函数在x=x1x=x_1x=x1时,值为1;x=x2x=x_2x=x2时,值为0;x=x3x=x_3x=x3时,值为0。

同理分别构建:
f2(x)=(x−x1)(x−x3)(x2−x1)(x2−x3)f_2(x)=\frac{(x-x_1)(x-x_3)}{(x_2-x_1)(x_2-x_3)} f2(x)=(x2x1)(x2x3)(xx1)(xx3)
这个函数在x=x2x=x_2x=x2时,值为1;x=x1x=x_1x=x1x=x3x=x_3x=x3时,值为0。
f3(x)=(x−x1)(x−x2)(x3−x1)(x3−x2)f_3(x)=\frac{(x-x_1)(x-x_2)}{(x_3-x_1)(x_3-x_2)} f3(x)=(x3x1)(x3x2)(xx1)(xx2)
这个函数在x=x3x=x_3x=x3时,值为1;在x=x1x=x_1x=x1x=x2x=x_2x=x2时,值为0。

那么f(x)f(x)f(x)就可以写为:
f(x)=y1f1(x)+y2f2(x)+y3f3(x)f(x)=y_1f_1(x)+y_2f_2(x)+y_3f_3(x) f(x)=y1f1(x)+y2f2(x)+y3f3(x)

写为:
fi(x)=∏i≠j1≤j≤3(x−xj)(xi−xj)f_i(x)=\prod_{i\neq j}^{1\leq j \leq 3}\frac{(x-x_j)}{(x_i-x_j)} fi(x)=i=j1j3(xixj)(xxj)

得到拉格朗日函数。

三、代码实现

from scipy.interpolate import lagrange
def lag_fill(df, i, k):r = 0 if (i - k) < 0 else (i - k)l = len(df.index) if (i + 1 + k) > len(df.index) else (i + 1 + k)y = df.loc[list(range(r, i)) + list(range(i + 1, l))]for j in y.index:if y.isnull().loc[j]:y.drop(index = j, inplace = True)x = y.indexlag = lagrange(x.values, y.values)return lag(i)
index = np.array(data['Age'][data['Age'].isnull()].index)
nums = []
for i in index:num = int(lag_fill(data['Age'], i, 5))nums.append(num)
df = data['Age'].copy()
index = np.array(df[df.isnull()].index) # 缺失值的索引
for i in range(len(index)):df.loc[index[i]] = nums[i]
df.isnull().sum()

结果为:

0

最后替换一下:

data['Age'] = df
data['Age'].isnull().sum()
http://www.mnyf.cn/news/33300.html

相关文章:

  • 如何将网站建设得更好百度关键词搜索引擎排名优化
  • 网站建设美化中期报告国外网站seo免费
  • 产品宣传短视频在线优化seo
  • 芜湖有没有网站建设公司吗济南网络优化网址
  • 网站设计网站建设网站制作seo的收费标准
  • b站推广网站mmm的推荐机制网站怎么做优化排名
  • 怎么删除织梦做的网站微信加人推码35一单
  • 四级a做爰片免费网站app引流推广方法
  • 海口网站建设公司网站关键词排名优化系统
  • 电商网站怎样优化重庆seo网络推广优化
  • 加若格网站做么样seo一键优化
  • 科技公司网站建设如何做好网络推广工作
  • 网上帮做一些小事赚零花钱的网站北京seo招聘信息
  • 最新被百度收录的网站360优化大师官方下载手机
  • iis7.5怎么做网站8个公开大数据网站
  • 杭州便宜的手机网站建设百度收录申请
  • 人才招聘网最新招聘网络优化培训
  • 梅陇做网站seo赚钱培训课程
  • 做落地页素材在什么网站上找天津seo网络营销
  • 浙江建设厅 继续教育 网站首页写软文推广
  • 四站合一网站建设个人推广平台
  • 营销型企业网站优化的作用百度点击率排名有效果吗
  • 怎们自己做网站哈尔滨百度推广联系人
  • 服务好的高端网站建设公司网络营销做得好的企业有哪些
  • 云空间可以做网站网站排行榜前十名
  • 电商网站设计公司力推亿企邦热点军事新闻
  • 兰州产品营销网站建设最近的新闻事件
  • 东乡做网站项目营销推广策划
  • 深圳做兼职的网站设计设计网站模板
  • 中山哪里有好网站建设公司seo高手培训