当前位置: 首页 > news >正文

服装类的网站建设山西seo优化公司

服装类的网站建设,山西seo优化公司,蜂聘360挂靠建筑网,wordpress鼠标点击跟随我们在前面介绍的跳字模型与连续词袋模型有个缺陷就是在计算梯度时的开销随着词典增大会变得很大,因为每一步的梯度计算都包含词典大小数目的项的累加。为了降低这种带来的计算复杂度,介绍两种近似的处理方案:负采样和层序softmax负采样(Nega…

我们在前面介绍的跳字模型与连续词袋模型有个缺陷就是在计算梯度时的开销随着词典增大会变得很大,因为每一步的梯度计算都包含词典大小数目的项的累加。为了降低这种带来的计算复杂度,介绍两种近似的处理方案:负采样和层序softmax

负采样(Negative Sampling)

我们回顾下跳字模型给定中心词生成背景词的条件概率:

该条件概率相应的对数损失如下表示:

可以看到softmax运算考虑了背景词可能是词典V中的任一词,以上损失包含了词典大小数目的项的累加,复杂度大,于是出现新的方法来降低复杂度。

负采样修改了原来的目标函数,给定中心词的一个背景窗口,我们把背景词出现在该窗口当作一个事件,该事件的概率计算为:

其中的σ是sigmoid激活函数:

我们先考虑最大化文本序列中所有该事件的联合概率来训练词向量。具体来说,给定一个长度为T的文本序列,时间步t的词为且背景窗口大小为m,最大化联合概率:

然后,这里的模型中包含的事件仅考虑了正样本,这导致当所有词向量相等且值为无穷大时,上述联合概率才被最大化为1,很明显,这样的词向量毫无意义。负采样通过采样并添加负类样本使目标函数更有意义。

设背景词出现在中心词的一个背景窗口为事件P,我们根据分布P(w)采样K个未出现在该背景窗口的词,即噪声词。设噪声词(k=1,...,K)不出现在中心词的该背景窗口为事件。假设同时含有正类样本和负类样本的事件P,,...,相互独立,负采样将以上需要最大化的仅考虑正类样本的联合概率改写为:

其中条件概率被近似表示为:

设文本序列中时间步t的词在词典中的索引为i_t,噪声词w_k在词典中的索引为h_k,有关以上条件概率的对数损失为:

现在的训练中每步的梯度计算开销就不再跟词典大小有关,而跟K线性相关。所以当K较小时,负采样每步的梯度计算开销较小。

最后两步的推导,使用sigmoid激活函数验证下,是等价的

import numpy as np
np.log(sigmoid(-np.array([0.2,0.4,-0.8])))
np.log(1-sigmoid(np.array([0.2,0.4,-0.8])))
#array([-0.79813887, -0.91301525, -0.37110067])

层序softmax

另一种近似训练法,就是层序softmax,使用的是二叉树这样的数据结构,树的每个叶节点代表词典V中的每个词

假设L(w)为从二叉树的根节点到词w的叶节点的路径(包括根节点和叶节点)上的结点数。设n(w,j)为该路径上第j个结点,并设该节点的背景词向量为,画图来看下:

层序softmax将跳字模型中的条件概率近似表示为:

其中leftChild(n)表示结点n是否是左子节点,如果是的话就是1,反之为-1

这里我们来计算下从给定词生成词的条件概率(方向经过左->右->左),我们需要将的词向量和根节点到路径上的非叶节点向量一一求内积。

由于 ,给定中心词生成词典V中任一词的条件概率之和为1这一条件也满足

此外,由于L()-1的数量级为O(),当词典V很大时,层序softmax训练中每一步的梯度计算开销相较未使用近似训练时大幅降低。

http://www.mnyf.cn/news/52400.html

相关文章:

  • 企业邮箱服务杭州seook优屏网络
  • 沂水网站建设百度一下网页搜索
  • 自建服务器做网站在百度如何发布作品
  • 网站建设项目安排计划表职业培训学校加盟
  • 做单页网站容易排名吗网络宣传推广方案
  • 文学网站模板企业seo排名优化
  • 国外做农产品有名的网站有哪些推广普通话手抄报简单又好看
  • 什么网站做调查能赚钱seo百度排名优化
  • 做服务型党员网站排名优化
  • 网站如何做单项链接厦门seo总部电话
  • 云阳网站制作网络渠道有哪些
  • asp.net做网站系统百度账号注册中心
  • php笔记网站小璇seo优化网站
  • 江苏建设委员会网站刷关键词排名seo软件
  • 湖北省精神文明建设委员会网站企业营销策划书
  • 网站上的彩票走势图是怎么做的百度竞价ocpc投放策略
  • 新手如何自己建网站安卓优化大师下载
  • 昆明做网站的野狼seo团队
  • 网站制作策划方案seo优化排名百度教程
  • 集团网站建设要多少钱网络营销学什么内容
  • 建站知乎公司网站模板
  • wordpress修改成中文广州seo快速排名
  • 成都 网站设计站长之家
  • 有没有专门做美食海报的网站百度关键词优化排名
  • 长沙网页制作模板的网站网站页面优化方案
  • 做网站logo用啥软件百度知道合伙人官网
  • 找做网站appseo排名点击手机
  • 海南省住房和城乡建设厅官网网站朝阳网站建设公司
  • sae wordpress 媒体库seo在线优化技术
  • 河南建设监理协会广州seo优化推广