当前位置: 首页 > news >正文

个人网站建设 优帮云百度热度榜搜索趋势

个人网站建设 优帮云,百度热度榜搜索趋势,宁波市城乡建设委员会的网站,做外贸收费的服装网站学习自https://www.bilibili.com/video/BV1J441137V6 RNN,CNN网络的缺点 难以平行化处理,比如我们要算b4b^4b4,我们需要一次将a1a^1a1~a4a^4a4依次进行放入网络中进行计算。 于是有人提出用CNN代替RNN 三角形表示输入,b1b^1b1的…

学习自https://www.bilibili.com/video/BV1J441137V6

RNN,CNN网络的缺点

在这里插入图片描述

难以平行化处理,比如我们要算b4b^4b4,我们需要一次将a1a^1a1~a4a^4a4依次进行放入网络中进行计算。

于是有人提出用CNN代替RNN
在这里插入图片描述
三角形表示输入,b1b^1b1的结果是由a1,a2a^1,a^2a1,a2产生。
a1a^1a1~a4a^4a4可以同时并行输入到CNN中。
但是,这么做的话可以表示的内容非常有限,解决方法是再往上继续建造。
在这里插入图片描述
这样的话,蓝色的输入,就相当于获得了a1a^1a1~a4a^4a4的输入。
CNN的优点就是可以同时计算,缺点就是需要叠很多层

self-Attention层

self-Attention层要做的就是,既能达到RNN的功能,同时又能像CNN一样平行化。
在这里插入图片描述
在这里插入图片描述

self-attention层运作步骤

  • 拿每个q与每个k进行attention运算
    在这里插入图片描述
    dddq,kq,kq,k的维度,这个可以理解为是为了平衡维度带来的影响,因为维度越大,点乘出来的结果就会相应的较大,所以除以维度可以消除一部分影响。
  • 然后再统一做一下softmax
    在这里插入图片描述
    在这里插入图片描述
  • 随后a^\hat{a}a^再和vvv相乘
    在这里插入图片描述
    在这里插入图片描述
    这样,计算b1b^1b1既可以并行计算,也能获取到x1x^1x1~x4x^4x4的全部数据。

如何并行化
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
可以把上一层的内容统统放入到矩阵中,进行一次矩阵乘法即可算出下一层。而矩阵乘法可以用GPU加速。

在这里插入图片描述
q,k,vq,k,vq,k,v也是可以用多层的。

Position Encoding

在这里插入图片描述
实际上,xxx序列的位置信息是不重要的,因为每个位置都有一个独一无二的eie^iei向量与它相加,依次来表示位置信息。这个eie^iei不是从数据中学到的,而是人为赋值的。

Sequence To Sequence

在这里插入图片描述
在Sequence To Sequence模型中,就可以用self-Attention层来代替RNN或者CNN。

Transformer

在这里插入图片描述

http://www.ritt.cn/news/1370.html

相关文章:

  • 中山建设企业网站夫唯seo教程
  • 天津建站费用成都网站制作费用
  • 自己做的网站怎么传入外网有域名了怎么建立网站
  • 网页制作css网站seo优化排名
  • 电商类网站开发经典软文广告
  • 网站设计文档最新腾讯新闻
  • 河南省建设协会网站河南推广网站的公司
  • top wang域名做网站好找关键词的方法与技巧
  • 网上设计接单的网站搜索引擎优化的具体操作
  • 全国法院网站群建设会注册推广赚钱一个10元
  • 建立站点的作用长沙哪家网络公司做网站好
  • asp.net网站开发技术百度关键词竞价和收费的方法
  • 运营网站是多少关键词怎么优化
  • 网站怎么做小程序网上宣传方法有哪些
  • 好看简洁的logo黄山seo公司
  • wordpress 二栏seo推广费用
  • 网页广告素材seo营销优化
  • 工厂 电商网站建设百度seo是什么意思呢
  • 自适应的网站2024免费网站推广大全
  • 美国有个网站专门做sm站长友情链接
  • 网站建设哪家技术好重庆百度总代理
  • 网站建设学习网建站的公司
  • refrakt wordpress东莞seo技术培训
  • 黑客网站网址大全长沙百度关键词排名
  • 上海做网站报价自助建站系统
  • 企业网站包含内容软件优化
  • 网站地图生成国际新闻视频
  • 承德建设厅网站一手项目对接app平台
  • 随州网站建设哪家优惠网络推广培训去哪里好
  • 聊城做网站比较不错的公司外贸接单平台