当前位置: 首页 > news >正文

教育门户网站系统建设方案营销外包公司

教育门户网站系统建设方案,营销外包公司,wordpress文章添加标签居中,网站做弹窗tag:评价指标,摘要,nlp Rouge(Recall-Oriented Understudy for Gisting Evaluation),是评估自动文摘以及机器翻译的一组指标。它通过将自动生成的摘要或翻译与一组参考摘要(通常是人工生成的)进行比较计算,得出相应的分值&#x…

tag:评价指标,摘要,nlp

Rouge(Recall-Oriented Understudy for Gisting Evaluation),是评估自动文摘以及机器翻译的一组指标。它通过将自动生成的摘要或翻译与一组参考摘要(通常是人工生成的)进行比较计算,得出相应的分值,以衡量自动生成的摘要或翻译与参考摘要之间的“相似度”。

rouge-N

指N-gram的个数

在中文中计算时,需要用空格将每个字分开(如同英文句子中每个单词之间的空格一样)

举个例子

from rouge import Rouge  
rouge = Rouge()  
title = '今天是星期四'  
pred_title = '今天是周四'  
pred_title2 = '周四是今天'  
print(rouge.get_scores(' '.join(list(pred_title)), ' '.join(list(title))))  # [{'rouge-1': {'r': 0.6666666666666666, 'p': 0.8, 'f': 0.7272727223140496}, 'rouge-2': {'r': 0.4, 'p': 0.5, 'f': 0.4444444395061729}, 'rouge-l': {'r': 0.6666666666666666, 'p': 0.8, 'f': 0.7272727223140496}}]print(rouge.get_scores(' '.join(list(pred_title2)), ' '.join(list(title))))
# [{'rouge-1': {'r': 0.6666666666666666, 'p': 0.8, 'f': 0.7272727223140496}, 'rouge-2': {'r': 0.2, 'p': 0.25, 'f': 0.22222221728395072}, 'rouge-l': {'r': 0.3333333333333333, 'p': 0.4, 'f': 0.36363635867768596}}]

rouge-1

指单个词的匹配度

  • 召回r=单个词重合数/len(title),即找到了多少个字,r=4(重合字为:今天是四)/6=0.67
  • 精准p=单个词重合数/len(pred_title),即找到的字里面有多少个是对的,p=4/5=0.8
  • f即为r和p的计算,f=(2PR)/(P+R)=0.737
  • 两个例子完全相同,不在乎顺序问题

rouge-2

指每两个字的匹配度

  • 召回r=每两个字的重合数/len(title),即找到了多少个字,r=2(今天、天是)/5(今天、天是、是星、星期、期四)=0.4;在title2时,r=1(今天)/5(今天、天是、是星、星期、期四)=0.2
  • 精准p=每两个字的重合数/len(pred_title),即找到的字里面有多少个是对的,p=2/4=0.5;在title2时,p=1(今天)/4(周四、四是、是今、今天)=0.25
  • f即为r和p的计算,f=(2PR)/(P+R)

rouge-L

LCS(longest common subsequence,最长公共子序列)的首字母,因为Rouge-L使用了最长公共子序列。但需要注意的是,这是考虑了顺序的最长公共子序列(因为这个顺序问题很多博客都没说困惑了好久)。

  • 召回r=3(今天是四)/len(title)=4/6;在title2时,r=2(今天)/6=1/3
  • 精准p=3(今天是四)/len(pred_title)=4/5;在title2时,r=2(今天)/5=0.4
  • f即为r和p的计算

优点:不要求词的连续匹配,只要求按词的出现顺序匹配即可,能够像n-gram一样反映句子级的词序。自动匹配最长公共子序列,不需要预先定义n-gram的长度。
缺点:只计算一个最长子序列,最终的值忽略了其他备选的最长子序列及较短子序列的影响。

看完这个例子就可以很清楚的了解到,如果预测出来的顺序一样,如title例子,此时rouge1=rouge-L;但到了title2时,由于考虑了顺序问题,此时最长公共子序列不再是“今天是四”而是“今天”,两个例子中rouge-1没有变化,但rouge2和rouge-L都发生了变化。

http://www.ritt.cn/news/14648.html

相关文章:

  • pc网站和app哪个容易做西安关键词seo公司
  • iis建设个人网站网站收录登录入口
  • 做建设网站的活的兼职系统优化软件
  • 中铁建发展集团有限公司seo tdk
  • 网站url建设网络推广平台都有哪些
  • 如何自己做网站的优化推广免费建站
  • 广州4a广告公司名单第三方关键词优化排名
  • 公司做网站 微信平台磁力链
  • 做网站的后台开发需要会些什么seo推广招聘
  • 建站公司怎么赚钱的北京全网营销推广
  • 佛山电子商务网站设计今日热点头条
  • 杭州滨江网站制作汽车网络营销策划方案
  • 国内网站是cn还是com网站排名优化快速
  • 厦门网站开发建设网店代运营可靠吗
  • 企业网站开发用什么seo经典案例分析
  • 深圳做网站案例网站制作400哪家好
  • 做网站的企业是什么行业外贸seo是什么意思
  • 怎么创建音乐网站东莞企业网站模板建站
  • 怎样做网站 网页seo课程培训班费用
  • 西安 做网站 499免费网络营销推广软件
  • 如何做做网站关键词搜索名词解释
  • 聚焦伟业网站怎么做推广互联网销售包括哪些
  • wordpress luceneseo岗位
  • dw软件个人简历网站怎么做软文营销成功案例
  • 做网站需不需要服务器注册网站平台要多少钱
  • 寮步网站建设昆山优化外包
  • 做室内装修设计的网站网站查询
  • 专业app网站建设哪家好今日头条新闻发布
  • 网站开发要求描述全国培训机构排名前十
  • 青岛网站建设青岛新思维百度关键词规划师入口