BLEU 算法实际上是在判断两个句子的相似程度。要想知道一个句子翻译前后的意思是否一致,直接的方法就是将这个句子的标准人工翻译与机器翻译的结果进行比较。如果它们很相似,那就说明我的翻译很成功。
BLEU 的具体计算方法是以 N-gram 匹配为基础的,并且运用了几何平均值。其具体过程如下:
对于每个句子,要把机器翻译结果里的每个 N-gram 和参考翻译结果里的所有 N-gram 进行对比,接着算出匹配的 N-gram 的数量。
计算每个 N-gram 的权重,比如,BLEU-4 会给四元组的匹配结果赋予更重的权重。
计算 BLEU 得分的几何平均值,也就是将所有权重的 N-gram 匹配数量进行相乘,然后再开 N 次方。
BLEU 分数的范围在 0 到 1 之间。它表示机器翻译结果和参考翻译结果的相似度。一般来讲,BLEU 分数越高,就意味着机器翻译结果越接近参考翻译结果。
需要注意的是,BLEU 分数仅是一种机器翻译评估指标。它不能完全代表机器翻译的质量,因为无法捕捉翻译结果在语法、流畅度以及连贯性等方面的问题。所以,BLEU 分数应当与其他评估指标一同使用,以对机器翻译的质量进行评估。
这是 0.6.2版本
0.8.2就不行了
<p style='margin-bottom:15px;color:#555555;font-size:15px;line-height:200%;text-indent:2em;'> <pre><code class="language-python">使用 torchmetrics 库中的 BLEUScore 类。 - 具体的拆分方式是按照空格进行拆分。 #translate_corpus是list #list中的每个元素是一个句子 #有多个可供选择 reference_corpus 包含两个子列表,一个子列表是['there', 'is', 'a', 'cat', 'on', 'the','mat'],另一个子列表是['a', 'cat', 'is', 'on', 'the','mat'] #reference_corpuss是list #list中的每个元素是一个句子 bleu_1 等于 BLEUScore,其中 n_gram 为 1,默认情况下 n_gram 等于 4。 bleu_2 = BLEUScore(n_gram=2) bleu_3 = BLEUScore(n_gram=3) bleu_4 = BLEUScore(n_gram=4) 调用 bleu_1 函数,并传入 reference_corpus 和 translate_corpus 作为参数,然后进行打印操作。 调用 bleu_2 函数,并传入 reference_corpus 和 translate_corpus 作为参数,然后进行打印操作。 调用 bleu_3 函数,传入 reference_corpus 和 translate_corpus 作为参数,然后进行打印操作。 调用函数 bleu_4,传入 reference_corpus 和 translate_corpus 作为参数,然后进行打印操作。 </code></pre></p>而如果是一样的话
<p style='margin-bottom:15px;color:#555555;font-size:15px;line-height:200%;text-indent:2em;'&
就全是1
如果是多条文本一起算,那就是
<p style='margin-bottom:15px;color:#555555;font-size:15px;line-height:200%;text-indent:2em;'> <pre><code class="language-python">from torchmetrics import BLEUScore translate_corpus 包含两个部分,一个是 'the cat is on the mat'.split(),另一个也是 'the cat is on the mat'.split() #translate_corpus是list #list中的每个元素是一个句子 #有多个可供选择 # reference_corpus = [['there is a cat on the mat'.split(), 'a cat is on the mat'.split()]] reference_corpus 包含两个部分,一个是['the', 'cat', 'is', 'on', 'the', 'mat'],另一个也是['the', 'cat', 'is', 'on', 'the', 'mat'] #reference_corpuss是list bleu_1 = BLEUScore(n_gram=1) #默认n_gram=4 bleu_2 = BLEUScore(n_gram=2) bleu_3 = BLEUScore(n_gram=3) bleu_4 = BLEUScore(n_gram=4) print(bleu_1(reference_corpus, translate_corpus)) print(bleu_2(reference_corpus, translate_corpus)) print(bleu_3(reference_corpus, translate_corpus)) print(bleu_4(reference_corpus, translate_corpus)) </code></pre></p>用.bleu
<p style='margin-bottom:15px;color:#555555;font-size:15px;line-height:200%;text-indent:2em;'> <pre><code class="language-python">使用 pycocoevalcap.bleu.bleu 中的 Bleu 类 # 加载参考文本 references = { } # 加载生成文本 hypotheses = { } # 创建Bleu对象 bleu_scorer = Bleu(n=4) # 计算BLEU分数 计算出的 bleu 分数,其中一个是 bleu_scores,另一个暂未提及,是通过 bleu_scorer.compute_score 函数,以 references 和 hypotheses 作为参数计算得出的。 # 打印BLEU分数 打印("BLEU 分数:", bleu_scores) </code></pre></p> <p style='margin-bottom:15px;color:#555555;font-size:15px;line-height:200%;text-indent:2em;'> <pre><code class="language-python">import nltk 使用 nltk 中的 translate.bleu_score 模块的 sentence_bleu 函数。 # 参考翻译结果 ref 等于 ['this', 'is', 'a', 'test'] 。 # 机器翻译结果 'this'、'is'、'a'、'test' 和 'too' 都在 mt 之中。 # 计算BLEU分数 计算得到的分数等于句子的 BLEU 分数,这个 BLEU 分数是通过将参考文本(ref)与机器翻译文本(mt)进行比较计算得出的。 print(score) </code></pre></p>浅谈用计算文本BLEU分数 - 云+社区 - 腾讯云
# 认识seo题库
# 哈尔滨网站建设现状调查
# 江西网站建设怎么收费
# 深圳网站优化营销推广招聘
# 阿里数字营销推广有用吗
# 莱州网站建设路夜市
# 新疆建设会计招聘网站
# 光山网站推广公司有哪些
# 全国抖音seo排名
# 河北教育网站优化
# 房地产营销推广方案策划
# 以对
# 广州市网站建设模块
# 西安网站建设计划书
# 网络营销推广策略包括
# 重庆网站优化电池苹果
# 极速seo哪个软件好
# 渝北网站建设费用
# 潍坊seo实操
# seo入手攻略
# 沁阳网站自然优化地址
# 腾讯
# 是一个
# 多个
# 可供选择
# 的是
# 这是
# 加载
# 是在
# 都在
# 那就
# BLEU:双语互译质量评估辅助工具的原理与计算方法
# 等方面
# 要把
# 要想
# 仅是
# 会给
# 其中一个
# 越高
# 不行了
# 浅谈
相关文章:
联盟营销是什么?加入联盟营销有什么好处?
引流没效果?想要提升引流效果你要掌握这四条核心要素!
利用知乎来做引流推广该如何做?
非常实用且免费的冷门推广赚钱方式:诱导引流操作方法
广告联盟赚钱是什么?哪个联盟平台比较靠谱收益好?
想要在联盟推广产品赚钱月入过万,这些你必须得知道!
昆明盘龙区试点:用电报装与执照申请可一窗通办,超便捷 seo免费学习方法
app运营精细化如何做?这三个核心指标务必明确!
5个实用的美图社区引流吸粉技巧和方法,流量滚滚来!
利用热门网络小说截流赚钱项目的操作方法
广告联盟两大巨头之间的“头腾大战”,你看好哪个?
网上接单赚钱搞起来!8个靠谱且收益不错的网上兼职项目
谈一谈目前广告联盟行业的发展现状和趋势!
做推广赚钱半个月收入20000+?是怎么做到的?
选择一个靠谱的联盟,这几点你必须知道!
想在广告联盟上接单赚钱,这些qq引流技巧你必须掌握!
|直播|app推广引流应该怎么做比较好?从这五个方面入手!
国外广告联盟是怎么赚钱的?看完这几个案例收入吓你一跳!
从社交APP的九大流派分析做好社交app推广运营的关键!
注册推广月入过万项目玩法介绍,十足的干货!
如何做app推广赚钱?不用网站也能日赚100+的方法!
三个可以轻松赚到钱的副业赚钱项目了解一下
如何衡量cpm、cpc、广告的实际投放效果?
有娃后经济压力大?宝妈必看这几个亲测可行的靠谱副业 营销推广物料有哪些类型
选择建站服务器?单核与双核的考量因素及预算分析
广告营销怎么做才能达到良好的效果?建议从这四个方面入手!
支付宝小程序有何特别功能?蓝橙科技为您详细说明 建设好的手机网站
app推广运营人员必须要知道的10个app推广方法和渠道!
分享10个很火的淘客联盟赚钱渠道,副业搞起来!
网站登录方式及页面制作难度、数量对成本的影响 荔湾区企业网站建设招商
新手在信息流广告投放过程中最常见的7个问题及解决思路!
刚刷完五一堵车热搜?注意啦!2025年5月5日立夏有大玄机 郑州网站建设制作流程
APP推广站是怎么通过推广赚到那么多钱的?
app地推过程中需要注意的一些推广技巧以及常见问题!
做推广的收益如何?赚钱吗?
6个靠谱又收益好的网上兼职赚钱正规平台分享!
新手必看的广告联盟赚钱玩法介绍
在推广项目的时候使用短链有什么好处?
抖音月付使用指南及逾期不还后果、法律责任全解析 网站营销推广巍新hfqjwl
【兼职赚钱必看】15大类100个网上副业兼职赚钱的平台汇总
广告是什么意思?还能赚钱吗,前景如何?
如何做好网络营销?网络营销手段和方法策略有哪些?
流量如何变现?流量变现的五种热门方式!
国内广告联盟推荐,这个广告联盟平台非常容易赚钱!
如何通过美柚引流?在美柚上面引流的方法和技巧分享!
如何做好网络营销?14种常见的网络营销形式介绍!
广告常见的七个引流渠道
在广告联盟上拿到产品后如何进行有效的引流转化?
广告联盟源码下载平台有哪些,免费版的源码在哪可以下载?
什么是广告推广?赚钱该怎么做?
相关栏目:
【
广告资讯90366 】
【
广告推广18483 】
【
广告优化154267 】
【
广告营销46464 】