首页 游戏 软件 资讯 排行榜 专题
首页
AI
无脑使用NLP,第一弹:文摘生成,能直接用来做毕设的呦

无脑使用NLP,第一弹:文摘生成,能直接用来做毕设的呦

热心网友
91
转载
2025-07-20
文心·行业大模型的核心特色是“行业知识增强”,基于通用数据训练的文心大模型,加上挖掘行业应用场景中,大量存在的行业特色大数据和知识,进一步提升大模型对行业应用的适配性。在能源、金融领域,百度与国家电网、浦发银行联合研发了行业大模型。

无脑使用nlp,第一弹:文摘生成,能直接用来做毕设的呦 - 游乐网

零:文心大模型简介

5月20日,由深度学习技术与应用国家工程研究中心主办、飞桨承办的WAVE SUMMIT 2024深度学习开发者峰会线上举行。百度业界首发的文心·行业大模型成为峰会一大亮点。

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

lian合国网、浦发首发行业大模型,开启大模型进化新格局

文心·行业大模型的核心特色是“行业知识增强”,基于通用数据训练的文心大模型,加上挖掘行业应用场景中,大量存在的行业特色大数据和知识,进一步提升大模型对行业应用的适配性。在能源、金融领域,百度与国家电网、浦发银行联合研发了行业大模型。

能源电力行业,百度和国网研发了国网-百度·文心大模型。基于通用文心大模型,在海量数据中挖掘了电力行业数据,百度与国网专家们一起,引入电力业务积累的样本数据和特有知识,并且在训练中,结合双方在预训练算法和电力领域业务与算法的经验,设计电力领域实体判别、电力领域文档判别等算法作为预训练任务,让文心大模型深入学习电力专业知识,在国网场景任务应用效果提升。

一:文新大模型室应用——NLP文摘生成

1.1:什么是文摘生成?

自动文摘有两种解决方案:一种是抽取式(Extractive)的,就是从原文中提取一些关键的句子,组合成一篇摘要;另外一种是生成式(Abstractive)的,也是本文重点要讲的内容,这种方式需要计算机通读原文后,在理解整篇文章内容的基础上,使用简短连贯的语言将原文的主要内容表达出来,即会产生原文中没有出现的词和句子。

现阶段,抽取式的摘要目前已经相对成熟,但是抽取质量及内容流畅度都不够理想。随着深度学习的研究,生成式摘要的质量和流畅度都有很大提升,但目前也受到原文本长度过长、抽取内容不佳等限制,生成的摘要与人工摘要相比,还有相当的差距。

1.2:应用方式

1.2.1:使用PaddleNLP进行文摘生成

PaddleNLP中有使用Bart模型进行文摘生成的方式

BART是一种Seq2Seq结构的降噪自编码器,通过增加噪声来破环文本然后重建原文本来训练模型。它使用一个标准的Transformer结构,可以被看作泛化的BERT(由于是双向编码器),GPT(由于是从左到右解码器),和一些其他的预训练模型结构。

但是昨天我在使用Bart的 example时结果出现了一些问题没有搞成,并且你如果NLP基础,完成PaddleNLP中的example还是挺困难的,那么有没有什么比较简单的方式真正的让你一点不了解NLP也能完成文本生成任务呢

1.2.2:使用文心大模型ERNIE 3.0 Zeus 文本生成模型

ERNIE 3.0 Zeus 是全新发布的融合任务相关知识的千亿大模型,该模型大幅刷新各类 NLP 任务最好效果,在各类公开数据集及真实场景上零样本与小样本能力均取得显著提升。当前 API 为开发者提供大模型的探索和体验。

二:使用方式

2.1:获取access_token

access_token是你如果想自己搭建服务如果想去向文心大模型发送请求必须要准备的东西

调用API时必须在URL中带上access_token参数,获取Access Token的流程如下:

2.1.1:获取Access Token

请求URL数据格式

向授权服务地址 https://wenxin.baidu.com/younger/portal/api/oauth/token 发送请求(使用POST),并在URL中带上以下参数:

grant_type: 必须参数,固定为client_credentials;client_id: 必须参数,应用的API Key(AK) 从 https://wenxin.baidu.com/younger 调用专区申请;client_secret: 必须参数,应用的Secret Key(SK) 从 https://wenxin.baidu.com/younger 调用专区申请;

其中API Key与Secret Key可以在https://wenxin.baidu.com/younger/apiDetail?id=20006下拉到调用专区进行获取无脑使用NLP,第一弹:文摘生成,能直接用来做毕设的呦 - 游乐网

将API Key与Secret Key填入对应的位置中,并在终端输入

curl -i -k 'https://wenxin.baidu.com/younger/portal/api/oauth/token?grant_type=client_credentials&client_id={API Key}&client_secret={Secret Key}' -H 'Content-Type:application/x-www-form-urlencoded'
登录后复制

成功之后就会获取到access Token

2.2:摘要生成

2.2.1:傻瓜版本

直接把下段代码给copy然后运行就可以了

import requestsurl = "https://wenxin.baidu.com/younger/portal/api/rest/1.0/ernie/3.0/zeus"payload={    'access_token': '24.9991a77ac60c6e969e176b776f74b09e.86400000.1653006451543.499f8f33b6821ebbf9ba1fbea525d6ae-6',    'text': '19号,印度一些主流媒体发布消息称,汉语普通话被批准成为巴基斯坦最新语言!消息称,巴基斯坦参议院19号通过将汉语普通话作为最新语言的议案,如果普通话成为巴基斯坦最新语言,中巴关系会进一步深化, 两国人民在中巴经济走廊建设中的沟通也会变得更简单。到底是不是真消息呢?据记者了解,事实上,该决议只是提到鼓励学习中国最新语言,并没有提到汉语普通话要成为巴基斯坦的最新语言。文章标题是:',    'seq_len': 32,    'task_prompt': 'Summarization',    'dataset_prompt': '',    'topk': 1,    'stop_token': '》'    }response = requests.request("POST", url, data=payload)print(response.text)
登录后复制

2.2.2:详细介绍版本

首先必须要注意的是每个账户每日免费请求ERNIE 3.0 Zeus API服务的上限为200条输入,免费请求额度共2000条输入。如果您有更多请求需求,请联系:wenxin-younger@baidu.com

也就是说只要我们按照正式给的案例进行提交如果只是初级使用只需要将text中的内容进行修改即可

返回文本样例

{    "code": 0,     "msg": "success",    "data":         {            "result": "巴基斯坦参议院通过汉语普通话为最新语言议案"           }}
登录后复制

这是成功的样例, 下面是一些失败的样例

{"code":1,"msg":"access_token is invalid","data":null}{"code":4004,"msg":"service backend failed: 'save_infer_model/scale_0.tmp_0'","data":{"result":"null"}}
登录后复制

有的是access_token失效或不对,有的是因为请求太过频繁。

下面时具体的错误码分析

2.2.3:具体API参数

无脑使用NLP,第一弹:文摘生成,能直接用来做毕设的呦 - 游乐网

三:实例

In [39]
import requestsurl = "https://wenxin.baidu.com/younger/portal/api/rest/1.0/ernie/3.0/zeus"payload={    'access_token': '24.033a83fc578d4bfbf3f686b5ddde88c6.86400000.1654314522980.c266ed6c0f65dd3106e3c7e3924a2516-3008',    'text': '请给下面这段话写一句摘要:\" 19号,印度一些主流媒体发布消息称,汉语普通话被批准成为巴基斯坦最新语言!消息称,巴基斯坦参议院19号通过将汉语普通话作为最新语言的议案,如果普通话成为巴基斯坦最新语言,中巴关系会进一步深化, 两国人民在中巴经济走廊建设中的沟通也会变得更简单。到底是不是真消息呢?据记者了解,事实上,该决议只是提到鼓励学习中国最新语言,并没有提到汉语普通话要成为巴基斯坦的最新语言。\"',    'seq_len': 48,    'task_prompt': 'Summarization',    'dataset_prompt': '',        'topk': 1,    'stop_token': ''    }response = requests.request("POST", url, data=payload)print(response.text)
登录后复制
{"code":0,"msg":"","data":{"result":"汉语普通话成巴基斯坦最新语言?"}}
登录后复制
来源:https://www.php.cn/faq/1410163.html
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

苹果替多款第三方应用推送更新 功能未见变化 原因成谜
网络安全
苹果替多款第三方应用推送更新 功能未见变化 原因成谜

近日,有用户发现,苹果在未事先说明的情况下,为多款在 App Store 上架的第三方应用推送了来自苹果最新的更新,且涉及新旧应用,范围看似随机。然而,开发者并未对这些应用的代码进行任何修改,更新说

热心网友
04.07
联想YOGA AI迷你主机首销5499元:配Ultra 5 325U与DingOS系统
礼仪与书信
联想YOGA AI迷你主机首销5499元:配Ultra 5 325U与DingOS系统

快科技4月1日消息,联想YOGA AI Mini主机现已上市,搭载DingOS操作系统,售价5499元。该主机体积小巧,约0 65L,仅重600g,机身采用YOGA自然色系浅海贝配色,选用5系铝合金

热心网友
04.01
昆仑万维发布三大世界第一梯队AI模型
科技数码
昆仑万维发布三大世界第一梯队AI模型

据昆仑万维集团消息,3月27日下午,昆仑万维(300418 SZ)旗下天工AI顺利举办“世界模型前沿技术与天工AIGC全家桶大模型生态”专场发布会,携Matrix-Game 3 0、SkyReels

热心网友
03.27
小米移交MIUI维护,安全保障与补丁更新不受影响
科技数码
小米移交MIUI维护,安全保障与补丁更新不受影响

来源:环球网【环球网科技综合报道】3月27日消息,小米MIUI近日停更相关话题引发网友关注,小米澎湃OS最新微博就此作出回应,明确MIUI已完成系统交棒,未来将逐步退出维护,同时会持续为相关设备提供

热心网友
03.27
中科院启动新一代开源芯片研发,具身智能首项行业标准亮相
科技数码
中科院启动新一代开源芯片研发,具身智能首项行业标准亮相

《科创板日报》3月27日讯,今日科创板早报主要内容有:广州强化智能算力布局,支持以市场为主导的智能算力基础设施建设;中芯国际2025年净利润同比增长36%;华虹公司2025年净利润同比下降1 04%

热心网友
03.27

最新APP

宝宝过生日
宝宝过生日
应用辅助 04-07
台球世界
台球世界
体育竞技 04-07
解绳子
解绳子
休闲益智 04-07
骑兵冲突
骑兵冲突
棋牌策略 04-07
三国真龙传
三国真龙传
角色扮演 04-07

热门推荐

美国SEC主席Paul Atkins证实:加密货币安全港提案已送交白宫审查
web3.0
美国SEC主席Paul Atkins证实:加密货币安全港提案已送交白宫审查

加密货币行业翘首以盼的监管里程碑,终于有了实质性进展。美国证券交易委员会(SEC)主席保罗·阿特金斯(Paul Atkins)近日证实,那份允许加密项目在早期获得注册豁免权的“安全港”框架提案,已经正式送抵白宫,进入了最终审查阶段。 在范德堡大学与区块链协会联合举办的数字资产峰会上,阿特金斯透露了这

热心网友
04.08
微策略Strategy报告:第一季录得144.6亿美元浮亏 再斥资约3.3亿美元买进4871枚比特币
web3.0
微策略Strategy报告:第一季录得144.6亿美元浮亏 再斥资约3.3亿美元买进4871枚比特币

微策略Strategy报告:第一季录得144 6亿美元浮亏 再斥资约3 3亿美元买进4871枚比特币 市场震荡的威力有多大?看看Strategy的最新季报就明白了。根据其最新向美国证管会(SEC)提交的8-K报告,受市场剧烈波动影响,这家公司所持的比特币在第一季度录得了一笔惊人的数字——144 6亿

热心网友
04.08
稳定币发行商Tether再扩Web3版图!Paolo Ardoino:正开发去中心化搜索引擎Hypersearch
web3.0
稳定币发行商Tether再扩Web3版图!Paolo Ardoino:正开发去中心化搜索引擎Hypersearch

稳定币巨头Tether的动向,向来是加密世界的风向标。这不,它向Web3基础设施的版图扩张,又迈出了关键一步。公司执行长Paolo Ardoino在社交平台X上透露,其工程团队正在全力“烹制”一个新项目——去中心化搜索引擎 “Hypersearch”。这个消息一出,立刻引发了行业的广泛猜想。 采用D

热心网友
04.08
Base链首个原生DeFi借贷协议Seamless Protocol倒闭 将于2026年6月30日下线
web3.0
Base链首个原生DeFi借贷协议Seamless Protocol倒闭 将于2026年6月30日下线

基地位于Coinbase旗下以太坊Layer2网络Base的Seamless Protocol,日前正式宣告了服务的终结。这个曾经吸引了超过20万用户的原生DeFi借贷协议,在运营不到三年后,终究没能跑赢时间。它主打的核心产品是Integrated Leverage Markets(ILMs)——一

热心网友
04.08
PAAL代币如何参与治理?社区投票能决定哪些事项?
web3.0
PAAL代币如何参与治理?社区投票能决定哪些事项?

PAAL代币揭秘:深度解析Web3社区治理的核心钥匙 在去中心化自治组织的浪潮中,谁真正掌握了项目的话语权?PAAL代币提供了一套系统化的答案。它不仅是生态内流转的价值媒介,更是开启链上治理大门的核心凭证。通过持有并质押PAAL代币,用户能够对协议升级、资金分配乃至战略方向等关键事务投出决定性的一票

热心网友
04.08