游乐游手机版
首页/手机教程/文章详情

AI网络爬虫:用deepseek提取百度文心一言的智能体数据

时间:2025-04-22 19:01
真实网址:https: www php cn link becbba75f70a129327afa2d6dfc4a1ac返回的json数据:{ "errno ": 0, "msg ":

ai网络爬虫:用deepseek提取百度文心一言的智能体数据真实网址:https://www.php.cn/link/becbba75f70a129327afa2d6dfc4a1ac

返回的json数据:{

"errno": 0,

"msg": "success",

"data": {

"total": 36,

"pageNo": 1,

"pageSize": 36,

"plugins": [

{

"name": "零基础学习路径规划",

"description": "你好,请你给出一个主题,我将给你一份完整的学习路径规划",

"logoUrl": "https://www.php.cn/link/e23909d8468ff4942ccea268fbbcafd1",

"logoText": {

"bgImage": "",

"labelValue": "1",

"color": 0,

"labelType": 2

},

"previewUrl": "https://www.php.cn/link/1b81139cc390ee1ce67042addf1d32cd",

"appId": "UjRqa5SBZzwvbRH8I06qp19H6OZdzjCR",

"pluginSource": 3,

"useNum": "786492",

"buildType": 1,

"isOwner": null,

"packageStatus": 6,

"dialogueCount": "2030481",

"developerName": "好想出去玩2020",

"isFavorited": false

},

deepseek中输入提示词:

你是一个Python编程专家,完成一个Python脚本编写的任务,具体步骤如下:

在F盘新建一个Excel文件:baiduaiagent20240619.xlsx

请求网址:

https://www.php.cn/link/becbba75f70a129327afa2d6dfc4a1ac请求方法:

GET

状态代码:

200 OK

获取网页的响应,这是一个嵌套的json数据;

获取json数据中"data"键的值,然后获取其中"plugins"键的值,这是一个json数据,提取这个json数据中所有的键写入Excel文件的表头 ,提取这个json数据中所有键对应的值写入Excel文件的列 ;

保存Excel文件;

注意:每一步都输出信息到屏幕;

每爬取1页数据后暂停5-9秒;

需要对 JSON 数据进行预处理,将嵌套的字典和列表转换成适合写入 Excel 的格式,比如将嵌套的字典转换为字符串;

在较新的Pandas版本中,append方法已被弃用。我们应该使用pd.concat来代替。

源代码:

import requestsimport pandas as pdimport timeimport json

请求URL

url = "https://www.php.cn/link/becbba75f70a129327afa2d6dfc4a1ac"

请求头

headers = {"User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/125.0.0.0 Safari/537.36"}

创建Excel文件

file_path = "F:/baiduaiagent20240619.xlsx"df = pd.DataFrame()

发送GET请求

response = requests.get(url, headers=headers)if response.status_code == 200:data = response.json()products = data['data']['plugins']

# 提取所有产品的键作为表头headers = set()for product in products:    headers.update(product.keys())# 创建DataFrame并填充数据for product in products:    product_data = {header: json.dumps(product.get(header, ''), ensure_ascii=False) if isinstance(product.get(header), (dict, list)) else product.get(header, '') for header in headers}    new_data = pd.DataFrame([product_data])    df = pd.concat([df, new_data], ignore_index=True)print("Data processed.")
登录后复制

else:print(f"Failed to retrieve data. Status code: {response.status_code}")

保存Excel文件

df.to_excel(file_path, index=False)print(f"Data saved to {file_path}")

暂停5-9秒

time.sleep(5 + (time.time() % 5))

AI网络爬虫:用deepseek提取百度文心一言的智能体数据

来源:https://www.php.cn/faq/1286124.html
上一篇gogogo出发喽是什么梗 抖音gogogo出发喽的意思出处解释 下一篇excel如何设置选项按钮?excel中设置选项按钮的方法
本站内容用于信息整理与展示,如有侵权或内容问题请及时联系处理。

相关推荐

补充同频道和同主题内容,方便继续浏览更多相关内容。

同类最新

继续查看同栏目最近更新的文章。

更多
OTA更新和iTunes升级哪个更危险?两者风险区别详解
手机教程 · 2026-07-02

OTA更新和iTunes升级哪个更危险?两者风险区别详解

每次 iOS 大版本更新,总能在社交平台上看到不少用户集体吐槽:直接 OTA 升级后出现白苹果,进度条卡住一动不动,好几个小时过去都没反应。最后别无他法,只能把设备连上电脑,用 iTunes 或者爱思助手重新刷机,一刷完虽然能开机,但之前所有资料也全部被清空。 那么问题来了:为什么直接用手机 OTA

苹果iPhone 11 Pro 买64GB还是256GB版本 对比分析哪个更值得购买
手机教程 · 2026-07-02

苹果iPhone 11 Pro 买64GB还是256GB版本 对比分析哪个更值得购买

你有没有注意到,今年发布的iPhone 11 Pro,起步是64GB,跳过了128GB,直接到了256GB?64GB版本售价8699元,而256GB版本却要9999元,两者差价高达1300元。 坦白讲,iPhone 11 Pro的价格本来就高,预算充足的人直接拿下256GB没毛病。但对于普通用户来说

iOS 13更新后删除应用程序的三种方法完整攻略
手机教程 · 2026-07-02

iOS 13更新后删除应用程序的三种方法完整攻略

升级到 iOS 13 及更新版本后,深色模式、优化电池充电等功能确实很实用,但许多用户却发现——怎么连卸载应用都找不到入口了?其实功能并未改变,只是交互逻辑悄悄调整了。下面分享三种亲测有效的 iOS 13 删除 App 方法,帮你快速搞定。 长按图标,需要足够耐心 在 iOS 13 及更新系统中,长

一文读懂OTA升级与使用电脑升级的详细区别
手机教程 · 2026-07-02

一文读懂OTA升级与使用电脑升级的详细区别

长期以来,不少用户都在纠结一个看似简单却至关重要的问题:升级iOS系统时,究竟该选择OTA在线升级,还是下载固件连接电脑升级?这两种方式到底有什么区别?先给出一个核心结论:OTA虽然便捷,但在稳定性上远不如电脑升级。根本原因要从它们的底层原理说起。OTA是“Over the Air Technolo

旧款iOS设备升级最新系统必要性与原因详解
手机教程 · 2026-07-02

旧款iOS设备升级最新系统必要性与原因详解

苹果称11月3日起,旧款iPhone iPad若不更新系统,GPS、时间日期失效。涉及iPhone5及更早、iPad4及更早,需升级至iOS10 3 4或9 3 6。过期后只能通过iTunes更新。