游乐游手机版
首页/手机教程/文章详情

过瘾:让deepseek肝分析数据!

时间:2025-04-23 21:01
本文详细展示了如何借助deepseek工具高效完成数据分析。从国家统计局下载了近12年的全国居民主要食品消费数据,数据准备好后,我们开始利用deepseek辅助进行数据分析。第一步

本文详细展示了如何借助deepseek工具高效完成数据分析。从国家统计局下载了近12年的全国居民主要食品消费数据,数据准备好后,我们开始利用deepseek辅助进行数据分析。

过瘾:让deepseek肝分析数据!

第一步:转换数据格式

我们首先需要将data.txt中的数据转换成Python的数据框格式。以下是推荐的Python代码:

import pandas as pd

数据加载(自动适配中文列名)

df = pd.read_csv('AI帮你分析数据/data.txt', sep='\t', encoding='utf-8')

按时间正序排列(原数据为倒序)

df = df.sort_values('时间', ascending=True).reset_index(drop=True)

数据框展示(保留1位小数)

with pd.option_context('display.unicode.east_asian_width', True, 'display.float_format', '{:.1f}'.format):print("居民食品消费数据(2014-2023)")print(df.to_string(index=False))

登录后复制

第二步:逐步分析数据

接下来,我们使用Python对数据框df进行深入分析。以下是基于数据框df的进阶分析代码和关键发现。我们将从趋势分析、相关性分析和异常值检测三个维度展开:

趋势分析
import matplotlib.pyplot as plt

设置可视化样式

plt.style.use('seaborn')fig, axes = plt.subplots(3, 1, figsize=(12, 15))

核心增长品类趋势

df.plot(x='时间', y=['居民人均鲜瓜果消费量(千克)', '居民人均蛋类消费量(千克)'], ax=axes[0], marker='o', title="高增长品类趋势")

波动品类趋势

df.plot(x='时间', y=['居民人均粮食消费量(千克)', '居民人均肉类消费量(千克)'], ax=axes[1], linestyle='--', marker='x', title="波动品类趋势")

稳定品类趋势

df.plot(x='时间', y=['居民人均食糖消费量(千克)', '居民人均食用油消费量(千克)'], ax=axes[2], color=['#999999','#666666'], title="稳定品类趋势")

plt.tight_layout()plt.show()

登录后复制

关键发现:

鲜瓜果与蛋类呈现指数增长特征,2023年增速加快。粮食消费呈现周期性波动(可能与价格政策相关)。食糖消费量保持超稳态(10年标准差仅0.03)。

过瘾:让deepseek肝分析数据!

相关性分析
import seaborn as sns

计算相关系数矩阵

corr_matrix = df.iloc[:, 1:].corr()

绘制热力图

plt.figure(figsize=(10, 8))sns.heatmap(corr_matrix, annot=True, cmap='coolwarm', fmt=".2f", annot_kws={'size':9}, linewidths=0.5)plt.title('食品消费量相关性矩阵')plt.show()

登录后复制

关键发现:

鲜瓜果与蔬菜强正相关(r=0.91),形成健康饮食组合。肉类与粮食消费负相关(r=-0.65),反映主食替代效应。蛋类与奶类无显著相关(r=0.12),说明蛋白质来源分化。

过瘾:让deepseek肝分析数据!

异常值检测
from scipy import stats

使用Z-score检测异常值

def detect_outliers(col):z = stats.zscore(df[col])return df[(abs(z) > 2)]

检测各列异常

outliers = {}for col in df.columns[1:]:ol = detect_outliers(col)if not ol.empty:outliers[col] = ol

输出异常记录

print("异常值检测结果:")for col, data in outliers.items():print(f"\n{col}异常:")display(data[['时间', col]])

登录后复制

关键发现:

肉类消费:2023年值(39.8)Z-score=2.1(受消费复苏影响)。奶类消费:2021年值(14.4)Z-score=2.3(可能统计口径变化)。

第三步:更具高级建议,进一步深入分析

使用PCA分析饮食结构变迁

# 主成分计算
登录后复制

过瘾:让deepseek肝分析数据!

关键结论健康化进程加速:PC1从2014年-1.2 → 2023年+2.1,显示健康饮食趋势不可逆。驱动因素:鲜瓜果(+0.92)、蔬菜(+0.85)强正载荷。蛋白替代拐点:2020年PC2骤降(肉类消费低谷),2023年回升(新型蛋白消费)反映动物蛋白消费波动与替代品探索。结构转型阶段:

  • 2014-2018:缓慢转型期(PC1年均+0.3)。
  • 2019-2023:加速转型期(PC1年均+0.6)。
登录后复制

过瘾:让deepseek肝分析数据!

对鲜瓜果使用ARIMA进行5年预测(选择瓜果的原因是其显著的增长趋势和健康饮食趋势的代表性)

# 此处省去代码块,直接上预测结果关键结论增长持续性:预测2028年达82.7千克,较2023年增长36%,年均增速约6.2%(略高于历史5.2%)。模型验证:残差Ljung-Box检验p值=0.32(白噪声),AIC=36.5(对比ARIMA(0,1,1)=38.7更优)。
登录后复制

过瘾:让deepseek肝分析数据!

通过这套操作,仅需30分钟便可完成复杂的数据分析,真是令人感叹:望AI之项背。

来源:https://www.php.cn/faq/1287315.html
上一篇千牛创建子账号教程 下一篇当开源创新遇上推理革命:SGLang如何炼就DeepSeek最强开源推理引擎?
本站内容用于信息整理与展示,如有侵权或内容问题请及时联系处理。

相关推荐

补充同频道和同主题内容,方便继续浏览更多相关内容。

同类最新

继续查看同栏目最近更新的文章。

更多
PixPix首发HappyHorse 1.1开启电商视频内容新起点
手机教程 · 2026-07-04

PixPix首发HappyHorse 1.1开启电商视频内容新起点

阿里巴巴推出HappyHorse 1 1之后,行业内关于AI视频生成的讨论热度持续走高。PixPix作为领先的电商AI内容平台,反应非常迅速——第一时间完成了集成,成为首批支持这款新模型的平台之一。 你无需专门前往阿里官网单独注册,也无需费力适应全新的操作界面。打开PixPix,直接就能上手使用。

OpenToonz导出视频无声问题?参数设置与修复指南
手机教程 · 2026-07-04

OpenToonz导出视频无声问题?参数设置与修复指南

OpenToonz导出MP4无声音,通常因时间线音频轨道喇叭图标未启用或输出设置中“包含音频”未勾选。需手动勾选并检查音频格式兼容性,建议使用PCM编码WAV文件并统一采样率(如48000Hz),同时确保导出路径有写入权限。

飞书多维表格创建方法及高级应用技巧全解析
手机教程 · 2026-07-04

飞书多维表格创建方法及高级应用技巧全解析

在飞书中创建多维表格可通过三种方式:新建空白表格并自定义字段类型、使用AI自动生成具有关联关系的多张数据表、导入本地Excel文件并指定字段类型。字段类型保存后不可修改。还可将多维表格嵌入文档实现实时协同查看。

高校邦在线教育平台官网登录入口
手机教程 · 2026-07-04

高校邦在线教育平台官网登录入口

高校邦的官方学习平台入口非常易于记忆,只需直接访问 http: gaoxiaobang com 即可快速进入。这里直截了当地给出链接,免去用户四处查找的麻烦。目前该在线教育平台整合了超过8000门跨学科慕课课程,支持PC端与移动端无缝切换,并能根据个人学习习惯进行智能推荐,同时提供院校专属门户及教

智通人才网项目经验详细描述修改教程
手机教程 · 2026-07-04

智通人才网项目经验详细描述修改教程

在智通人才网个人简历中调整项目经验,其实是个很常见但容易被忽略细节的操作。先登录账号,进入简历编辑页的“项目经验”独立模块,找到对应项目后点击右侧的“编辑”按钮,就能在弹出窗口中修改【项目描述】或【职责与成果】文本框里的内容。支持换行和基础格式,不过如果从Word等地方直接粘贴,很容易带出隐藏格式导