Pandas读取外部数据的几种实现方法
Pandas 支持读取几乎所有常见的外部数据格式,核心是 pd.read_* 系列函数,以下是最常用的格式及用法:

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈
处理数据的第一步,往往是把外部数据“搬”进来。Pandas 在这方面堪称全能选手,其核心的 pd.read_* 系列函数几乎覆盖了所有常见的数据源。接下来,我们就逐一拆解这些最常用的读取方法。
1. 读取文本文件(CSV/TXT)
说到数据读取,CSV 和 TXT 文本文件绝对是出场率最高的选手。核心函数 pd.read_csv() 功能强大,从分隔符、编码到列名,几乎都能按需定制。
import pandas as pd
# 读取CSV文件(默认逗号分隔)
df = pd.read_csv(
"data.csv", # 文件路径(本地/URL)
encoding="utf-8", # 编码(中文常用utf-8/gbk)
header=0, # 第0行作为列名(默认)
index_col=None, # 不将某列作为索引
sep=",", # 分隔符(TXT常用"\t")
na_values=["NA", "缺失", "-"], # 哪些值视为NaN
skiprows=1, # 跳过前1行(如跳过注释行)
usecols=["姓名", "分数", "班级"] # 只读取指定列
)
print("读取的CSV数据:")
print(df.head()) # 查看前5行
用好 read_csv,关键在于几个核心参数。下面这个表格帮你快速掌握:
| 参数 | 作用 | 常用值 |
|---|---|---|
| encoding | 文件编码 | utf-8/gbk(解决中文乱码) |
| header | 列名行号 | None(无列名)/0(第一行) |
| na_values | 缺失值映射 | ["", "NA", "无"] |
| usecols | 筛选列 | ["列1", "列2"](减少内存占用) |
| dtype | 指定列类型 | {"分数": int, "班级": str} |
2. 读取 Excel 文件(XLS/XLSX)
对于业务场景中常见的 Excel 文件,Pandas 同样提供了得力的工具——pd.read_excel()。不过,使用前需要先安装对应的依赖库。
pip install openpyxl # 读取xlsx pip install xlrd # 读取xls
依赖搞定后,基础用法其实和读 CSV 很相似:
import pandas as pd
# 读取Excel文件(指定sheet)
df = pd.read_excel(
"data.xlsx",
sheet_name="学生成绩", # 指定sheet名称/索引(0为第一个)
header=0,
usecols="A:C", # 只读取A-C列
dtype={"分数": float},
na_values=["未填写"]
)
print("读取的Excel数据:")
print(df.info()) # 查看数据基本信息
3. 读取 JSON 文件
随着 Web API 和前后端交互越来越普遍,JSON 格式的数据也日益常见。用 pd.read_json() 来处理这类结构化的数据,非常方便。
import pandas as pd
# 读取JSON文件
df = pd.read_json(
"data.json",
orient="records", # JSON格式(records:[{"列1":值}, ...])
encoding="utf-8"
)
print(df.head())
4. 读取数据库数据(MySQL/PostgreSQL)
当数据存储在关系型数据库里时,Pandas 也能直接连接并读取。这里以 MySQL 为例,首先需要安装对应的 Python 驱动。
pip install pymysql
驱动安装好后,流程就清晰了:建立连接、执行 SQL 查询、将结果读入 DataFrame。
import pandas as pd
import pymysql
# 建立数据库连接
conn = pymysql.connect(
host="localhost",
user="root",
password="123456",
database="test_db"
)
# 读取数据库表
df = pd.read_sql(
"SELECT * FROM student_scores", # SQL语句
con=conn # 数据库连接
)
conn.close() # 关闭连接
print(df.head())
可以看到,无论数据来自哪里,Pandas 都提供了一套相对统一、简洁的接口来读取,这正是其强大和易用之处。掌握这几类核心的读取方法,基本上就能应对日常绝大多数数据导入的需求了。
热门专题
热门推荐
构筑消防安全“防火墙”工程 提升全社会火灾防控综合能力 消防安全绝非一句空洞的口号,它直接关系到千家万户的生命财产安全,是社会稳定与经济发展的坚实保障。全面提升社会火灾防控水平,是一项需要全民参与、持续发力的系统性工程。以下汇集自不同领域的防火警示与实用提醒,为我们提供了直观而深刻的行动指南。 森林
防火宣传标语(1-20) 1 全民总动员,防火保安全。 2 全民护林、人人防火。 3 一人把关一处安,众人防火稳如山。 4 时时注意森林防火、人人重视森林防火。 5 森林防火记心上,人人护林理应当。 6 山田年年耕、防火天天讲。 7 保护消防设施,维护消防安全。 8 入山不带烟、野外
森林防火标语手抄报图片文案 “坚持生态效益、经济效益、社会效益相结合,突出生态效益。”这句话点明了现代林业发展的核心。如今信息传播触手可及,我们每天都能接触到海量内容,其中那些简洁有力、直击人心的句子,往往最能留下深刻印象。你是否也有收集和分享精彩语句的习惯?下面整理的这份森林防火标语集锦,或许能为
欧交易所作为全球领先的数字资产服务平台,为广大用户提供多样化的数字产品交易与金融服务。其官方应用程序设计友好,操作便捷,致力于为用户创造一个安全、稳定的交易环境。 这份指南将手把手带你完成欧交易所2025最新版App的官方下载与安装。文内提供的链接直达官方渠道,确保你的每一步操作都安全可靠。 下载教
森林防火标语大全图片文案【篇1】 一棵树木长成参天大树,需要历经数十年的风雨洗礼,成长过程极为不易。请务必牢记,切勿让任何火源进入林区,共同守护这片绿色。 我们关心天下大事,更应心系家园安全,用行动联通守护的责任。 清明祭祖,如今更倡导以鲜花、植树等文明、环保的方式寄托哀思,摒弃焚烧纸钱旧俗,让清明





