Pandas中iloc[]和loc[]的实现示例
Pandas数据索引的核心:iloc与loc的深度解析
在Pandas的数据操作世界里,iloc[]和loc[]堪称是数据索引与切片的两把“瑞士军刀”。它们功能相似,但内核逻辑截然不同:一个认“位置”,一个认“标签”。搞混它们,往往是数据提取错误的根源。今天,我们就来彻底厘清这对核心方法的区别与应用场景。
免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈
![Pandas中iloc[]和loc[]的实现示例](/uploadfile/2026/0428/5d69cb13141a4e229f4a36983cfb5b99.webp)
一、核心区别对比:位置 vs 标签
| 维度 | iloc[](integer location) | loc[](label location) |
|---|---|---|
| 索引依据 | 行/列的整数位置(从0开始计数) | 行的索引名、列的列名(标签) |
| 切片规则 | 左闭右开(如0:2仅包含位置0、1) | 包含终点(如‘a’:‘c’包含标签a、b、c) |
| 支持的索引类型 | 整数、整数列表、整数切片、布尔数组 | 标签、标签列表、标签切片、布尔数组 |
| 适用场景 | 按数据的“物理顺序”取数(不管行/列标签) | 按数据的“逻辑标签”取数(依赖行/列的命名) |
这里需要特别澄清一个概念:Pandas语境下的“标签”,指的是DataFrame.columns(列名)和DataFrame.index(行索引名)。这与机器学习中代表目标变量的“样本标签”完全是两码事,千万别混淆了。
另外,两者都支持传入一个可调用对象(callable)作为索引条件,比如df.loc[lambda df: df[‘列名’]>0],这种高级用法在复杂条件筛选时非常灵活。
二、实例演示:从抽象到具体
光说不练假把式。为了清晰展示区别,我们特意构造一个行索引为自定义标签的DataFrame,避免默认的整数索引造成干扰。
import pandas as pd
data = pd.DataFrame(
data={'数学': [90, 85, 78], '英语': [88, 92, 75]},
index=['张三', '李四', '王五'] # 行标签(非默认整数)
)
print("原始DataFrame:")
print(data)
输出如下:
数学 英语
张三 90 88
李四 85 92
王五 78 75
1. 单行/单列提取:两种逻辑的起点
- iloc(按整数位置):它只关心数据在内存中的物理排列顺序。行位置0对应第一行“张三”,列位置0对应第一列“数学”。
data.iloc[0] # 取第1行(位置0) # 输出: # 数学 90 # 英语 88 # Name: 张三, dtype: int64
- loc(按标签):它则与数据的“身份证”打交道。直接用行标签“张三”或列名“数学”来定位。
data.loc['张三'] # 取标签为“张三”的行 # 输出同iloc[0]
2. 多行/多列切片:一个“开”,一个“闭”
- iloc(左闭右开):这是Python切片的标准行为。
0:2意味着包含位置0,但不包含位置2,所以只取到位置0和1(对应“张三”和“李四”)。data.iloc[0:2] # 取位置0到2(不含2)的行 # 输出: # 数学 英语 # 张三 90 88 # 李四 85 92
- loc(包含终点):这是基于标签的切片逻辑。
‘张三’:‘王五’意味着选取索引名从“张三”到“王五”的所有行,起点和终点都包含在内。data.loc['张三':'王五'] # 取标签从“张三”到“王五”的行(含王五) # 输出: # 数学 英语 # 张三 90 88 # 李四 85 92 # 王五 78 75
看到了吗?iloc[0:2]和loc[‘张三’:‘王五’]的结果完全不同,这正是“位置”与“标签”、“左闭右开”与“闭区间”差异的直观体现。
3. 二维索引:精准定位单元格
- iloc(行位置+列位置):用行、列的整数位置坐标来定位。行位置1(第二行“李四”),列位置1(第二列“英语”)。
data.iloc[1, 1] # 取第2行(位置1)、第2列(位置1)的值 # 输出:92
- loc(行标签+列名):用行、列的具体名称来定位。行标签“李四”,列名“英语”。
data.loc['李四', '英语'] # 取“李四”行、“英语”列的值 # 输出:92
4. 布尔索引:条件筛选的两种路径
两者都支持布尔数组进行条件筛选,但loc的用法更为直观和常用。
# 条件:数学分数>80 mask = data['数学'] > 80 # iloc:先获取满足条件的行位置,再取数 data.iloc[mask.values] # mask.values是布尔数组,对应行位置 # 输出: # 数学 英语 # 张三 90 88 # 李四 85 92 # loc:直接用布尔数组取数(更直观) data.loc[mask] # 输出同iloc
使用loc时,可以直接将布尔序列(mask)传入,Pandas会自动对齐标签进行筛选,代码更简洁易懂。
三、关键注意点与避坑指南
- 默认整数索引的陷阱:如果DataFrame使用默认的整数行索引(0, 1, 2…),
iloc[0]和loc[0]的结果可能相同,但背后的逻辑天差地别。iloc[0]是“取物理位置第一行”,而loc[0]是“取索引标签为0的那一行”。一旦索引被重置或打乱,结果就可能出错。 - 最易踩坑的切片差异:务必牢记,
iloc切片不包含终点(Python风格),而loc切片包含终点。这是导致许多“为什么少取了一行/多取了一行”bug的罪魁祸首。 - 场景化选择指南:
- 当你需要按数据的物理顺序操作时,比如“取前5行”、“取倒数第3列”,请毫不犹豫地使用
iloc。 - 当你需要按数据的逻辑标签操作时,比如“取‘张三’的成绩”、“筛选‘销售额’大于100万的记录”,
loc是你的最佳选择。
- 当你需要按数据的物理顺序操作时,比如“取前5行”、“取倒数第3列”,请毫不犹豫地使用
实战测试:你能读懂这行代码吗?
最后,我们来检验一下学习成果。下面这行代码是Pandas条件赋值的典型用法,看看你是否能准确解读它的意图:
numerical_df.loc[numerical_df['A'] < numerical_df['B'], 'A'] = 100
简单解析一下:这行代码使用loc进行条件赋值。它先筛选出numerical_df中所有‘A’列值小于‘B’列值的那些行,然后针对这些行,将其‘A’列的值全部设置为100。这是一个基于标签和条件的精准数据修改操作。
掌握iloc和loc,就等于掌握了Pandas数据访问的命门。理解其差异,根据场景灵活选用,你的数据分析之路会顺畅许多。
热门专题
热门推荐
一、财务系统更换:一场不容有失的“心脏手术” 如果把企业比作一个生命体,那么财务系统就是它的“心脏”。这颗“心脏”一旦老化,更换就成了必须面对的课题。但这绝非一次简单的软件升级,而是一场精密、复杂、牵一发而动全身的“外科手术”。数据显示,超过70%的ERP(企业资源计划)项目实施未能完全达到预期,问
在企业数字化转型的浪潮中,模拟人工点击软件:从效率工具到智能伙伴 企业数字化转型的路上,绕不开一个话题:如何把那些重复、枯燥的电脑操作交给机器?模拟人工点击软件,正是因此而成为了提升效率、降低成本的得力助手。那么,市面上的这类软件到底有哪些?答案其实很清晰。它们大致可以归为三类:基础按键脚本、传统R
一、核心结论:AI智能体是通往AGI的必经之路 时间来到2026年,AI智能体这个词儿,早就跳出了PPT和实验室的范畴。它不再是飘在天上的技术概念,而是实实在在地成了驱动全球数字化转型的引擎。和那些只能一问一答的传统对话式AI不同,如今的AI智能体(Agent)本事可大多了:它们能自己规划任务步骤、
一、核心结论:AI智能体交互的“桥梁”是行动层 在AI智能体的标准架构里,它与外部系统打交道,关键靠的是“行动层”。可以这么理解:感知层是Agent的五官,决策层是它的大脑,而行动层,就是那双真正去执行和操作的手。这一层专门负责把大脑产出的抽象指令,“翻译”成外部系统能懂的语言,无论是调用一个API
一、核心结论:AI人设是智能体的“灵魂” 在构建AI应用时,一个核心问题摆在我们面前:如何写好AI智能体的人设描述?这个问题的答案,直接决定了智能体输出的专业度与用户端的信任感。业界实践表明,一个优秀的人设描述,离不开一个叫做RBGT的模型框架,它涵盖了角色、背景、目标和语气四个黄金维度。有研究数据





