先说一个常见误区:很多人以为,只要在 SSD 上运行 Oracle,把 disk_asynch_io 设为 true 就能大幅提升性能。其实,这个参数只是必要条件,远非充分条件——而真正拖累性能的,往往是另外几个极易被忽视的瓶颈。
将 disk_asynch_io 设为 true 是基础前提,但仅开启它远远不够——SSD 环境下真正制约性能的,是 filesystemio_options 的配置以及 Linux 内核异步 I/O 资源的限制。

为何在 SSD 上 disk_asynch_io=true 可能并未生效
Oracle 11g 的 disk_asynch_io 参数本质上是数据库层面的总开关,它只控制“是否发起异步请求”,而系统层面能否真正实现异步,则是另一回事。影响后者的因素包括操作系统是否支持异步 I/O、文件系统配置是否匹配、以及内核异步 I/O 资源是否充足。
在 SSD 环境中,经常遇到这样的怪事:查询 v$iostat_file 时,发现 ASYNCH_IO 列全部显示为 DISABLED,即便已经设置了 disk_asynch_io=true。运行 I/O 校准(DBMS_RESOURCE_MANAGER.CALIBRATE_IO)时,甚至直接报错 ORA-27090: Unable to reserve kernel resources for asynchronous disk I/O。更隐蔽的情况是,后台看似启用了异步,但 db file parallel write 的平均等待时间丝毫没有下降——这通常意味着异步并没有真正跑起来。
filesystemio_options 必须配套设置(尤其是使用文件系统时)
如果数据文件存放在 ext4 或 xfs 这类常规文件系统上(而非 ASM),那么 disk_asynch_io 的效果还要看 filesystemio_options 的脸色。该参数有四个可选值:none、setall、directIO、asynch。在 SSD 场景下,唯一推荐的选择是 setall。
setall相当于同时启用 direct I/O 和 asynchronous I/O——既绕过了操作系统 page cache,又允许多个 I/O 请求并发提交,这对低延迟的 SSD 最为友好。asynch单独设置会产生 buffered I/O 加异步的组合,结果导致 OS cache 与 Oracle buffer cache 双重缓存,既浪费内存又增加 CPU 开销。directIO单独设置属于同步直写,基本无法发挥 SSD 的并发优势。- 在 ASM 环境下,此参数无效,无需关注;但使用文件系统部署时,必须显式设置为
setall。
Linux 内核参数 fs.aio-max-nr 必须调大
SSD 的高并发 I/O 会迅速消耗默认的异步 I/O 事件槽位。很多时候,Oracle I/O 校准失败或 DBWR 频繁退回到同步模式,根源就在这里。
- 默认值通常为
65536或1048576,对现代 SSD(尤其是 NVMe)来说远远不够。 - 建议值至少设为
3145728(约 3M),高负载的 RAC 或多实例环境可以调整到6291456。 - 修改方法很简单:
echo "fs.aio-max-nr = 3145728" >> /etc/sysctl.conf && sysctl -p。 - 注意:这是全局限制,而非 per-process 限制。修改后还需要重新启动数据库实例才能生效——因为 DBWR 在初始化时会预先申请一批 AIO context。
SGA 分配必须跟上 direct I/O 的节奏
启用 setall 后,OS cache 被绕过,所有读请求都需要由 Oracle 自身的 buffer cache 来满足。如果 db_cache_size 还按照旧习惯设置得很小,热数据的物理读就会直接打到 SSD 上,异步的优势也随之被抵消。
- 可以通过
v$sysstat观察physical reads和db block gets的比值。如果比值大于 0.3,说明 cache 命中率不足。 - SSD 虽然很快,但物理读仍然是毫秒级延迟,远慢于逻辑读(纳秒级)。所以热数据必须尽可能保留在
db_cache_size中。 - 建议在总内存充裕的前提下,将
db_cache_size设置为物理内存的 40%~60%。同时关闭自动内存管理(AMM),改用 ASMM 进行更精细的控制。 - 别忘了检查
db_flash_cache_size(11gR2+ 支持)。如果配备了 PCIe SSD 作为闪存缓存,会进一步减轻主存储的压力。
真正决定 SSD 上 Oracle I/O 效率的,从来不是单个参数开关。它是 disk_asynch_io、filesystemio_options、fs.aio-max-nr 和 db_cache_size 四者协同作用的结果。漏掉任何一环,异步都只是纸上谈兵。
