做API开发,手机号校验这事儿,说简单也简单,说麻烦也真能折腾你半天。正则写对了,格式也对了,可验证就是不过,或者存到数据库里就出乱子。今天咱们就来聊聊,那些在Lara vel里做手机号校验时,最容易踩的坑和必须注意的细节。
手机号正则校验为什么总匹配失败
你是不是也遇到过这种情况:明明正则 ^1[3-9]\d{9}$ 写得清清楚楚,放在 Lara vel 的 Rule::regex() 里却死活匹配不上?问题往往不出在正则本身,而在于数据“不干净”。
Lara vel 验证器默认不会帮你处理字符串前后的“杂质”。用户输入时手滑多打的空格、从网页上复制粘贴带来的换行符,甚至是肉眼看不见的 Unicode 空白字符(比如全角空格),都会被原封不动地交给正则去匹配。一个11位的手机号,带上前后空格,长度就超过了,正则自然对不上。更隐蔽的是像 \u200e 这类零宽字符,它不占视觉空间,但正则引擎会把它算作字符串的一部分,导致校验逻辑静默失败,直到往数据库里存的时候才报错。
所以,关键的第一步是清洗:
- 务必先 trim:在定义验证规则时,把
trim规则加上。比如:'phone' => ['required', 'string', 'trim', Rule::regex('/^1[3-9]\d{9}$/')]。这个trim会先于regex执行,确保正则拿到的是“纯净”的字符串。 - 慎用
digits:11:这个规则只检查是不是11个数字,不关心开头是不是1,也无法过滤掉像“01234567890”这种无效号段。它适合做辅助校验,但不能替代正则。 - 注意脱敏数据:如果前端传过来的是类似
"138****1234"的脱敏格式,你的正则必须能处理星号,或者在验证前先将星号替换为真实数字,否则永远通不过。
Lara vel 自定义手机号规则类怎么写才不踩坑
当内置规则不够用,需要自定义验证规则类时,写法上也有讲究。直接返回 true/false 是行不通的,必须遵循 Lara vel 的契约。
首先,自定义规则类需要实现 passes() 和 message() 两个方法。这里有个细节:passes() 方法接收到的 $value 是原始输入值,它没有经过任何前置规则(比如你全局定义的 trim)的处理。这意味着,即使在表单请求中调用了 trim,在自定义规则里你依然可能拿到带空格的值。
因此,一个健壮的自定义规则类应该这么写:
- 正则模式内置化:不要把正则模式以字符串形式在构造函数里传来传去,容易出错且不利于测试。建议定义为类的私有常量或从配置中读取。
- 手动清洗数据:在
passes()方法内部,第一件事就是手动对字符串进行trim操作:$value = is_string($value) ? trim($value) : ''。 - 消息国际化:别在
message()方法里硬编码中文错误信息。使用 Lara vel 的翻译功能,例如return __('validation.phone_invalid'),然后在对应的语言文件中配置。
class PhoneNumber implements Rule
{
private string $pattern = '/^1[3-9]\d{9}$/';
public function passes($attribute, $value): bool
{
$value = is_string($value) ? trim($value) : '';
return (bool) preg_match($this->pattern, $value);
}
public function message(): string
{
return __('validation.phone_invalid');
}
}
用手机号做数据库唯一性校验时要注意什么
手机号常作为用户唯一标识,但直接用 unique:users,phone 做校验,可能会埋下数据不一致的隐患。根源在于数据库对空格的处理方式。
以 MySQL 为例,在比较 VARCHAR 字段时,默认会“忽略”字符串的尾部空格,但不会忽略前导空格。这就可能导致一个滑稽的局面:用户A输入了 " 13812345678"(前面有个空格),用户B输入了 "13812345678 "(后面有个空格)。由于尾部空格被忽略,而前导空格不被忽略,数据库可能会认为这是两个不同的值,从而都允许插入,但这显然违背了业务逻辑上的“唯一”要求。PostgreSQL 等数据库的行为可能更严格或更宽松,但不确定性始终存在。
解决方案的核心是标准化:
- 入库前统一清洗:在将手机号存入数据库之前,不仅要做
trim,最好用preg_replace('/\s+/u', '', $phone)移除所有空白字符,确保存储的是最纯净的数字串。 - 数据库层设计:可以将字段设为
CHAR(11)固定长度,或者创建一个生成列(generated column)来存储标准化后的手机号,并在这个生成列上建立唯一索引,避免每次查询都使用函数处理。 - 历史数据清洗:如果表中已有脏数据,不要直接用
ALTER TABLE ... COLLATE ...这种可能锁表的粗暴方式。稳妥的做法是写一个迁移脚本,分批更新数据,将手机号字段统一标准化。
为什么有些 170/171 号段校验不过
这个问题源于号段知识的更新滞后。早些年,170、171 号段主要分配给虚拟运营商,一些老旧的正则或代码会将其排除在外。但根据工信部的最新规定,整个 170-179 号段都已纳入合法的移动通信号段范围。
好消息是,我们常用的正则 /^1[3-9]\d{9}$/ 其实是兼容的。因为 170、171、172 等号段的第二位数字(7)在 [3-9] 这个范围内,所以这个正则本身就能正确匹配这些号段。问题往往出在项目里残留的、更古老的正则表达式上。
所以,你需要做的是:
- 检查并更新正则:确认项目中使用的正则是否已经是
/^1[3-9]\d{9}$/,它覆盖了 13x-19x 的所有主流号段。 - 避免画蛇添足:不要写
in_array(substr($phone, 0, 3), ['170', '171'])这样的代码来单独判断虚拟运营商号段,这既低效,又会漏掉 172-179 等其他号段。 - 关注新号段:真正需要留意的是 14 号段。其中 145/147 属于联通上网卡,而 140-144、146、148、149 等号段目前尚未向公众放号,如果遇到,应当直接拒绝。
最后,还有一个在联调时极易被忽视的“隐形杀手”:前后端校验不一致。前端用 Ja vaScript 做了一遍格式校验,但没做 trim;后端在 Form Request 里写了正则,却忘了在 prepareForValidation() 方法里做数据清洗。结果就是,用户提交一个带空格的手机号,前端放行,后端却返回一个笼统的“手机号格式错误”的 422 状态码。用户一头雾水,开发者排查起来也费劲。
一个治本的办法是,在全局的请求中间件或 Form Request 的预处理阶段,就对手机号这类字段进行统一的标准化(Normalize)处理,确保进入业务逻辑的数据始终是干净的。这比事后在无数个日志里大海捞针要高效得多。
