首页 游戏 软件 资讯 排行榜 专题
首页
科技数码
研究人员发现16TB未加密数据库,泄露超430亿条专业记录

研究人员发现16TB未加密数据库,泄露超430亿条专业记录

热心网友
41
转载
2025-12-16

凭借数十亿条个人记录,网络犯罪者能够自动化实施高度定制化的欺诈活动,大幅缩短攻击准备周期,并将火力集中于包括《财富》500强企业在内的高价值目标。

16TB开放数据库暴露43亿条专业记录

一个未受保护的16TB MongoDB数据库公开暴露了约43亿条专业档案记录(主要为LinkedIn风格数据),可能引发大规模人工智能驱动的社会工程攻击。研究人员Bob Diachenko与nexos.ai在2025年11月23日发现该未设防的数据库,两天后完成修复。目前暂无法确认此前有哪些人访问过这些敏感信息。

Cybernews团队分析发现,该数据库包含9个独立数据集,每个数据集的名称基本反映了其内容类型:

intent – 2,054,410,607条文档(604.76 GB) profiles – 1,135,462,992条文档(5.85 TB) unique_profiles – 732,412,172条文档(5.63 TB) unique_profiles – 732,412,172条文档(5.63 TB) people – 169,061,357条文档(3.95 TB) sitemap – 163,765,524条文档(20.22 GB) companies – 17,302,088条文档(72.9 GB) company_sitemap – 17,301,617条文档(3.76 GB) address_cache – 8,126,667条文档(26.78 GB) intent_archive – 2,073,723条文档(620 MB)

\

近200亿条个人隐私数据遭泄露

至少有三个数据集泄露了近200亿条个人身份记录,包含姓名、电子邮箱、电话号码、LinkedIn个人主页链接、职位、雇主、工作经历、教育背景、所在地、技能、语言能力和社交账号等信息。仅“unique_profiles”数据集就包含超过73.2亿条附带图片URL的档案记录。“people”数据集还包含与Apollo.io生态系统相关的画像指标和Apollo ID,但研究人员未发现Apollo平台本身遭入侵的迹象。

Cybernews报道指出:“我们的研究人员确认,特定数据集内的所有记录都是唯一的,但不同数据集之间可能存在数据重叠。虽然不同数据集包含的信息类型有所差异,但其中至少三个数据集(profiles、unique_profiles和people)包含可识别个人身份的信息(PII)。”

数据来源与潜在风险

难以确定这些LinkedIn风格数据的具体生成时间。时间戳显示记录于2025年收集或更新,但部分数据可能来自多年前,包括威胁行为者在2024年声称的大规模LinkedIn数据泄露事件。

泄露数据的所有者尚未确认。研究人员发现线索指向某潜在客户开发公司——其网站路径“/people”和“/company”与数据集中的站点地图记录相匹配。该公司声称可访问超过70亿专业人士数据,与泄露的“unique_profiles”数量高度吻合,且在收到通知次日该数据库即下线。但研究人员未明确归因,指出该公司本身也可能是数据爬取的受害者。

大规模结构化数据的攻击价值

此类海量结构化数据极具危险性,可支撑鱼叉式钓鱼、高管欺诈、商业间谍及大规模人工智能驱动攻击等定向攻击活动。凭借数十亿条详细记录,犯罪集团能自动化实施个性化诈骗,缩短攻击准备时间,并重点针对包括《财富》500强雇员在内的高价值目标。

Cybernews总结道:“大语言模型(LLM)能基于用户画像生成个性化欺骗内容。攻击者只需投入少量精力,就能向受害者发送数千万封恶意邮件——整个攻击行动往往只需攻陷一个高价值目标即可获利。”

研究人员进一步解释:“此类大型数据集是恶意行为者的主要目标,它们能基于其他数据泄露事件进行画像增强,构建可搜索的个人数据仓库。经过增强后,这些数据还可能包含密码、设备标识符、其他社媒链接等信息。此类数据集极大简化了社会工程和凭证填充攻击的操作流程。”

来源:https://www.51cto.com/article/832010.html
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

国家安全部警示Token安全风险 日均140万亿调用量存多重隐患
业界动态
国家安全部警示Token安全风险 日均140万亿调用量存多重隐患

2026年4月,国家安全部针对AI核心基础单元——词元(Token)发布了专项安全警示。这一警示的发布时机至关重要:当前,国内词元的日均调用量已突破140万亿次大关。截至2026年3月,其调用规模相比2024年初,更是激增了超过一千倍。随着国家数据局正式为Token定名,并明确其可计量、可定价、可交

热心网友
05.13
Mercor平台数据泄露遭攻击 合作方暂停合作并提起诉讼
业界动态
Mercor平台数据泄露遭攻击 合作方暂停合作并提起诉讼

AI训练数据领域最近出了件大事,震动整个行业。估值不菲的独角兽企业Mercor遭遇黑客攻击,超过四万名用户的个人敏感信息被泄露。事件曝光后一周内,至少已有五起集体诉讼被提起。更值得关注的是,科技巨头Meta已宣布暂停与Mercor的所有合作,而OpenAI也紧急启动内部调查,以确认其采购的专有训练数

热心网友
05.12
Canvas平台遭黑客攻击服务中断 多所高校期末考试被迫延期
iphone
Canvas平台遭黑客攻击服务中断 多所高校期末考试被迫延期

美国主流教学平台Canvas近期遭遇黑客组织“闪亮猎人”攻击,导致服务中断,正值期末考试季,给多所高校教学秩序带来冲击。事件导致近9000所学校受影响,数十亿条数据面临泄露风险,得克萨斯大学圣安东尼奥分校等机构被迫推迟期末考试。分析指出,教育机构数字化数据已成为黑客重点目标,此次攻击模式与之前同类事

热心网友
05.09
iPhone17通讯录怎么备份?3种简单方法快速保存联系人
iphone
iPhone17通讯录怎么备份?3种简单方法快速保存联系人

使用iCloud自动备份通讯录是最简单可靠的方法,只需在iPhone17设置中开启iCloud通讯录同步即可。 再说几个核心判断。如今数据就是资产,尤其是手机里积累多年的通讯录,一旦丢失,麻烦可不小。好在给iPhone17备份联系人,方法既简单又有多种选择,总能找到适合你的那一种。 方法一:使用iC

热心网友
04.22
华测检测获中央网信办数据中心授权 正式开展数据安全管理与个人信息保护领域服务
科技数码
华测检测获中央网信办数据中心授权 正式开展数据安全管理与个人信息保护领域服务

据华测检测(300012 SZ)消息,近日,华测检测与中央网信办(国家网信办)数据与技术保障中心(简称“中央网信办数据中心”)正式签署合作协议,获批成为中央网信办数据中心在数据安全管理(DSM)认证

热心网友
04.07

最新APP

宝宝过生日
宝宝过生日
应用辅助 04-07
台球世界
台球世界
体育竞技 04-07
解绳子
解绳子
休闲益智 04-07
骑兵冲突
骑兵冲突
棋牌策略 04-07
三国真龙传
三国真龙传
角色扮演 04-07

热门推荐

算力时代电力价值重估 能源如何支撑数字经济
AI
算力时代电力价值重估 能源如何支撑数字经济

近日,国家能源局联合发改委、工信部、国家数据局正式印发《关于促进人工智能与能源双向赋能的行动方案》。这份重磅文件的核心思路非常清晰:一方面,以坚实的能源基础支撑人工智能(AI)的快速发展;另一方面,利用AI技术赋能能源行业转型升级。其核心目标是推动能源、算力、应用场景、数据与算法模型五大关键要素深度

热心网友
05.20
智谱清影与Runway Gen3视频生成模型对比评测
AI
智谱清影与Runway Gen3视频生成模型对比评测

在挑选文生视频工具时,若您正在智谱清影与Runway Gen-3之间权衡,那么了解两者在生成效果上的具体差异,将有助于您做出更明智的选择。本文将从画质清晰度、细节纹理、运动自然度与视频连贯性等核心维度,通过实测对比为您详细解析。 一、画质与分辨率表现 首先对比硬性指标。智谱清影基于CogVideoX

热心网友
05.20
通义万象制作数据可视化科技背景的实用教程
AI
通义万象制作数据可视化科技背景的实用教程

想用通义万相生成一张科技感十足的数据可视化背景,但出来的画面总觉得少了点“内味儿”?数字界面、粒子流、电路纹理这些关键元素一个不见,画面平平无奇?这通常不是工具的问题,而是提示词没有精准锚定科技可视化的核心要素,或者模型参数没调到最佳状态。别急,下面这几种方法,能帮你把想法精准地“翻译”成画面。 一

热心网友
05.20
Vidu视频慢动作与快进效果制作教程
AI
Vidu视频慢动作与快进效果制作教程

想要在Vidu生成的视频中实现流畅的慢动作或快进效果?虽然模型界面没有提供直接调整播放速度的滑块,但通过巧妙的提示词设计、利用内置功能,或结合后期处理工具,你完全可以精准掌控视频的节奏与时间感。本文将为你详细解析四种实用方法,从生成前到生成后,全方位满足你的创作需求。 一、通过精准提示词引导运动节奏

热心网友
05.20
海螺AI学术论文查重降重功能实测与效果分析
AI
海螺AI学术论文查重降重功能实测与效果分析

当您使用海螺AI生成的英文论文在提交查重时遭遇高重复率或AIGC检测异常,请不要急于归咎于工具本身。核心原因在于,尽管AI生成的文本格式标准、语法地道,但其语言模式和常见短语组合,并未针对知网、维普、万方等中文查重数据库的语义比对逻辑进行专门优化。换言之,机器认为流畅自然的表达,在查重系统的算法看来

热心网友
05.20