淄博烧烤爆火!基于 PaddleX 实现常用香料分类
本文介绍基于PaddleX开发常用香料分类模型的流程。先因淄博烧烤爆火,提及在家DIY烧烤时香料识别的需求,接着说明用MobileNetV2模型,步骤包括安装PaddleX、解压数据集、配置GPU、定义图像处理流程和数据集,再进行模型训练与预测,最后提到还可使用百度EasyDL开发。

大学生特种兵,快来淄博吃烧烤啦!
近期,随着淄博烧烤的爆火,越来越多的人选择去淄博旅游、吃烧烤,在五一期间,客流量更是远远超过了淄博旅游接待最大容量。

为了应对激增的客流量,淄博市加大了旅游接待容量,但在五一期间仍然难以满足游客需求。据了解,淄博市的许多景区和酒店在五一期间也加班加点地提供服务,以确保游客能够有一个愉快的旅行体验。同时,一些有影响力的博主、网红也在社交媒体上呼吁大家文明旅游,避免人流拥挤和垃圾乱扔等不良行为,为淄博市的旅游形象贡献一份力量。
尽管面临巨大的挑战,淄博市依然坚定地推进旅游业的发展,通过不断提升服务质量和配套设施,努力满足游客的需求。相信在各方的共同努力下,淄博市的旅游业一定能够迎来更加繁荣的明天。
但是,烧烤香料种类繁多,如果我们想在家里“DIY”的话,面对如此纷繁复杂的香料类别,很多烹饪新手在使用香料的时候会感觉无从下手,因此通过人工智能来实现香料的识别可以为我们的生活提供极大的方便。那么,我们基于PaddleX开发一款可以进行常用香料分类的模型,就可以大大提高我们的烹饪效率
数据集介绍
数据来源于本开发者(哈密不是瓜)的公开数据集,其中包括五种香料类型。
MobileNetV2简介
MobileNetV2是一个图像分类模型,其是基于深度分离卷积和倒置残差结构的网络,能更好地匹配移动和嵌入式设备。本文档在一个小数据集上展示了如何通过PaddleX进行训练和预测。
1. 安装PaddleX
In [1]#paddlex 2.0.0 的版本不稳定,所以我们选择使用paddlex 1.3.10的版本 ! pip install "paddlex==1.3.10" -i https://mirror.baidu.com/pypi/simple登录后复制
2. 解压常用香料分类数据集
In [3]!unzip -oq /home/aistudio/xiangliao.zip登录后复制
3. 模型训练
3.1 配置GPU
In [4]# 设置使用0号GPU卡(如无GPU,执行此代码后仍然会使用CPU训练模型)import matplotlibmatplotlib.use('Agg') import osos.environ['CUDA_VISIBLE_DEVICES'] = '0'import paddlex as pdx登录后复制 3.2 定义图像处理流程transforms
定义数据处理流程,其中训练和测试需分别定义,训练过程包括了部分测试过程中不需要的数据增强操作,如在本示例中,训练过程使用了RandomCrop和RandomHorizontalFlip两种数据增强方式,更多图像预处理流程transforms的使用可参见paddlex.cls.transforms。
In [5]from paddlex.cls import transformstrain_transforms = transforms.Compose([ transforms.RandomCrop(crop_size=224), transforms.RandomHorizontalFlip(), transforms.Normalize()])eval_transforms = transforms.Compose([ transforms.ResizeByShort(short_size=256), transforms.CenterCrop(crop_size=224), transforms.Normalize()])登录后复制
3.3 定义数据集Dataset
分类使用ImageNet格式的数据集,因此采用pdx.datasets.ImageNet来加载数据集,该接口的介绍可参见文档paddlex.datasets.ImageNet。
In [7]train_dataset = pdx.datasets.ImageNet( data_dir='xiangliao/xiangliao', file_list='xiangliao/xiangliao/train_list.txt', label_list='xiangliao/xiangliao/labels.txt', transforms=train_transforms, shuffle=True)eval_dataset = pdx.datasets.ImageNet( data_dir='xiangliao/xiangliao', file_list='xiangliao/xiangliao/val_list.txt', label_list='xiangliao/xiangliao/labels.txt', transforms=eval_transforms)登录后复制
3.4 模型开始训练
使用本数据集在P40上训练。 更多训练模型的参数可参见文档paddlex.cls.MobileNetV2。 模型训练过程每间隔save_interval_epochs轮会保存一次模型在save_dir目录下,同时在保存的过程中也会在验证数据集上计算相关指标,具体相关日志参见文档。
AIStudio使用VisualDL查看训练过程中的指标变化
点击左边菜单图标的『可视化』;设置logdir,logdir的路径为训练代码中save_dir指定的目录下的vdl_log目录,例如output/mobilenetv2/vdl_log点击下方『启动VisualDL服务按钮』,再『打开VisualDL』即可In [8]num_classes = len(train_dataset.labels)model = pdx.cls.MobileNetV2(num_classes=num_classes)model.train(num_epochs=10, train_dataset=train_dataset, train_batch_size=32, eval_dataset=eval_dataset, lr_decay_epochs=[4, 6, 8], save_interval_epochs=1, learning_rate=0.025, save_dir='output/mobilenetv2', use_vdl=True)登录后复制
4. 模型预测
In [49]此处请在AIStudio Notebook页面的右上角菜单,选择重启执行器,以释放显存,重新加载训练好的模型
import paddlex as pdximport matplotlib.pyplot as pltmodel = pdx.load_model('output/mobilenetv2/best_model')image_name = 'ziran.webp'#使用事先准备好的孜然图片进行预测result = model.predict(image_name)print("Predict Result:", result)#根据原始训练配置,最后模型效果在准确率在93%以上登录后复制 5. 彩蛋
除了使用PaddleX全流程工具开发本项目,还可以使用百度EasyDL的文心大模型进行开发,大家快去试试吧!
EasyDL正式:https://ai.baidu.com/easydl/?track=cp:aipinzhuan|pf:pc|pp:EasyDL|pu:title|ci:|kw:10091801
EasyDL相关课程:https://aistudio.baidu.com/aistudio/topic/EasyDL
EasyDL开发流程图
模型校验效果图
相关攻略
一个月费$200的Claude Max订阅,用出了$5000的算力价值——这件事最终让Anthropic下定决心,彻底关上了第三方工具“蹭订阅”的大门。北京时间4月4日,Anthropic向订阅用户
IT之家 4 月 4 日消息,国外维修团队 iFixit 昨日发布视频,拆解苹果 AirPods Max 2,发现其内部结构与初代产品高度相似,可沿用旧版拆解手册。IT之家附上相关拆解视频如下:iF
每日经济新闻4月1日消息 当地时间3月31日,被视为OpenAI最强竞争对手的Anthropic再次遭遇代码泄露事件,是其在一周内遭遇的第二起重大数据失误事件。Anthropic因npm包打包失误,
IT之家 3 月 31 日消息,据《滚石》杂志的深度调查显示,AI 生成工具正迅速渗透专业音乐制作领域,但整个行业却对此讳莫如深。今年早些时候,Suno 首席执行官米奇 · 舒尔曼接受《卫报》采访时
克雷西 发自 凹非寺量子位 | 公众号 QbitAIAI进入营销行业,已经是定局。艾瑞咨询报告显示,去年中国AI营销市场规模达669亿元,年复合增长率26 2%这个增速背后,是整个行业链条——从内容
热门专题
热门推荐
加密货币行业翘首以盼的监管里程碑,终于有了实质性进展。美国证券交易委员会(SEC)主席保罗·阿特金斯(Paul Atkins)近日证实,那份允许加密项目在早期获得注册豁免权的“安全港”框架提案,已经正式送抵白宫,进入了最终审查阶段。 在范德堡大学与区块链协会联合举办的数字资产峰会上,阿特金斯透露了这
微策略Strategy报告:第一季录得144 6亿美元浮亏 再斥资约3 3亿美元买进4871枚比特币 市场震荡的威力有多大?看看Strategy的最新季报就明白了。根据其最新向美国证管会(SEC)提交的8-K报告,受市场剧烈波动影响,这家公司所持的比特币在第一季度录得了一笔惊人的数字——144 6亿
稳定币巨头Tether的动向,向来是加密世界的风向标。这不,它向Web3基础设施的版图扩张,又迈出了关键一步。公司执行长Paolo Ardoino在社交平台X上透露,其工程团队正在全力“烹制”一个新项目——去中心化搜索引擎 “Hypersearch”。这个消息一出,立刻引发了行业的广泛猜想。 采用D
基地位于Coinbase旗下以太坊Layer2网络Base的Seamless Protocol,日前正式宣告了服务的终结。这个曾经吸引了超过20万用户的原生DeFi借贷协议,在运营不到三年后,终究没能跑赢时间。它主打的核心产品是Integrated Leverage Markets(ILMs)——一
PAAL代币揭秘:深度解析Web3社区治理的核心钥匙 在去中心化自治组织的浪潮中,谁真正掌握了项目的话语权?PAAL代币提供了一套系统化的答案。它不仅是生态内流转的价值媒介,更是开启链上治理大门的核心凭证。通过持有并质押PAAL代币,用户能够对协议升级、资金分配乃至战略方向等关键事务投出决定性的一票





