今天翻硬盘发现去年折腾机器学习那堆破事,心血来潮给你们唠唠踩过的坑。那会儿看网上教程说得可简单了,真动手才发现全是忽悠小白的。
开头就栽跟头
刚开始傻乎乎直接装最新版环境,结果连着三晚报错报得我想砸键盘。重要教训来了:别信什么"最新版最稳定"的鬼话,老老实实找匹配版本。我翻社区两年前的帖子,照着装Python3.7配TensorFlow1.15才跑通,你说气不气人?
数据集差点让我吐血
网上扒了20G卫星图片,熬夜整完标注才发现问题大了:
- 云层遮挡的图压根不能用
- 同一栋楼不同角度标成两类
- 30%图片分辨率稀烂
训练过程血压飙升
第一次跑模型激动得搓手手,结果:
- 第三天loss曲线原地蹦迪
- 显卡温度飙到88度自动停机
- 发现验证集精度比训练集还高
部署才是终极折磨
以为训练完就完事了?太天真!本地跑得飞起的模型:
- 移植到树莓派直接卡成PPT
- 安卓端疯狂闪退
- 云端API被刷爆流量
现在你们明白我为啥转型做硬件调试了?上个月见投资人还吹这个项目,结果人家听完来句:"你这哪是AI公司,整个一消防队。" 麻了,真麻了。
还没有评论,来说两句吧...