|
这两天,得到AI学习圈的同学朱剑跟我分享了一个案例,我听完之后觉得很有意思,和你分享一下。 他说的事儿特别简单:用AI数进店的人。但你别小看这个“数人”的活儿,这事儿要是干不好,开店的老板基本上就是在蒙着眼睛做生意。 我问你一个问题:如果你开实体店,你知道昨天有多少人进了你的店吗? 你可能觉得这问题太简单了,不就是“数人头”嘛。但说实话,大多数门店老板真答不上来。让店员记?忙起来根本顾不上,最后都是凭感觉估算。买设备统计?员工进进出出被算进来,路过看热闹的也被算进来,误差能到50%以上。 你可能会说,这数据不就是个参考嘛,差不多就行了。但问题是,这个数据要是不准,你的很多决策都会出问题。 你想想,排班怎么安排?客流高峰期人手够不够?淡季是不是养了一堆闲人?什么时候搞促销效果最好?这家店的转化率到底怎么样? 更关键的是,人流数据是计算门店转化率的分母。如果进店人数都统计不准,你怎么知道哪家店的销售效率更高?怎么制定合理的业绩目标? 简单和你介绍下,朱剑负责的是海外电信运营商在多伦多和温哥华的6家门店。他用AI把人流统计准确率从50%提升到90%以上,每月成本从1500-2000加币降到25加币,成本下降超过98%。 这个改进幅度让我特别想知道他到底是怎么做到的,如果你也开实体店,也被人流统计问题困扰过,今天这个案例值得你花时间看完。 01 传统方案的困境先来看看过去他们是怎么统计人流的?和大多数实体门店一样,他们一开始是让店员在纸质表格上记录每天的进店人数。 但你想想,店员本来就忙,接待客户、处理业务、整理货品,哪有时间专门盯着门口数人?通常都是下班前根据印象估算,如果逼得急了就随便填一些数字交差。 意识到人工统计不靠谱后,朱剑他们开始尝试技术手段。红外感应统计器、基于手机Wi-Fi信号的人流统计设备、人流监控摄像头,该试的都试了。 朱剑告诉我,他们试过的人流监控摄像头,镜头端本身就有基本的AI识别功能,但实际部署后的效果远远达不到产品宣传的效果。 最终,他们采用的是人工统计加设备辅助的混合方式。但这个方案依然不理想。 核心问题到底在哪?朱剑发现,不管是人工统计还是设备统计,问题都是一样的:分不清谁是客户,数不准有多少人。 什么叫分不清谁是客户?员工上班下班被算进来了,路过的行人被算进来了,橱窗外看热闹的也被算进来了。系统根本分不清谁是真正的潜在客户。 什么叫数不准有多少人?同一个客户上午来一次下午又来一次,被算成两个人;一家三口一起进来,可能只识别出一个人;设备稍微装歪一点,进店的客户就被当成路过的了。
整体而言,统计出来的数据与实际差异高于50%。 这个误差率意味着什么?你看,到店客户的转化率一般在20-30%之间,这本身就是门店运营效率的重要指标。但当到店用户数的统计差异可以达到50%的情况下,你根本算不出各店的实际完成情况,更不要说用来考核了。 更要命的是成本问题。人工统计加设备辅助,每个月要花1500-2000加币。管理层的质疑很直接:“花这么多人工成本统计数据,结果还不准,这个工作还有必要吗?” 朱剑当时面临的就是这样的困境:一边是业务需要准确数据做决策,一边是成本控制的要求。 02 AI方案的设计思路转机出现在2024年。谷歌发布Gemini 2.0模型后,朱剑开始尝试用AI的图片理解能力来完成数客户的任务。 他的想法很直接:既然门店本来就有监控摄像头,能不能让AI直接看监控图片,识别出哪些是客户、有多少人? 一开始,朱剑的思路是让AI直接批量判断一批图片的人数。说实话,这个思路在5月版本的时候效果已经超出了预期,准确率有70%。 后来他沿着这个思路不断优化提示词,比如给每家门店设置单独的提示词,根据门店的布局特点告诉AI如何处理——封闭式门店有明确的进出口,开放式门店则是开放的街面店。 经过这样的优化,封闭式门店的效果逐渐提升到80%左右。但到此就碰到模型的能力边界了,无法再进一步了。朱剑通过对照图片逐张分析,发现了主要问题: 第一是幻觉问题,15%的判断结果和图片无法对应上; 第二是复制结果输出,当模型资源不足时,它会偷懒,直接复制前面图片的分析结果作输出。 从复杂任务到简单判断到了9月,朱剑和ChatGPT反复讨论这些错误案例,终于想明白了问题出在哪:给AI的任务太复杂了。 跑个题,在这个时代,有很多的新变革和新挑战,是之前的人类专家或者领导也根本没有遇到过的。所以很多时候,我们除了请教他们之外,还可以跟AI好好聊聊,也许AI会给你很多完全不一样的思路。 而且从次序上来说,我建议是先跟AI好好请教,然后拿着AI的很多有意思或者有突破的方案,再去请教人类专家。 只要这个人类专家的心态是开放的,那么一定能从AI的方案里,快速找到启发自己的地方,然后拿出一个更优质和容易实现的方案。 回到朱剑的案例,于是他换了个思路,不让AI直接出最终结果,而是把任务拆解成两个简单的判断。 第一个判断:这个人在多张图片里是不是同一个人? 第二个判断:这个人是员工还是客户,具体在做什么? 同时,他要求AI必须按照固定的格式输出结果,不能像之前那样纯文字描述。然后再用程序根据这些结构化的信息,搭配筛选规则来最终判断是否应该计为有效客户。 我给你举个具体例子:如果AI对某个人的描述是“站在柜台前咨询业务”,系统会判定为有效客户;如果描述是“穿着工作服整理货架”,就会被识别为员工;如果描述是“在门口张望后离开”,则判定为路人。而当AI连续多张图片都输出完全相同的描述时,系统会识别出这是复制输出,自动剔除。
这个改变带来的效果非常明显。目前系统的准确率超过90%,基本解决了幻觉和数据重复的问题,关键是对各种类型门店都通用有效,无需再单独优化。 三步走技术架构在技术实现上,朱剑的整体方案分成3个步骤: 第一步,自动抓素材。他用AI编程软件Cursor,写了一个小工具,设定每天晚上门店下班后自动运行,从6家门店的摄像头批量下载当天的监控图片。 第二步,AI批量识别。然后再让AI去批量地识别监控照片里的人。
第三步,数据看板。每天早上,系统自动更新前一天的人流数据,再配合上销售数据和客服数据,管理层和店长每天上班前就能看到前一天的运营数据,便于及时调整排班和活动安排。
系统搭建起来后,朱剑面临的最大挑战是成本控制。 如果不加控制,6家门店每天产生的监控图片数量是巨大的。按照每15秒拍一张的频率,一家店营业12小时就是2880张图片,6家店就是17280张。这个量如果全部调用API,成本会非常高。 朱剑设计了多层过滤机制,从三个层面控制图片数量: 第一,摄像头设置。有人才拍照且最少间隔15秒。这样可以过滤掉大量无人的空镜头。 第二,预处理筛选。只保留间隔30秒以上的图片。因为同一个客户在30秒内的多张图片,其实记录的是同一个行为。 第三,批量处理。每家店每天最终只筛选出约800张有效图片,分成20批处理。 实际效果如何在这样的一套组合拳下来,每个月的AI运行成本也就25加币左右,相比原来每月1500-2000加币的人工成本,几乎可以忽略不计。 但这个成本控制不是简单的“省钱”,而是在保证效果的前提下的精细化管理。朱剑还专门做了小步测试找边界:从20→30→50张/批逐级压力测试,锁定最稳定的批量与提示复杂度。 最终确定稳定在50张/批,既保证了处理效率,又避免了幻觉和重复输出问题。 03 AI落地关键经验目前,这套系统已经运行半年多了,朱剑总结了三个关键经验: 第一,问题拆分比优化提示词更重要。 很多人遇到AI效果不好,第一反应是调提示词。朱剑的经验是:当准确率卡在80%无法提升时,不是提示词的问题,而是任务设计的问题。 比如他把“批量识别客户人数”拆解成“识别同一人”和“判断身份”两个简单任务,准确率直接从80%跳到90%+。这比花几个月时间调提示词效果好得多。 第二,摸清边界比追求完美更实用。 朱剑专门花时间测试Gemini的处理极限:20张图片稳定,30张偶尔出错,50张是临界点。摸清这个边界后,他就把批量大小锁定在50张,避免了后期大量的返工。 很多人喜欢追求理论上的最优方案,但在实际项目中,找到稳定可靠的边界比追求极致性能更重要。 第三,算总账比看单项成本更关键。 和1500-2000加币的人工成本对比,现在的方案每月调用AI只需要25加币。很多企业只看到了额外增加的AI调用成本,却忽略了节省的人力成本和提升的决策效率。 说实话,朱剑这个案例最大的价值,我觉得不是技术本身,而是证明了中小企业也能用AI解决实际问题。 迁移应用的关键很多同行问朱剑这套方案能不能复制到他们的门店,他觉得完全可以。 核心逻辑都是一样的,就是用几十块钱的成本替代上千块的人工,把数据准确率提升到可以用来做决策的水平。但迁移的时候要注意几个关键点: 第一,选择合适的场景。不是所有业务都适合用AI改造。朱剑选择人流统计这个场景,是因为它有明确的业务价值,直接影响排班和营销决策;有清晰的判断标准,就是统计人数;有现成的数据源,门店本来就有监控摄像头。 第二,从小规模开始。朱剑一开始只在6家门店试点,验证效果后再考虑推广。这种渐进式的推进方式,既控制了风险,也积累了经验。 第三,重视数据基础。AI想干活,得先有“粮食”。朱剑能够成功,很大程度上是因为他们已经有了监控系统,有了结构化的图片数据。如果连基础数据都没有,就得先补课。 04 结语如果你也在门店运营中遇到类似的数据统计问题,不妨参考朱剑的思路。 这样的案例,我们要学习的并不是AI技术有多么高大上,而是同学在这个任务里的摸索和实验能力,希望能对你使用AI有启发。 最后,今天分享的这个案例,来自得到AI学习圈同学的真实实践。如果你也在工作中用AI解决过实际问题,或者你的公司正在思考AI落地的问题,欢迎扫描下方二维码,分享你的实践心得。 只要拿到过结果,我们就会约你的时间做更深入的交流,让更多人认识你。
|