李明强：AI鉴黄师"看懂"图像迅速走红

2018-09-11 18:12 来源：互联网我来投稿撤稿纠错

受访者供图

“你的第一个产品，哪怕做得粗糙一点也没关系，不要想太多!”5年前，李明强带着腾讯高级副总裁张小龙的“临别赠言”，跃入创业的大潮中。共事多年的张小龙给他的建议是，“产品并不需要做得完美无瑕再拿出去。只要有客户，就说明是有需求的。”

1980年出生的李明强在腾讯工作了7年，先后参与QQ邮箱、微信等项目的开发，成了一名资深的项目经理和T4技术专家。“我离开腾讯时，公司只有几十个T4技术专家。但我在那里太久了，再不出去创业就折腾不动了。”2014年，他创办了国内最早将计算机视觉技术应用在互联网内容审核上的AI公司——图普科技。

“内容审查怎么不能做到？我就可以做！”

图普科技从“出生”时起，就打上了“鉴黄”的烙印。这源于曾经掀起舆论热议的“快播案”。快播CEO王欣在法庭上称：“快播最主要的功能就是播放，就像传统意义上的DVD，无法知道上传者是谁，更不知道视频内容是什么。用户上传什么种子，它就播放下载什么种子，它只是忠实地执行这个动作而已。”

李明强说：“内容审查在当时的确很难。我就想怎么不能做到?我就可以做!”

根据《全国人民代表大会常务委员会关于维护互联网安全的决定》的规定，互联网公司内容涉黄，有可能被以制作、复制、出版、贩卖、传播淫秽物品牟利罪定罪处罚。快播破产的结局让众多网络平台意识到，内容审核不仅是维护互联网环境的政策要求，更是关及自身生死存亡的要事。

如今，直播和短视频市场风起云涌，庞大的流量催生新产业的同时，审核难度也越来越大。据新华社报道，今年以来，“扫黄打非”部门加大工作力度。据统计，“净网2018”行动从1月到4月，各地共处置淫秽色情等有害信息175万余条，查办淫秽色情信息案件390余起。

被网友戏称高薪和“福利”兼具的神奇职业“鉴黄师”，在如此大体量的内容检测面前显得势单力薄。“培养一个鉴黄师至少需要两周。”李明强说，“一天总共8万多秒，去掉吃饭睡觉等时间，鉴黄师一天最多能看一两万张图片。人工审核难免会有错漏，还要考虑人员流动、不能实时监看等不稳定的因素。”

受到快播案的启发，李明强确立了用人工智能技术进行图片识别的战略，他带着新建的团队，在一周内做出demo(小样)，在给机器提供大量数据的基础上，通过机器持续学习，确保系统甄别效能的更新和优化。

随后图普迎来第一个客户——迅雷。迅雷之前成立了自己的内容审核团队。“他们的做法是将违规内容和审核视频进行比对，将一样的部分筛去，但是机器并不理解这个东西是什么。”李明强说，“一个视频版本传播出去会有多个变种，分辨率不同、加个水印、字幕或者截取部分，就演变成完全不同的文件了。我们的创新点在于，我们的识别是基于图像的理解，真的能‘看懂’视频是否有色情内容”。

“我们在识别的结果上，会划线区分为确定和不确定部分。有的图片非常隐晦，它介于两者之间，系统的判定是不确定或者很模糊。因此我们也设立新的计费模式，只对于确定部分收费，不确定部分不收费或者少收费，打消客户的很多疑虑。”李明强解释，图普科技的准确率高达99%，对于系统无法识别或无法作出最终判断的内容，推送至人工审核。尽管还需要鉴黄师的助力，但已经极大地提高效率和降低人力成本。

目前，图普科技的AI每天的处理量超过10亿次，在云端设有几百个图像识别接口，相关的算法也落地到不同的行业里。

“每次尝试我都更兴奋，会有这一次要成功了的错觉”

任何成功都不是一蹴而就。在图普科技成长为“AI鉴黄师”之前，李明强有过一次失败的创业经历。

2013年，李明强尝试开发一个服装和鞋帽的搜索引擎，通过图片来了解用户喜好并推荐适合用户的款式。“在当时就能够完成识别图中衣物款式、颜色、纹理等一些当时看起来很有难度的事”，但初次创业不过一年便宣告失败。

李明强期望能从图片为切口，突破单一的纯文字搜索引擎模式，但高成本的流量和时间消耗难以承受。回顾过去的创业经历，运营工作太重是失败的主要原因。用户对于服装的偏好、对美的感受千差万别，需要进行大量的运营工作。

这成为李明强最头痛的事，“尽管我们尝试将每一次需求沉淀下来再去改进，但还是会有新的或者隐晦的需求，一次又一次遭受打击。依靠技术难以量化和把握，无法完成完整的商业闭环。”

“这是一次非常惨痛的创业经历。”从腾讯的高级技术专家，到事无巨细考虑每一步的创业老板，身份的转换带给了李明强极大的不适应感，“就像一觉醒来漂流在海面上，狂风暴雨，又不知道该往什么方向去走。”

当初，李明强带着几位伙伴一起离开腾讯着手创业。他形容“自己的兄弟特别单纯”，“他们就相信我这件事情能做成”。

搜衣引擎的失败给了李明强当头一棒。比起自己的挫败感，李明强对共同战斗的队友背负更深的愧疚。

“带着一帮兄弟，拿着投资人的钱花时间在这个地方，最后发现都是一些无效劳动。”那一次失败，让李明强损失了一半得力干将。他觉得，“失败就像一个坑，陷进去了就得爬出来。如何找到方向爬出坑最重要”。

“就是不断尝试。”李明强在接受中国青年报·中青在线记者采访时说，“每一次尝试我都更兴奋，会有这一次要成功了的错觉，但结果方向又不对，那就再来!”

每一次调整状态后，他又像打满了鸡血一般，迎接新的挑战，“这件事情一年做不成，我就做十年。因为我知道肯定是存在一条路的。”李明强终于找到了这条路，开创了国内人工智能图片识别内容审核的先河。

员工的学习时间计入工时——拿工资学习

“AI鉴黄师”迅速走红。参加了多场人工智能研讨会后，李明强发现，“只要一说我们的产品是AI鉴黄，之后再说到其他业务大家就都不注意听了”。

“后来想想我们本来就是互联网出身，能有这样的免费热点蹭，也没什么不好。 ”李明强介绍，如今图普科技三条生产线并行：互联网、商业智能、泛安防。鉴黄只是互联网生产线的一个小分支。今年图普科技在商业智能上持续发力，线下门店都开始尝试配备AI的自动导购机，例如通过摄像头来识别消费者的形象特征，随后根据算法在屏幕上显示推荐产品，在应用中增添很多趣味性的成分，“这实际上是我们做赋能型零售的破冰尝试。”

目前，图普科技总部设在广州，在北京、成都等地开设了分公司，160多人的团队中研发人员占70%。招到优秀的人是李明强最关心的事，他和程序员在工作之余“玩”出了5套谜题，以游戏的形式作为选拔人才的考卷。

“这一套谜题是用算法抠出图里的马里奥，这张海报的图标是《三体》里的鱼缸……”他甚至在公司开设解题课堂，定期讲解这些内容。他还设计了打卡学习系统，员工的学习时间计入工时——拿工资学习。

如今，李明强和公司成员沟通时，常常将“在用的过程中完善”这句话挂在嘴边。李明强坦言，“我一开始总想要把产品做完善再拿出去，反而越做越糟。张小龙的忠告是对的，产品就是应该在推出后根据需求迭代的。我们也正在不断更新产品，永远在路上。”(实习生黄畅中国青年报·中青在线记者王聪聪)

申请创业报道，分享创业好点子。点击此处，共同探讨创业新机遇！

相关标签: ai技术; 人工智能图普科技; 声音鉴黄师审核

AI的边界在哪里？科大讯飞“上天入地”

展望科大讯飞的2022，“讯飞超脑2030计划”发布，科大讯飞全面锚定虚拟人、虚拟宠物，在雄厚的技术能力和丰富的场景经验支持下，持续验证着其面向新场景、新领域的创新能力，也在加速转化成为其未来5到10年的业绩支撑点。

标签：

ai技术

科大讯飞
告别“古典时代”，AI开始拥抱接地气的商业模式

1956年8月，以香农为代表的一群科学家在达特茅斯学院，围绕着“用机器来模仿人类学习以及其他方面的智能”这个主题，创造出人工智能（ArtificialIntelligence）这个影响深远的概念。

标签：

ai技术

ai智能
护航AI时代网络安全的，为什么会是这个“小巨人”企业？

防止被AI欺骗，是如何成为一门产业的？

标签：

ai技术
京东AI发起人、技术委员会主席周伯文离职将于AI方向创业

A5创业网（公众号：iadmin5）11月16日报道：据IT之家，据36氪报道，从多个独立信源处获悉，京东的技术委员会主席周伯文已从京东离职，周伯文将在AI领域创业。

标签：

京东

ai技术
小众却高端的“视频新基建”：步态识别技术如何穿越萌芽期？

近日，专注于步态识别的AI识别公司银河水滴，完成近3亿元B轮融资。

标签：

ai技术

清华学霸引爆“长文本”大战，大模型的应用前景清晰了吗？

文|智能相对论作者|沈浪Long-LLM（长文本大模型）时代似乎来得有些突然，而引爆这场热潮的，竟是一家由清华学霸牵头的本土AI初创企业。前不久，月之暗面（MoonshotAI）公司宣布旗下对话式AI助理产品Kimi应用现已支持200万字无损上下文输入。对比去年10月份Kimi上线时仅支持的20万字
不止于大模型英特尔CPU引领智算新高度

在算力新时代，从通用计算到智算，CPU可以做更多，价值也更加凸显。作为一种基于人工智能（AI）技术的计算方式，其含义既包含了AI，还包含了对高性能算力的要求。拥抱大模型不容易ChatGPT的横空出世拉开了AI大模型的新时代，而近期的文生视频模型SORA又让业界为之激动不已。据了解，Sora所需tok
AI大模型博鳌破局：端云结合，驱动新质生产力

在“博鳌时刻”，vivo蓝心大模型等被明确定调为，是打造“新质生产力”的孕育沃土。作者|杨铭编辑|刘珊珊海阔风清，椰林葱郁中，风口上的AI大模型，站上博鳌亚洲论坛2024年年会多个主题分论坛的C位。“未来是属于AI大模型的，千行百业将被重塑或被革新挑战。”众多嘉宾、参会人士在博鳌的激昂热情，再次明确

标签：

大模型
开发者怎么拥抱智能化浪潮？昇腾AI给出了“通关指南”

在大模型代表的新一轮技术浪潮下，智能化转型已然是毋庸置疑的趋势，科技大厂们纷纷给出了智能化的“道法术”，大大小小的企业也开始更新认知，想要从创新中挖掘出驱动增长的新质生产力。但现实和智能化的美好愿景之间，仍然横亘着一片鲜有人涉足的“荒海”，脚下还没有坚实的路。3月23日在天津举办的昇腾AI开发者创享

标签：

ai技术

ai智能
8款AI视频生成产品实测，谁将成为中国Sora？

©自象限原创作者丨罗辑、苏奕编辑丨程心2024年开年，科技圈没有什么比Sora的出现更让人兴奋。如同ChatGPT在2023年初带来的LLM创业潮，Sora的发布也同样将视频生成模型推到了风口浪尖。科技巨头猛推产品，创业公司则乘风而上。3月13日，AI视频大模型公司爱诗科技完成亿元级人民币A1轮融资

标签：

ai技术

ai智能
AI业务收入盈利双增，但百融云没有止步

当为科学技术巡游一方的神，行至人工智能的篇章，中国公司的2023年报里，写着AIGC的前世今生。翻开科技进步的编年史，每一次技术革命都有这样一条铁律：技术革命的最大受益者，通常不是率先做出突破的开疆派，而是率先将其发扬光大的技术流。靠着工业革命超越日不落的美利坚，把同样的故事，转载到了50年代的半导

AI手机需要新故事

言必称AI的时代，已经来了，尤其是随着sora等的震撼发布，以及Google、微软和国内大厂等在AI研发、大模型等方面的日新月异。就手机行业而言，在存量时代出货量连年不及预期的情况下，如何刺激用户换机，成了一道摆在所有手机厂商面前的共同命题。从三星到国内的一些手机厂商，实际上已先行一步打出了“AI手

标签：

ai技术
智能校对大模型文修2.0重磅发布：赋能“人工智能+办公”转型升级

3月22日，由天津蜜度文修智能科技有限公司主办的智能校对大模型文修2.0智臻发布会在津举行。发布会以“大模型赋能‘人工智能+办公’体验升级”为主题，邀请语言智能领域专家，以及各大媒体机构和合作伙伴，围绕大模型技术、应用落地发展、标准化进程进行分享交流。发布会上还发布了智能校对大模型文修2.0。天津市
阿里通义千问重磅升级：免费开放1000万字长文档处理功能

3月22日消息，阿里通义千问重磅升级，向所有人免费开放1000万字的长文档处理功能，成为全球文档处理容量第一的AI应用。即日起，所有金融、法律、科研、医疗、教育等领域的专业人士，都可通过通义千问网站和APP快速读研报、分析财报、读科研论文、研判案情、读医疗报告、解读法律条文、分析考试成绩、总结深度文

标签：

通义千问
世界上最大的AI大模型：马斯克的Grok-1正式开源

关注卢松松，会经常给你分享一些我的经验和观点。马斯克是真男人啊，不仅SpaceX发射基地可以随意参观、连设计图纸都公开了。SpaceX刚刚发射完没几天，连他的AI大模型Grok-1也正式开源了。Grok-1是当前世界上参数最大的、开源大语言模型。296GB的大小，3140亿参数，远超OpenAIGP

加载更多

李明强：AI鉴黄师"看懂"图像迅速走红

相关文章

AI的边界在哪里？科大讯飞“上天入地”

告别“古典时代”，AI开始拥抱接地气的商业模式

护航AI时代网络安全的，为什么会是这个“小巨人”企业？

京东AI发起人、技术委员会主席周伯文离职将于AI方向创业

小众却高端的“视频新基建”：步态识别技术如何穿越萌芽期？

清华学霸引爆“长文本”大战，大模型的应用前景清晰了吗？

不止于大模型英特尔CPU引领智算新高度

AI大模型博鳌破局：端云结合，驱动新质生产力

开发者怎么拥抱智能化浪潮？昇腾AI给出了“通关指南”

8款AI视频生成产品实测，谁将成为中国Sora？

AI业务收入盈利双增，但百融云没有止步

AI手机需要新故事

智能校对大模型文修2.0重磅发布：赋能“人工智能+办公”转型升级

阿里通义千问重磅升级：免费开放1000万字长文档处理功能

世界上最大的AI大模型：马斯克的Grok-1正式开源

热门排行

编辑推荐