受访者供图
“你的第一个产品,哪怕做得粗糙一点也没关系,不要想太多!”5年前,李明强带着腾讯高级副总裁张小龙的“临别赠言”,跃入创业的大潮中。共事多年的张小龙给他的建议是,“产品并不需要做得完美无瑕再拿出去。只要有客户,就说明是有需求的。”
1980年出生的李明强在腾讯工作了7年,先后参与QQ邮箱、微信等项目的开发,成了一名资深的项目经理和T4技术专家。“我离开腾讯时,公司只有几十个T4技术专家。但我在那里太久了,再不出去创业就折腾不动了。”2014年,他创办了国内最早将计算机视觉技术应用在互联网内容审核上的AI公司——图普科技。
“内容审查怎么不能做到?我就可以做!”
图普科技从“出生”时起,就打上了“鉴黄”的烙印。这源于曾经掀起舆论热议的“快播案”。快播CEO王欣在法庭上称:“快播最主要的功能就是播放,就像传统意义上的DVD,无法知道上传者是谁,更不知道视频内容是什么。用户上传什么种子,它就播放下载什么种子,它只是忠实地执行这个动作而已。”
李明强说:“内容审查在当时的确很难。我就想怎么不能做到?我就可以做!”
根据《全国人民代表大会常务委员会关于维护互联网安全的决定》的规定,互联网公司内容涉黄,有可能被以制作、复制、出版、贩卖、传播淫秽物品牟利罪定罪处罚。快播破产的结局让众多网络平台意识到,内容审核不仅是维护互联网环境的政策要求,更是关及自身生死存亡的要事。
如今,直播和短视频市场风起云涌,庞大的流量催生新产业的同时,审核难度也越来越大。据新华社报道,今年以来,“扫黄打非”部门加大工作力度。据统计,“净网2018”行动从1月到4月,各地共处置淫秽色情等有害信息175万余条,查办淫秽色情信息案件390余起。
被网友戏称高薪和“福利”兼具的神奇职业“鉴黄师”,在如此大体量的内容检测面前显得势单力薄。“培养一个鉴黄师至少需要两周。”李明强说,“一天总共8万多秒,去掉吃饭睡觉等时间,鉴黄师一天最多能看一两万张图片。人工审核难免会有错漏,还要考虑人员流动、不能实时监看等不稳定的因素。”
受到快播案的启发,李明强确立了用人工智能技术进行图片识别的战略,他带着新建的团队,在一周内做出demo(小样),在给机器提供大量数据的基础上,通过机器持续学习,确保系统甄别效能的更新和优化。
随后图普迎来第一个客户——迅雷。迅雷之前成立了自己的内容审核团队。“他们的做法是将违规内容和审核视频进行比对,将一样的部分筛去,但是机器并不理解这个东西是什么。”李明强说,“一个视频版本传播出去会有多个变种,分辨率不同、加个水印、字幕或者截取部分,就演变成完全不同的文件了。我们的创新点在于,我们的识别是基于图像的理解,真的能‘看懂’视频是否有色情内容”。
“我们在识别的结果上,会划线区分为确定和不确定部分。有的图片非常隐晦,它介于两者之间,系统的判定是不确定或者很模糊。因此我们也设立新的计费模式,只对于确定部分收费,不确定部分不收费或者少收费,打消客户的很多疑虑。”李明强解释,图普科技的准确率高达99%,对于系统无法识别或无法作出最终判断的内容,推送至人工审核。尽管还需要鉴黄师的助力,但已经极大地提高效率和降低人力成本。
目前,图普科技的AI每天的处理量超过10亿次,在云端设有几百个图像识别接口,相关的算法也落地到不同的行业里。
“每次尝试我都更兴奋,会有这一次要成功了的错觉”
任何成功都不是一蹴而就。在图普科技成长为“AI鉴黄师”之前,李明强有过一次失败的创业经历。
2013年,李明强尝试开发一个服装和鞋帽的搜索引擎,通过图片来了解用户喜好并推荐适合用户的款式。“在当时就能够完成识别图中衣物款式、颜色、纹理等一些当时看起来很有难度的事”,但初次创业不过一年便宣告失败。
李明强期望能从图片为切口,突破单一的纯文字搜索引擎模式,但高成本的流量和时间消耗难以承受。回顾过去的创业经历,运营工作太重是失败的主要原因。用户对于服装的偏好、对美的感受千差万别,需要进行大量的运营工作。
这成为李明强最头痛的事,“尽管我们尝试将每一次需求沉淀下来再去改进,但还是会有新的或者隐晦的需求,一次又一次遭受打击。依靠技术难以量化和把握,无法完成完整的商业闭环。”
“这是一次非常惨痛的创业经历。”从腾讯的高级技术专家,到事无巨细考虑每一步的创业老板,身份的转换带给了李明强极大的不适应感,“就像一觉醒来漂流在海面上,狂风暴雨,又不知道该往什么方向去走。”
当初,李明强带着几位伙伴一起离开腾讯着手创业。他形容“自己的兄弟特别单纯”,“他们就相信我这件事情能做成”。
搜衣引擎的失败给了李明强当头一棒。比起自己的挫败感,李明强对共同战斗的队友背负更深的愧疚。
“带着一帮兄弟,拿着投资人的钱花时间在这个地方,最后发现都是一些无效劳动。”那一次失败,让李明强损失了一半得力干将。他觉得,“失败就像一个坑,陷进去了就得爬出来。如何找到方向爬出坑最重要”。
“就是不断尝试。”李明强在接受中国青年报·中青在线记者采访时说,“每一次尝试我都更兴奋,会有这一次要成功了的错觉,但结果方向又不对,那就再来!”
每一次调整状态后,他又像打满了鸡血一般,迎接新的挑战,“这件事情一年做不成,我就做十年。因为我知道肯定是存在一条路的。”李明强终于找到了这条路,开创了国内人工智能图片识别内容审核的先河。
员工的学习时间计入工时——拿工资学习
“AI鉴黄师”迅速走红。参加了多场人工智能研讨会后,李明强发现,“只要一说我们的产品是AI鉴黄,之后再说到其他业务大家就都不注意听了”。
“后来想想我们本来就是互联网出身,能有这样的免费热点蹭,也没什么不好。 ”李明强介绍,如今图普科技三条生产线并行:互联网、商业智能、泛安防。鉴黄只是互联网生产线的一个小分支。今年图普科技在商业智能上持续发力,线下门店都开始尝试配备AI的自动导购机,例如通过摄像头来识别消费者的形象特征,随后根据算法在屏幕上显示推荐产品,在应用中增添很多趣味性的成分,“这实际上是我们做赋能型零售的破冰尝试。”
目前,图普科技总部设在广州,在北京、成都等地开设了分公司,160多人的团队中研发人员占70%。招到优秀的人是李明强最关心的事,他和程序员在工作之余“玩”出了5套谜题,以游戏的形式作为选拔人才的考卷。
“这一套谜题是用算法抠出图里的马里奥,这张海报的图标是《三体》里的鱼缸……”他甚至在公司开设解题课堂,定期讲解这些内容。他还设计了打卡学习系统,员工的学习时间计入工时——拿工资学习。
如今,李明强和公司成员沟通时,常常将“在用的过程中完善”这句话挂在嘴边。李明强坦言,“我一开始总想要把产品做完善再拿出去,反而越做越糟。张小龙的忠告是对的,产品就是应该在推出后根据需求迭代的。我们也正在不断更新产品,永远在路上。”(实习生 黄畅 中国青年报·中青在线记者 王聪聪)
申请创业报道,分享创业好点子。点击此处,共同探讨创业新机遇!
展望科大讯飞的2022,“讯飞超脑2030计划”发布,科大讯飞全面锚定虚拟人、虚拟宠物,在雄厚的技术能力和丰富的场景经验支持下,持续验证着其面向新场景、新领域的创新能力,也在加速转化成为其未来5到10年的业绩支撑点。
1956年8月,以香农为代表的一群科学家在达特茅斯学院,围绕着“用机器来模仿人类学习以及其他方面的智能”这个主题,创造出人工智能(ArtificialIntelligence)这个影响深远的概念。
A5创业网(公众号:iadmin5)11月16日报道:据IT之家,据36氪报道,从多个独立信源处获悉,京东的技术委员会主席周伯文已从京东离职,周伯文将在AI领域创业。
文|智能相对论作者|沈浪Long-LLM(长文本大模型)时代似乎来得有些突然,而引爆这场热潮的,竟是一家由清华学霸牵头的本土AI初创企业。前不久,月之暗面(MoonshotAI)公司宣布旗下对话式AI助理产品Kimi应用现已支持200万字无损上下文输入。对比去年10月份Kimi上线时仅支持的20万字
在算力新时代,从通用计算到智算,CPU可以做更多,价值也更加凸显。作为一种基于人工智能(AI)技术的计算方式,其含义既包含了AI,还包含了对高性能算力的要求。拥抱大模型不容易ChatGPT的横空出世拉开了AI大模型的新时代,而近期的文生视频模型SORA又让业界为之激动不已。据了解,Sora所需tok
在“博鳌时刻”,vivo蓝心大模型等被明确定调为,是打造“新质生产力”的孕育沃土。作者|杨铭编辑|刘珊珊海阔风清,椰林葱郁中,风口上的AI大模型,站上博鳌亚洲论坛2024年年会多个主题分论坛的C位。“未来是属于AI大模型的,千行百业将被重塑或被革新挑战。”众多嘉宾、参会人士在博鳌的激昂热情,再次明确
在大模型代表的新一轮技术浪潮下,智能化转型已然是毋庸置疑的趋势,科技大厂们纷纷给出了智能化的“道法术”,大大小小的企业也开始更新认知,想要从创新中挖掘出驱动增长的新质生产力。但现实和智能化的美好愿景之间,仍然横亘着一片鲜有人涉足的“荒海”,脚下还没有坚实的路。3月23日在天津举办的昇腾AI开发者创享
©自象限原创作者丨罗辑、苏奕编辑丨程心2024年开年,科技圈没有什么比Sora的出现更让人兴奋。如同ChatGPT在2023年初带来的LLM创业潮,Sora的发布也同样将视频生成模型推到了风口浪尖。科技巨头猛推产品,创业公司则乘风而上。3月13日,AI视频大模型公司爱诗科技完成亿元级人民币A1轮融资
当为科学技术巡游一方的神,行至人工智能的篇章,中国公司的2023年报里,写着AIGC的前世今生。翻开科技进步的编年史,每一次技术革命都有这样一条铁律:技术革命的最大受益者,通常不是率先做出突破的开疆派,而是率先将其发扬光大的技术流。靠着工业革命超越日不落的美利坚,把同样的故事,转载到了50年代的半导
3月22日,由天津蜜度文修智能科技有限公司主办的智能校对大模型文修2.0智臻发布会在津举行。发布会以“大模型赋能‘人工智能+办公’体验升级”为主题,邀请语言智能领域专家,以及各大媒体机构和合作伙伴,围绕大模型技术、应用落地发展、标准化进程进行分享交流。发布会上还发布了智能校对大模型文修2.0。天津市
3月22日消息,阿里通义千问重磅升级,向所有人免费开放1000万字的长文档处理功能,成为全球文档处理容量第一的AI应用。即日起,所有金融、法律、科研、医疗、教育等领域的专业人士,都可通过通义千问网站和APP快速读研报、分析财报、读科研论文、研判案情、读医疗报告、解读法律条文、分析考试成绩、总结深度文
关注卢松松,会经常给你分享一些我的经验和观点。马斯克是真男人啊,不仅SpaceX发射基地可以随意参观、连设计图纸都公开了。SpaceX刚刚发射完没几天,连他的AI大模型Grok-1也正式开源了。Grok-1是当前世界上参数最大的、开源大语言模型。296GB的大小,3140亿参数,远超OpenAIGP