©自象限原创
作者丨周乾
优质的直播内容已经成为各大直播间营收增长的核心驱动力,而在打造优质直播内容的方式中,AIGC无疑是目前更具性价比和效率的方向。事实上,AI在直播间的应用也越来越深入,比如AI数字人主播、AI技术推动直播服务的优化和升级等等。
直播行业线上化程度高,且内容质量直接决定其价值创造,这两大特征使得AIGC应用在其中能够产生最大化的价值,并能够迅速渗透至核心生产环节。
这些听起来让人感觉新的增长机会近在眼前,而参差不齐、真真假假的应用能力让人感到焦虑又踌躇——想跟上AI 浪潮,但投入了成本,真能产生效益吗?哪些层面才能产生效益?
为此,我们深入直播行业调研,并采访到直播行业的技术TOP厂商,将AI技术在直播行业的细分应用场景挖掘出来,供大家参考与讨论——AI+直播是如何降低直播内容生产的成本和门槛,来赋能优质直播内容的创作,提升直播内容的质量、互动性和个性化体验。
AIGC为内容生产降本提效
AI技术以“低门槛、低成本、高效率”的创作模式赋能直播内容创作,已经显著地推动了降本增效的进程。主要体现在以下几个方面:
虚拟主播生成:
AI技术可以生成虚拟主播形象和声音,通过深度学习算法训练模型,创造逼真的虚拟形象,提供新颖的直播体验。虚拟主播可以24小时不间断直播,不需要休息,也不受到情绪、健康等因素的影响。通过预先设定的脚本和互动话术,能够持续吸引用户注意力,提高直播的频率和覆盖度,同时减少了对真人主播的依赖,降低了成本。
直播行业TOP技术厂商即构科技目前也推出“即构数智人”产品,据相关产品负责人表示,目前的数字人技术厂商,主要是为客户提供一个saas软件,例如“即构数智人”平台,通过这个软件直接推流到第三方平台去做直播。然后客户在这个软件后台去设定所谓的“人货场”,即开播前在后台选择虚拟主播、提前设定好产品介绍,以及可以去生成数字化的直播场景。
AI主播作为一个新型事物,目前处在发展应用的初期,平台、商家,以及MCN等都表现出了拥抱探索的心态。技术的发展有一个过程,目前AI直播在互动反馈、画面效果等方面仍然存在着短板,而技术的突破也直接决定了数字人直播的发展走向。
内容创作辅助:
在内容创作的辅助方面,主要分为视频和音频两大类。
AI视频创作类工具,如百度的“度加”,允许用户输入文案后自动匹配视频素材和编辑,快速生成内容丰富的视频。AI技术还可以基于热点新闻和用户兴趣自动生成文案脚本,为创作者提供灵感和素材,降低创作门槛。还包括个性化推荐、实时弹幕处理等。
AI音频频创作类工具,AI技术在声音创作方向上提供了文本配音、音色定制、智能变声等功能,帮助创作者高效简洁地完成配音工作。以即构科技的“VC音色转换”为例,该技术可支持Any-to-One音色转换,即将任意说话人的语音转换为特定音色,算法可实时生成高清目标音色语音,保留原始语气与说话韵律。
比如,主播想把自己的语音转换为蜡笔小新的声音,就可以在直播过程中实时换上蜡笔小新的声音,等于是给自己的声音换上“新皮肤”,立即调动起直播间的氛围。
另外,AI为直播间的运营也提供极大助力,比如内容分析、推荐等,此环节与直播内容创作不直接相关,在此不做深入讨论。
AI技术优化带来内容质量提升
越来越多的直播间通过AI技术来优化直播内容质量,保护用户体验,从而留住更多用户。从内容生产来说(不包含运营环节),主要是两个方向:
首先是AI技术优化直播的清晰度和流畅度。
比如,在直播、1V1视频聊天中,外界环境“不友好”比如光线暗的时候,主播视频画面清晰度低,容易有噪点,粉丝的观感体验就很差,画面“又黑又糊”,很容易就丧失耐心,退出直播间。
而通过AI技术,比如即构科技“AI画质增强算法”,能够在光线暗的环境下,对主播开播视频画面进行“调色”:拉高亮度、饱和度、降低视频噪点,提升直播画面质感,相当于一个智能、实时的“调色插件”,这样以来,观看直播的用户对于直播间的好感度也会提高。
其次是直播技术创新方面,如AI辅助的绿幕技术、虚拟背景、AI降噪等,为直播带来新的视听效果。
直播三要素“人、货、场”中,直播间是否具备足够有创意、足够氛围感、足够引发观众”冲动消费“的场景,对于整场直播的销售效果有着直接的影响。因此各大直播间或者直播平台都选择用虚拟场景直播,用相比实景更加具有创意和吸睛的方式来撬动流量。
即构科技相关产品负责人反馈,一款绿幕应用(用于绿幕直播间实时换背景),在接入即构绿幕抠图技术后,半年内新增5万用户(也就是主播);23年下半年,该绿幕软件结合直播机一起售卖,目前已经新增近2千用户,今年预计将达到1万用户增量。
近10倍的效益增长足以显示出直播市场对于直播抠绿幕换背景的需求,我们也看到,越先使用AI+直播技术的,也越先收获了效益。
另外,在直播场景中,主播在做外景直播时,常常有不确定的噪音“乱入”,严重影响用户听感,甚至会让用户离开直播间。此时,主播通常选择降噪,但一般降噪技术,在降低噪音的同时,也会损伤音乐声音。假如主播表演个弹唱,降噪技术直接就把音乐伴奏识别为噪音,一并消除了大部分,别说普通用户的听感不舒适,对于热爱音乐的用户简直是一种折磨……
对此,即构科技针对性地推出了“场景化AI降噪”,在消除环境噪音的同时,还能保障纯净音乐伴奏声。并且能根据不同的直播环境(户外噪音环境&音乐演奏场景),智能调整最佳降噪策略——如果是户外噪音,没有音乐演唱,AI降噪将启动消噪,保障优质人声;如果环境里有音乐伴奏,AI降噪将自动识别音乐伴奏,降噪同时,保留人声和纯净音乐。如此,主播无论在怎样的环境开播,无需手动操作,AI降噪都能实时保护主播人声和音乐的最佳音质,保证用户最舒适的听感。
另外,AI技术还通过内容水印、内容指纹识别、监测与屏蔽技术等,保护直播内容的版权,减少盗版风险。
AI技术不仅提高了直播内容创作的效率和质量,还为直播平台和创作者提供了更多的创新可能性和商业机会。可以预见的是,随着AI技术的不断进步,未来直播内容创作将变得更加智能化、个性化和互动化。
AI 能发挥的“降本增效”的作用,无非是对劳动力的“替代”,而非“超越。但AI未来的发展速度将比我们想象的更快,对直播内容创作的赋能或许也很快就将从“降本增效”转变为“不可替代的全新生产方式”。积极拥抱AIGC,不仅仅是企业降本增效的手段,而是跟上时代发展脚步的基础门槛。
从最早的工业革命开始,任何一种技术的发展,都是通过工具赋能,来增强人本身的能力,从而降低社会发展对专业人才的依懒性。让不会织布的工人通过纺纱机就能进行织布作业、让不会除草的居民通过割草机也能轻松修剪草坪,而AIGC也同样是一种工具赋能,让不会绘画的人可以制作出精美的图片、让文笔不好的人可以撰写出优秀的文本。
新技术改变人类生产和生活方式的同时,也催生生产关系的改变。蒸汽机和内燃机的问世,为汽车的诞生奠定了基础,但这仅仅是个开始。汽车真正成为改变世界的驱动力,是亨利·福特引入的流水线生产方式——一场关于生产关系的变革。从此汽车实现大规模生产,价格变得亲民,走进寻常百姓家,成为推动社会经济转型的强大引擎。
申请创业报道,分享创业好点子。点击此处,共同探讨创业新机遇!
近日,OpenAI宣布推出其最新旗舰生成式AI模型GPT-4o。相较于GPT-4Trubo,GPT-4o速度更快、价格也更便宜据悉,ChatGPT可以读取人类的情绪,但读取过程有一点困难。OpenAI,是一家位于美国旧金山的人工智能研究公司,现由营利性公司OpenAILP及非营利性母公司OpenAI
随着人工智能技术的飞速发展,大语言模型(LargeLanguageModels,LLMs)在各行各业的应用日益广泛,尤其是在软件开发、数据分析、客户服务等领域。蘑菇云创客空间[445期开放夜]就以“ChatGPT、Gemini、通义千问等一众大语言模型,哪家更适合您”这样的主题,开展了一次深度的大语
赶超GPT-4的阶段性升级,可以看作是国产大模型有序迭代部署、不断拉近差距的标志,切莫像手机跑分那样,在过度营销的作用下,沦为被群嘲的对象。
5月9日,记者获悉,微博已接入阿里云通义大模型,提升内容生产效率和社区活跃度。微博不仅是阿里云最早一批上云客户,也是阿里云通义大模型的最早客户。微博COO、新浪移动CEO王巍表示,AIGC发展速度远超想象,包括通义2.5在内,已涌现出不少大模型能力超越GPT4。同时他指出,大模型开源势不可挡。“阿里
5月9日阿里云AI峰会,通义灵码宣布推出企业版,满足企业用户的定制化需求,帮助企业提升研发效率。通义灵码是国内用户规模第一的智能编码助手,基于SOTA水准的通义千问代码模型CodeQwen1.5研发,插件下载量已超350万。通义灵码熟练掌握Java、Python、Go、JavaScript、Type
5月9日消息,通义大模型品牌升级,“通义千问APP”更名为“通义APP”,集成通义大模型全栈能力,免费为所有用户提供服务。通义APP以性能媲美GPT-4Turbo的基模为底座,并把通义实验室前沿的文生图、智能编码、文档解析、音视频理解、视觉生成等能力“Allinone”,成为每个人的全能AI助手。通
5月9日消息,阿里云正式发布通义千问2.5,模型性能全面赶超GPT-4Turbo,成为地表最强中文大模型。同时,通义千问最新开源的1100亿参数模型在多个基准测评收获最佳成绩,超越Meta的Llama-3-70B,成为开源领域最强大模型。相比通义千问2.1版本,通义千问2.5的理解能力、逻辑推理、指
5月9日消息,阿里云公布最新数据,通义大模型通过阿里云服务企业超9万,通义开源模型累计下载量突破700万。通义落地应用进程加速,现已进入PC、手机、汽车、航空、天文、矿业、教育、医疗、餐饮、游戏、文旅等领域,成为最受中国企业欢迎的大模型。阿里云AI峰会现场,小米旗下的人工智能助手“小爱同学”已与阿里
通义大模型发布一周年之际,迎来重要的历史性时刻。5月9日,阿里云正式发布通义千问2.5,模型性能全面赶超GPT-4Turbo,成为地表最强中文大模型。同时,通义千问1100亿参数开源模型在多个基准测评收获最佳成绩,超越Llama-3-70B,成为开源领域最强大模型。历经一年多追赶,国产大模型终于进入