1. 创业头条
  2. 前沿领域
  3. AI智能
  4. 正文

AI 如何赋能优质直播内容创作?

 2024-05-06 08:31  来源:  我来投稿 撤稿纠错

  域名预订/竞价,好“米”不错过

图片|电影《机械姬》剧照‍‍‍‍‍‍‍‍‍‍‍

©自象限原创

作者丨周乾

优质的直播内容已经成为各大直播间营收增长的核心驱动力,而在打造优质直播内容的方式中,AIGC无疑是目前更具性价比和效率的方向。事实上,AI在直播间的应用也越来越深入,比如AI数字人主播、AI技术推动直播服务的优化和升级等等。

直播行业线上化程度高,且内容质量直接决定其价值创造,这两大特征使得AIGC应用在其中能够产生最大化的价值,并能够迅速渗透至核心生产环节。

这些听起来让人感觉新的增长机会近在眼前,而参差不齐、真真假假的应用能力让人感到焦虑又踌躇——想跟上AI 浪潮,但投入了成本,真能产生效益吗?哪些层面才能产生效益?

为此,我们深入直播行业调研,并采访到直播行业的技术TOP厂商,将AI技术在直播行业的细分应用场景挖掘出来,供大家参考与讨论——AI+直播是如何降低直播内容生产的成本和门槛,来赋能优质直播内容的创作,提升直播内容的质量、互动性和个性化体验。

<h1 class="pgc-h-arrow-right" data-track="13">AIGC为内容生产降本提效</h1>

AI技术以“低门槛、低成本、高效率”的创作模式赋能直播内容创作,已经显著地推动了降本增效的进程。主要体现在以下几个方面:

虚拟主播生成:

AI技术可以生成虚拟主播形象和声音,通过深度学习算法训练模型,创造逼真的虚拟形象,提供新颖的直播体验。虚拟主播可以24小时不间断直播,不需要休息,也不受到情绪、健康等因素的影响。通过预先设定的脚本和互动话术,能够持续吸引用户注意力,提高直播的频率和覆盖度,同时减少了对真人主播的依赖,降低了成本。

直播行业TOP技术厂商即构科技目前也推出“即构数智人”产品,据相关产品负责人表示,目前的数字人技术厂商,主要是为客户提供一个saas软件,例如“即构数智人”平台,通过这个软件直接推流到第三方平台去做直播。然后客户在这个软件后台去设定所谓的“人货场”,即开播前在后台选择虚拟主播、提前设定好产品介绍,以及可以去生成数字化的直播场景。

AI主播作为一个新型事物,目前处在发展应用的初期,平台、商家,以及MCN等都表现出了拥抱探索的心态。技术的发展有一个过程,目前AI直播在互动反馈、画面效果等方面仍然存在着短板,而技术的突破也直接决定了数字人直播的发展走向。

内容创作辅助:

在内容创作的辅助方面,主要分为视频和音频两大类。

AI视频创作类工具,如百度的“度加”,允许用户输入文案后自动匹配视频素材和编辑,快速生成内容丰富的视频。AI技术还可以基于热点新闻和用户兴趣自动生成文案脚本,为创作者提供灵感和素材,降低创作门槛。还包括个性化推荐、实时弹幕处理等。

AI音频频创作类工具,AI技术在声音创作方向上提供了文本配音、音色定制、智能变声等功能,帮助创作者高效简洁地完成配音工作。以即构科技的“VC音色转换”为例,该技术可支持Any-to-One音色转换,即将任意说话人的语音转换为特定音色,算法可实时生成高清目标音色语音,保留原始语气与说话韵律。

比如,主播想把自己的语音转换为蜡笔小新的声音,就可以在直播过程中实时换上蜡笔小新的声音,等于是给自己的声音换上“新皮肤”,立即调动起直播间的氛围。

另外,AI为直播间的运营也提供极大助力,比如内容分析、推荐等,此环节与直播内容创作不直接相关,在此不做深入讨论。

<h1 class="pgc-h-arrow-right" data-track="36">AI技术优化带来内容质量提升</h1>

越来越多的直播间通过AI技术来优化直播内容质量,保护用户体验,从而留住更多用户。从内容生产来说(不包含运营环节),主要是两个方向:

首先是AI技术优化直播的清晰度和流畅度。

比如,在直播、1V1视频聊天中,外界环境“不友好”比如光线暗的时候,主播视频画面清晰度低,容易有噪点,粉丝的观感体验就很差,画面“又黑又糊”,很容易就丧失耐心,退出直播间。

而通过AI技术,比如即构科技“AI画质增强算法”,能够在光线暗的环境下,对主播开播视频画面进行“调色”:拉高亮度、饱和度、降低视频噪点,提升直播画面质感,相当于一个智能、实时的“调色插件”,这样以来,观看直播的用户对于直播间的好感度也会提高。

其次是直播技术创新方面,如AI辅助的绿幕技术、虚拟背景、AI降噪等,为直播带来新的视听效果。

直播三要素“人、货、场”中,直播间是否具备足够有创意、足够氛围感、足够引发观众”冲动消费“的场景,对于整场直播的销售效果有着直接的影响。因此各大直播间或者直播平台都选择用虚拟场景直播,用相比实景更加具有创意和吸睛的方式来撬动流量。

即构科技相关产品负责人反馈,一款绿幕应用(用于绿幕直播间实时换背景),在接入即构绿幕抠图技术后,半年内新增5万用户(也就是主播);23年下半年,该绿幕软件结合直播机一起售卖,目前已经新增近2千用户,今年预计将达到1万用户增量。

近10倍的效益增长足以显示出直播市场对于直播抠绿幕换背景的需求,我们也看到,越先使用AI+直播技术的,也越先收获了效益。

另外,在直播场景中,主播在做外景直播时,常常有不确定的噪音“乱入”,严重影响用户听感,甚至会让用户离开直播间。此时,主播通常选择降噪,但一般降噪技术,在降低噪音的同时,也会损伤音乐声音。假如主播表演个弹唱,降噪技术直接就把音乐伴奏识别为噪音,一并消除了大部分,别说普通用户的听感不舒适,对于热爱音乐的用户简直是一种折磨……

对此,即构科技针对性地推出了“场景化AI降噪”,在消除环境噪音的同时,还能保障纯净音乐伴奏声。并且能根据不同的直播环境(户外噪音环境&音乐演奏场景),智能调整最佳降噪策略——如果是户外噪音,没有音乐演唱,AI降噪将启动消噪,保障优质人声;如果环境里有音乐伴奏,AI降噪将自动识别音乐伴奏,降噪同时,保留人声和纯净音乐。如此,主播无论在怎样的环境开播,无需手动操作,AI降噪都能实时保护主播人声和音乐的最佳音质,保证用户最舒适的听感。

另外,AI技术还通过内容水印、内容指纹识别、监测与屏蔽技术等,保护直播内容的版权,减少盗版风险。

AI技术不仅提高了直播内容创作的效率和质量,还为直播平台和创作者提供了更多的创新可能性和商业机会。可以预见的是,随着AI技术的不断进步,未来直播内容创作将变得更加智能化、个性化和互动化。

AI 能发挥的“降本增效”的作用,无非是对劳动力的“替代”,而非“超越。但AI未来的发展速度将比我们想象的更快,对直播内容创作的赋能或许也很快就将从“降本增效”转变为“不可替代的全新生产方式”。积极拥抱AIGC,不仅仅是企业降本增效的手段,而是跟上时代发展脚步的基础门槛。

从最早的工业革命开始,任何一种技术的发展,都是通过工具赋能,来增强人本身的能力,从而降低社会发展对专业人才的依懒性。让不会织布的工人通过纺纱机就能进行织布作业、让不会除草的居民通过割草机也能轻松修剪草坪,而AIGC也同样是一种工具赋能,让不会绘画的人可以制作出精美的图片、让文笔不好的人可以撰写出优秀的文本。

新技术改变人类生产和生活方式的同时,也催生生产关系的改变。蒸汽机和内燃机的问世,为汽车的诞生奠定了基础,但这仅仅是个开始。汽车真正成为改变世界的驱动力,是亨利·福特引入的流水线生产方式——一场关于生产关系的变革。从此汽车实现大规模生产,价格变得亲民,走进寻常百姓家,成为推动社会经济转型的强大引擎。

申请创业报道,分享创业好点子。点击此处,共同探讨创业新机遇!

相关文章

  • 大模型“1元购”?AI公司加速奔向应用端“大航海时代”

    自字节跳动发布豆包大模型,互联网大厂纷纷就位,击穿“地板价”的打法从C端向B端拓展。这也成为今年“618”最亮眼的价格战。5月15日,字节跳动率先宣布豆包大模型已通过火山引擎开放给企业客户,大模型定价降至0.0008元/千Tokens;5月21日,阿里云宣布0.0005元可得1000tokens,百

  • 生产力工具中的“六边形战士”:解密海螺AI“红海突围”的底气

    2023年可以说是人工智能行业最振奋的一年,大模型的能力每隔一段时间就会上一个新台阶,汹涌澎湃的技术革命迅速影响着每一个人的生活,AGI不再是一种技术理想,而是触手可及的现实。到了2024年,人工智能的热度不减,但口口相传的“百模大战”并未上演。资本市场罕见地“降温”,不少大模型悄无声息地消失,有机

  • 谷歌发布多模态大模型重回领先,中国大模型谁能一战

    多模态是AI大模型发展的未来方向。

    标签:
    谷歌
    大模型
  • 大模型“黑洞”能否逆袭成盈利“金矿”?揭秘未来走向!

    ChatGPT运行日耗70万美金!GPT-4训练成本破10亿美金大关!OpenAI2024年财务警钟敲响,破产风险浮现!国产大模型烧钱大战升级!百度、科大讯飞、阿里、腾讯等巨头已烧掉上百亿资金!大模型背后的“烧钱”豪赌,谁能笑到最后?降低成本大模型成本怎么降低?有两条比较实用的路径大模型背后的成本确

  • 百度文心智能体有什么用、怎么创建和如何使用?

    前言:这是白杨SEO公号原创第530篇。为什么写这个?一个星期多前在白杨流量汇群看到有人问,自己实战测试研究了下分享给大家,也许对大家有点用。本文大纲:1、百度智能体是什么?2、百度智能体有什么用?3、百度智能体怎么创建?4、百度智能体如何用(营销)?百度智能体是什么?百度智能体,准确的叫法应该是百

    标签:
    百度文心
  • 通义千问GPT-4级主力模型降价97%,1块钱200万tokens

    C114讯5月21日消息(九九)阿里云今天抛出重磅炸弹:通义千问GPT-4级主力模型Qwen-Long,API输入价格从0.02元/千tokens降至0.0005元/千tokens,直降97%。这意味着,1块钱可以买200万tokens,相当于5本《新华字典》的文字量。这款模型最高支持1千万toke

编辑推荐