AI如何赋能优质直播内容创作？

2024-05-06 08:31 来源：A5用户投稿我来投稿撤稿纠错

©自象限原创

作者丨周乾

优质的直播内容已经成为各大直播间营收增长的核心驱动力，而在打造优质直播内容的方式中，AIGC无疑是目前更具性价比和效率的方向。事实上，AI在直播间的应用也越来越深入，比如AI数字人主播、AI技术推动直播服务的优化和升级等等。

直播行业线上化程度高，且内容质量直接决定其价值创造，这两大特征使得AIGC应用在其中能够产生最大化的价值，并能够迅速渗透至核心生产环节。

这些听起来让人感觉新的增长机会近在眼前，而参差不齐、真真假假的应用能力让人感到焦虑又踌躇——想跟上AI 浪潮，但投入了成本，真能产生效益吗？哪些层面才能产生效益？

为此，我们深入直播行业调研，并采访到直播行业的技术TOP厂商，将AI技术在直播行业的细分应用场景挖掘出来，供大家参考与讨论——AI+直播是如何降低直播内容生产的成本和门槛，来赋能优质直播内容的创作，提升直播内容的质量、互动性和个性化体验。

AIGC为内容生产降本提效

AI技术以“低门槛、低成本、高效率”的创作模式赋能直播内容创作，已经显著地推动了降本增效的进程。主要体现在以下几个方面：

虚拟主播生成：

AI技术可以生成虚拟主播形象和声音，通过深度学习算法训练模型，创造逼真的虚拟形象，提供新颖的直播体验。虚拟主播可以24小时不间断直播，不需要休息，也不受到情绪、健康等因素的影响。通过预先设定的脚本和互动话术，能够持续吸引用户注意力，提高直播的频率和覆盖度，同时减少了对真人主播的依赖，降低了成本。

直播行业TOP技术厂商即构科技目前也推出“即构数智人”产品，据相关产品负责人表示，目前的数字人技术厂商，主要是为客户提供一个saas软件，例如“即构数智人”平台，通过这个软件直接推流到第三方平台去做直播。然后客户在这个软件后台去设定所谓的“人货场”，即开播前在后台选择虚拟主播、提前设定好产品介绍，以及可以去生成数字化的直播场景。

AI主播作为一个新型事物，目前处在发展应用的初期，平台、商家，以及MCN等都表现出了拥抱探索的心态。技术的发展有一个过程，目前AI直播在互动反馈、画面效果等方面仍然存在着短板，而技术的突破也直接决定了数字人直播的发展走向。

内容创作辅助：

在内容创作的辅助方面，主要分为视频和音频两大类。

AI视频创作类工具，如百度的“度加”，允许用户输入文案后自动匹配视频素材和编辑，快速生成内容丰富的视频。AI技术还可以基于热点新闻和用户兴趣自动生成文案脚本，为创作者提供灵感和素材，降低创作门槛。还包括个性化推荐、实时弹幕处理等。

AI音频频创作类工具，AI技术在声音创作方向上提供了文本配音、音色定制、智能变声等功能，帮助创作者高效简洁地完成配音工作。以即构科技的“VC音色转换”为例，该技术可支持Any-to-One音色转换，即将任意说话人的语音转换为特定音色，算法可实时生成高清目标音色语音，保留原始语气与说话韵律。

比如，主播想把自己的语音转换为蜡笔小新的声音，就可以在直播过程中实时换上蜡笔小新的声音，等于是给自己的声音换上“新皮肤”，立即调动起直播间的氛围。

另外，AI为直播间的运营也提供极大助力，比如内容分析、推荐等，此环节与直播内容创作不直接相关，在此不做深入讨论。

AI技术优化带来内容质量提升

越来越多的直播间通过AI技术来优化直播内容质量，保护用户体验，从而留住更多用户。从内容生产来说（不包含运营环节），主要是两个方向：

首先是AI技术优化直播的清晰度和流畅度。

比如，在直播、1V1视频聊天中，外界环境“不友好”比如光线暗的时候，主播视频画面清晰度低，容易有噪点，粉丝的观感体验就很差，画面“又黑又糊”，很容易就丧失耐心，退出直播间。

而通过AI技术，比如即构科技“AI画质增强算法”，能够在光线暗的环境下，对主播开播视频画面进行“调色”：拉高亮度、饱和度、降低视频噪点，提升直播画面质感，相当于一个智能、实时的“调色插件”，这样以来，观看直播的用户对于直播间的好感度也会提高。

其次是直播技术创新方面，如AI辅助的绿幕技术、虚拟背景、AI降噪等，为直播带来新的视听效果。

直播三要素“人、货、场”中，直播间是否具备足够有创意、足够氛围感、足够引发观众”冲动消费“的场景，对于整场直播的销售效果有着直接的影响。因此各大直播间或者直播平台都选择用虚拟场景直播，用相比实景更加具有创意和吸睛的方式来撬动流量。

即构科技相关产品负责人反馈，一款绿幕应用（用于绿幕直播间实时换背景），在接入即构绿幕抠图技术后，半年内新增5万用户（也就是主播）；23年下半年，该绿幕软件结合直播机一起售卖，目前已经新增近2千用户，今年预计将达到1万用户增量。

近10倍的效益增长足以显示出直播市场对于直播抠绿幕换背景的需求，我们也看到，越先使用AI+直播技术的，也越先收获了效益。

另外，在直播场景中，主播在做外景直播时，常常有不确定的噪音“乱入”，严重影响用户听感，甚至会让用户离开直播间。此时，主播通常选择降噪，但一般降噪技术，在降低噪音的同时，也会损伤音乐声音。假如主播表演个弹唱，降噪技术直接就把音乐伴奏识别为噪音，一并消除了大部分，别说普通用户的听感不舒适，对于热爱音乐的用户简直是一种折磨……

对此，即构科技针对性地推出了“场景化AI降噪”，在消除环境噪音的同时，还能保障纯净音乐伴奏声。并且能根据不同的直播环境（户外噪音环境&音乐演奏场景），智能调整最佳降噪策略——如果是户外噪音，没有音乐演唱，AI降噪将启动消噪，保障优质人声；如果环境里有音乐伴奏，AI降噪将自动识别音乐伴奏，降噪同时，保留人声和纯净音乐。如此，主播无论在怎样的环境开播，无需手动操作，AI降噪都能实时保护主播人声和音乐的最佳音质，保证用户最舒适的听感。

另外，AI技术还通过内容水印、内容指纹识别、监测与屏蔽技术等，保护直播内容的版权，减少盗版风险。

AI技术不仅提高了直播内容创作的效率和质量，还为直播平台和创作者提供了更多的创新可能性和商业机会。可以预见的是，随着AI技术的不断进步，未来直播内容创作将变得更加智能化、个性化和互动化。

AI 能发挥的“降本增效”的作用，无非是对劳动力的“替代”，而非“超越。但AI未来的发展速度将比我们想象的更快，对直播内容创作的赋能或许也很快就将从“降本增效”转变为“不可替代的全新生产方式”。积极拥抱AIGC，不仅仅是企业降本增效的手段，而是跟上时代发展脚步的基础门槛。

从最早的工业革命开始，任何一种技术的发展，都是通过工具赋能，来增强人本身的能力，从而降低社会发展对专业人才的依懒性。让不会织布的工人通过纺纱机就能进行织布作业、让不会除草的居民通过割草机也能轻松修剪草坪，而AIGC也同样是一种工具赋能，让不会绘画的人可以制作出精美的图片、让文笔不好的人可以撰写出优秀的文本。

新技术改变人类生产和生活方式的同时，也催生生产关系的改变。蒸汽机和内燃机的问世，为汽车的诞生奠定了基础，但这仅仅是个开始。汽车真正成为改变世界的驱动力，是亨利·福特引入的流水线生产方式——一场关于生产关系的变革。从此汽车实现大规模生产，价格变得亲民，走进寻常百姓家，成为推动社会经济转型的强大引擎。

申请创业报道，分享创业好点子。点击此处，共同探讨创业新机遇！

OpenAI发布GPT-4o 能读取人类情绪

近日，OpenAI宣布推出其最新旗舰生成式AI模型GPT-4o。相较于GPT-4Trubo，GPT-4o速度更快、价格也更便宜据悉，ChatGPT可以读取人类的情绪，但读取过程有一点困难。OpenAI，是一家位于美国旧金山的人工智能研究公司，现由营利性公司OpenAILP及非营利性母公司OpenAI

标签：

chatgpt
ChatGPT、Gemini、通义千问等一众大语言模型，哪家更适合您？

随着人工智能技术的飞速发展，大语言模型(LargeLanguageModels,LLMs)在各行各业的应用日益广泛，尤其是在软件开发、数据分析、客户服务等领域。蘑菇云创客空间[445期开放夜]就以“ChatGPT、Gemini、通义千问等一众大语言模型，哪家更适合您”这样的主题，开展了一次深度的大语
体验了下钉钉AI助理，真羡慕现在的“打工人”...

对于万千打工人来说，AI不会替代我们，反而会成为工作中重要的帮手

标签：

钉钉
历时400多天，国产大模型全面赶超GPT-4？

赶超GPT-4的阶段性升级，可以看作是国产大模型有序迭代部署、不断拉近差距的标志，切莫像手机跑分那样，在过度营销的作用下，沦为被群嘲的对象。

标签：

大模型
微博COO王巍：微博已接入阿里云通义大模型，是通义最早一批外部客户

5月9日，记者获悉，微博已接入阿里云通义大模型，提升内容生产效率和社区活跃度。微博不仅是阿里云最早一批上云客户，也是阿里云通义大模型的最早客户。微博COO、新浪移动CEO王巍表示，AIGC发展速度远超想象，包括通义2.5在内，已涌现出不少大模型能力超越GPT4。同时他指出，大模型开源势不可挡。“阿里
通义灵码推出企业版，底座模型CodeQwen1.5登顶权威榜单

5月9日阿里云AI峰会，通义灵码宣布推出企业版，满足企业用户的定制化需求，帮助企业提升研发效率。通义灵码是国内用户规模第一的智能编码助手，基于SOTA水准的通义千问代码模型CodeQwen1.5研发，插件下载量已超350万。通义灵码熟练掌握Java、Python、Go、JavaScript、Type

标签：

通义千问

通义千问APP更名为通义APP，免费开放通义全栈能力

5月9日消息，通义大模型品牌升级，“通义千问APP”更名为“通义APP”，集成通义大模型全栈能力，免费为所有用户提供服务。通义APP以性能媲美GPT-4Turbo的基模为底座，并把通义实验室前沿的文生图、智能编码、文档解析、音视频理解、视觉生成等能力“Allinone”，成为每个人的全能AI助手。通

标签：

通义千问
阿里云发布通义千问2.5，性能全面赶超GPT-4 Turbo

5月9日消息，阿里云正式发布通义千问2.5，模型性能全面赶超GPT-4Turbo，成为地表最强中文大模型。同时，通义千问最新开源的1100亿参数模型在多个基准测评收获最佳成绩，超越Meta的Llama-3-70B，成为开源领域最强大模型。相比通义千问2.1版本，通义千问2.5的理解能力、逻辑推理、指

标签：

通义千问
通义大模型通过阿里云服务企业超9万，开源模型下载超700万

5月9日消息，阿里云公布最新数据，通义大模型通过阿里云服务企业超9万，通义开源模型累计下载量突破700万。通义落地应用进程加速，现已进入PC、手机、汽车、航空、天文、矿业、教育、医疗、餐饮、游戏、文旅等领域，成为最受中国企业欢迎的大模型。阿里云AI峰会现场，小米旗下的人工智能助手“小爱同学”已与阿里

标签：

通义千问
阿里云发布通义千问2.5，中文能力地表最强

通义大模型发布一周年之际，迎来重要的历史性时刻。5月9日，阿里云正式发布通义千问2.5，模型性能全面赶超GPT-4Turbo，成为地表最强中文大模型。同时，通义千问1100亿参数开源模型在多个基准测评收获最佳成绩，超越Llama-3-70B，成为开源领域最强大模型。历经一年多追赶，国产大模型终于进入

标签：

通义千问