2023 年人工智能行业深度分析研究报告(附下载)

充电研究社

2023/08/28 12:06

今天分享的是人工智能系列深度研究报告:《 2023 年人工智能行业深度分析研究报告 》。

1. AI+办公是 AIGC 浪潮的核心,有望深刻改变办公 模式

1.1. AI+办公是 AIGC 浪潮的核心,海外巨头引领潮流

AI+办公是此次 AIGC 浪潮中的核心受益方向。此次 AIGC 浪潮的引爆 点是基于自然语言处理大模型技术的文字创作工具 ChatGPT 快速成长 为火爆全球的现象级应用,随后基于对图像、视频、音频等进行处理的 多模态大模型的应用也快速推广起来。AIGC 即生成式人工智能天然是 面向文字、音视频、图像等内容自主创作场景的 AI 技术,因而其可以直接提升现有各类型办公软件的产品力,从而推动办公软件的迭代升级。

微软推出 Microsoft 365 Copilot 订阅服务,用 AIGC 技术重塑办公体验。 2023 年 3 月 16 日,微软正式发布 Microsoft 365 Copilot 订阅服务,其背 后技术支撑是 Copilot 引擎,使用了 Microsoft 365 Apps、Microsoft Graph 和 Large Language Model 三大核心基础技术。Microsoft 365 Apps 是 Word、 Excel、PowerPoint、Outlook、Teams 等一系列常见的微软办公软件; Microsoft Graph 是一个可以帮助访问在 Microsoft 365 Apps 上积累的用 户业务数据的安全智能网关,这些数据来自于用户的文档、电子邮件、 会议、聊天、日历等环节;大语言模型(LLM)是一个创造性的引擎, 能够解析并产生人类可以阅读的文字,其使用了 OpenAI 的 ChatGPT 及 最新发布的 GPT4 模型。用户在 Microsoft 365 Apps 里使用自然语言输入 提示词后,提示词会通过 Copilot 系统进行基础训练,这一过程可以提 高提示词的质量,使提示词变得可以被执行,在基础训练的过程中最重 要的一环便是调用 Microsoft Graph 中用户此前产生的各项数据,来理解 并改善提示词的质量,之后将改善后的提示词发送给 LLM,前述过程叫 做预处理。LLM 对提示词进行响应并进行后处理,这个过程会再次通过 Microsoft Graph 调用用户数据进行训练后,在通过安全性、合规性和隐 私审查之后,生成反馈答复,最后通过 Copilot 系统向用户输出反馈答 复并驱动 APP 执行相关的命令。通过这样一套完整的处理流程,用户可 以在 Word 等办公软件里通过自然语言下达指令,此后办公软件便自动 呈现出一个具有明显个人信息特征的反馈初稿,极大提高了用户的办公 效率。

Microsoft 365 Copilot 为用户办公模式带了个革命式的变化,有助于 提高办公创作效率。Microsoft 365 Copilot 一方面会嵌入到用户高频 使用的各类办公软件之中,包括了 Word、Excel、PowerPoint、Outlook、 Teams 等,从而帮助用户从繁琐的事务性工作中解放出来,让用户更专 注于创造性工作,从而提高办公效率。另一方面还引入了全新的商务聊 天(Business Chat)应用场景,可以基于用户过往积累各项业务数据, 按照用户需求生成全新的内容,提高创作效率,例如用户提出“请告诉 团队成员如何更新销售策略”指令后,系统会根据用户过往的会议讨论 记录、聊天记录、电子邮件沟通内容等生成一份全新的销售策略。用户 可以对生成后的内容进行自主修改、保留或舍弃,使得 Word 更具创造 性、Excel 更具分析性、PowerPoint 更具表现力、Outlook 更具效率性、 Teams 更具协作性。

Microsoft 365 Copilot 使用自然语言作为人机交互的渠道,降低了 Office 办公软件的使用门槛。根据微软发布会上披露,有 90%以上的 PowerPoint、 Excel 功能是不被用户使用的。我们认为这一现象并不是因为这些功能 无用,而是过往通过菜单按钮或者函数公式的方式进行交互的门槛较高, 多数用户未经过系统学习就无法直接调用相关功能。引入 Copilot 之后, 所有的办公软件在右侧都会形成一个聊天框,用户将自己想要实现的效 果(如进行某种排班、添加某种动画效果或者进行某种特殊运算)以自 然语言聊天的方式输入后,软件会直接实现相关的功能,从而使得丰富 的软件功能都得到应用,极大降低了用户的使用门槛,有助于进一步提 高用户规模和粘性,从而提高付费月活用户数量。完整版《2023 年人工智能行业深度分析研究报告》来源于公众号:百家全行业报告 研究报告内容节选如下

打开APP,查看更多精彩图片

Microsoft 365 Copilot 的推出将为微软带来新的收入来源,提高付费用 户 ARPU。目前 Microsoft 365 Copilot 仍处于内部测试阶段,根据科技 媒体 The Information 报道,微软正在向包括美国银行、沃尔玛、福特 和埃森哲等在内的 600 多家大型机构客户测试具备 AI 能力的 Microsoft 365 Copilot 订阅服务,在已经付费订阅 Microsoft 365 年费会员的基 础上,每 1000 名员工使用 Copilot 服务需要支付的额外年费为 10 万美 元,对应额外的 ARPU 为 100 美元,目前试点客户的付费意愿超出微软 早先预期。我们根据微软财报数据测算,2022 年 Microsoft 365 机构订 阅的 ARPU 约为 103 美元,此次 Copilot 服务的试点价格有望推动 ARPU 实现接近翻倍增长

Adobe 推出生成式 AI 模型集 Firefly,展示出强大的设计创作能力。2023 年 3 月 21 日,Adobe 正式推出生成式 AI 模型集 Firefly,随后在 Photoshop 应用中进行了测试上线。目前其主要具备以下能力:1)文字 转图像,Firefly 可以根据用户的提示词自动生成所需图像,如输入“天 空增加极光”指令之后,可以自动为图像中的天空部分增添极光;2) 生成填充能力,可以根据原始图像中内容,自动拓展、填充、扩容成为 一个内容更加丰富的图像;3)文字效果:将特定纹理显示到艺术字体 中等。后续 Firefly 还将探索视频自动处理、文字生成 3D/矢量文件、 草图变全彩图像等一系列 AI 功能。Firefly 的推出有望极大提高设计创 作效率,降低设计创作用户门槛,改变目前的创意设计行业格局。

1.2. 国内办公软件厂商奋起直追,AIGC 功能实现快速迭代

金山办公是国内办公软件厂商探索 AI 技术应用的先行者之一。2017 年, AI 在金山办公内部被首次上升到战略层面,由姚冬组建了数百人的 AI 团队,主要负责 AI 算法改进和工程产品的落地。2018 年,金山办公正 式对外提出了“多屏、内容、云、AI”的发展战略,AI 战略公开亮相。 在 AI 团队成立的前两年,团队主要强调积累 AI 研发能力,包括算法能 力、工程能力、数据采集和分析能力等。之后两年公司开始更加注重 AI 技术的产品化,在公司产品中增加了一系列 AI 功能,推出了包含智 能美化、智能校对、智能辅助写作、全文翻译、图像识别等一系列的AI 辅助办公功能,来帮助提高用户的办公效率。例如智能美化可以帮助 用户在提供基础文本的情况下整体改换 PPT 模板和配色、统一字体和排 版等;智能校对可以一键识别并校对文档中的错别字、多漏字、标点符 号错误、语法错误、敏感词错误等;智能辅助写作可以根据提纲自动生 成文字段落或者进行句子补写,帮用户打底稿,其储备的数千万篇语料 库都来自于权威媒体和政府公开网站,在公文写作等场景上有较多应用。 截止 2021 年 7 月,WPS 的智能美化月活用户超过百万,智能校对的月 校对字数超过了 70 亿,智能生成的内容占据了云端整体内容资源的 33.6%,AI 战略对公司产品力和用户粘性的提升已经体现出明显的帮助。 现阶段及未来,公司发展战略的重心已经成为加速 AI 产品的产业化, 强化对公司营收增长的积极作用,从而实现长期的可持续发展

金山办公接入多个大模型供应商,可以更精准的满足用户AI创作需求。 目前金山办公的产品已经接入了 MiniMax、百度文心、CopyDone 等多 家大模型,未来还有望接入新的大模型。目前市面上可供选择的大模型 正在持续增加,既包括百度、阿里、科大讯飞等巨头的大模型产品,也 包括初创公司的产品。各家大模型目前的表现各有所长,并没有哪一家 有绝对领先的产品力表现,因而同时接入多家大模型,按照不同的用户 需求去匹配调用不同的大模型进行内容创作,能够更好的满足用户的创 作需求。例如 CpoyDone 是一个专门面向场景营销打造的大模型,可以 生成丰富商品类型、海量内容平台风格的文案、图片、视频内容,因为 在文案营销场景 WPS 可以优先对接 CopyDone 大模型;MiniMax 是一个 多模态大模型,在对华聊天等场景更有优势;百度文心则凭借其丰富的 语料库在文学创作等领域可以更好的满足用户需求;WPS 作为大模型的 调度匹配中心,可以统筹各家大模型发挥出“1+1>2”的效果

基于 AI 大模型的 WPS 轻文档率先进入内测阶段,展示出较强的文字创 作能力。2023 年 4 月 18 日,金山办公发布了 WPS AI 的 Demo 演示视 频,官宣 WPS AI 将嵌入金山办公全线产品。率先进入内测阶段的是具 备 AI 能力的 WPS 轻文档,这是一款对标 Notion AI 等轻办公产品的在 线内容协作编辑工具,可以借助大模型自动生成新闻稿、工作周报、运 营策划案等;也可以实现多轮对话,持续就某个主题进行讨论;也可以 对现有文档进行改写、扩写、缩短、润色等;还可以对指定文档生成主 旨摘要、文章大纲等功能。WPS AI 显示出较强的文字创作能力,有望 提升用户创作效率

金山办公类 Copilot 的客户端产品仍在持续打磨之中,有望成为提升用 户付费率的重量级手段。公司对标 Copilot 的办公客户端产品,也就是 采用自然语言作为人机交互方式,并将 AI 创作功能直接嵌入到包括文字、演示、表格、PDF 在内的全套 WPS 产品,是用户更加关注的产品。 2023 年 5 月 16 日,金山发布了类 Copilot 功能的演示 Demo,WPS 表格 将具备智能数据理解与分析能力,WPS 文字和演示将具备内容生成、文 字润色能力,能根据用户命题自动进行文档创作,WPS PDF 可进行内容 要点概括、文档大纲生成、文档内容问答等功能。类比微软 Copilot,语 义理解是大模型为办公软件带来的核心能力,使 WPS 可以在用户需求理 解、内容创作、内容分析等方面获得提升,有利于提高创作效率,提升 付费率;人机交互方式的创新则是大模型为办公软件带来的创新能力, 用户只需关注最终要实现的创作目的,用自然语言下达指令,WPS 可以 自动完成相关运算并输出最终结果,从而大幅度降低使用壁垒,有利于 扩大用户群,从而进一步打开公司的长期成长空间。

福昕软件在海外版 PDF Editor Cloud 中集成 ChatGPT,向用户提供 AIGC 功能。福昕软件是 PDF 板式办公软件龙头企业,其推出的 Foxit PDF Editor Cloud 是一款在线 PDF 编辑器,用户可以通过该工具在线阅读及 编辑 PDF 文件。2023 年 4 月 25 日,海外版的 Foxit PDF Editor Cloud 成功集成 ChatGPT,付费用户目前主要可以使用以下 AIGC 功能,1)文 档摘要,根据文档内容快速生成简洁、准确的摘要;2)文档改写,在 不改变文档原意的情况下进行重写,优化文档的表述方式,提高可读性; 3)文档翻译,将选定内容或者摘要翻译成指定语言;4)文档内容问答, 可以在对话框中就感兴趣的内容进行提问,其将根据文档内容生成答案, 并定位到相应段落。通过上述功能,可以显著提高用户的文档阅读效率 以及多语言工作环境下的工作效率。作为一款线上编辑软件,Foxit PDF Editor Cloud 的 AI 功能具备快速迭代的优势,预计每两个星期就推出 一个新版本,持续拓宽 AIGC 技术在文档领域的数字化场景应用,优化 用户体验,从而提供用户付费率

AIGC 功能有望提升福昕软件 ARPU。由于 Foxit PDF Editor Cloud 提供 的 AI 功能基于 ChatGPT,因而对用户均有次数/字数限制,文档改写每 用户每月上限为 100 页;文档翻译每用户每日上限为 50 个指令,每个 指令最多 2000 字;文档内容问答每用户每日上限为 50 个指令或问题; 一旦超过相应限制,用户需要进行额外付费,从而有助于提高用户 ARPU。

万兴科技拥有完善的创意办公软件产品线,是国内创意办公软件的领跑者。公司产品涵盖视频创意、绘图创意、文档创意和实用工具四大类别, 形成了万幸喵影、万兴播爆、亿图脑图、万兴爱画、万兴 PDF 等具有广 泛影响力和庞大用户群的核心创意办公软件产品

万兴科技长期加码 AI 技术研发投入,AI 产品逐渐进入落地期。公司从 2020 年就开始洞察到 AI 技术的发展前景,并快速组建了一支上百人的 高素质技术研发团队,近两年在视频生成算法、图像生成算法、GAN 生 成算法、音频生成算法等 AI 前沿算法等领域均取得多项技术研发成果, 自 2022 年下半年以来公司视频创意、文档创意、绘图创意等主要产品线均陆续发布了带有 AI 功能的新版本,并推出融入多项 AI 技术的新产 品。在视频创意产品线,2022 年公司完成了万兴喵影大版本更新,上线 了 AI 分割、AI 抠像、AI 降噪、AI 音频重组、AI 文案生成等 AI 功能套 件,并在 2022 年底发布了基于 AIGC 技术的数字人营销视频创作工具万 兴播爆,可以实现文生视频、虚拟人直播等 AI 功能;在绘图创意产品 线,2022 年 11 月公司上线全新的 AIGC 图像生成工具-万兴爱画,支持 AI 文字绘画、AI 以图绘图、AI 简笔画三种创作模式,用户输入一段文 字描述即可获得多种艺术风格的 AI 绘画作品,或者输入图片后将其转 化为绘画作品;在文档创意产品线,公司发布万兴 PDF 的全新版本,引 入 AI 技术,新增翻译等专业功能,提升用户体验。

万兴科技积极拥抱大模型技术,推动 AI 产品力实现快速提升。2023 年 2 月,公司宣布其在海外运营的视频创意软件 Wondershare Filmora 已 经全面接入了ChatGPT母公司OpneAI的商用服务,在3月份开通了GPT-4 模型的商用账号权限,在 4 月份与微软签订云服务框架协议,双方将在 云服务及 AI 技术领域全面深化合作,未来优先使用微软新品,目前正 在持续推动多个海外产品接入 GPT 大模型。2023 年 3 月 31 日,公司发 布基于 AIGC 大模型的“真人”出海营销短视频工具-万兴播爆,并在 6 月推出桌面版产品,万兴播爆基于 AIGC 大模型可以提供 120 多种语言 的文案脚本快速生成能力以及 60 多种国籍的数字人播报能力,还可以 进行数字人的定制服务,相较传统视频生产模式,万兴播爆可以使成本 投入降低至原先的 1/5,并大幅提升用户的生产效率。

AIGC 新品为万兴科技带来新的盈利点,有望提升用户 ARPU。公司传 统的万兴喵影个人年费会员定价为 269 元,5 年期会员的年费进一步降低 至 120 元;万兴喵影企业年费会员定价为 3299 元,可支持 5 台设备同 步使用,相当于单设备年费价格为 660 元。公司推出的 AIGC 新品中, 万兴播爆的年费会员定价为 1688 元,相较传统软件产品的定价有显著 提升;万兴爱画则按照创作次数进行付费,10 次图片创作合计 5 元,最 便宜的 100 次图片创作合计费用为 20 元,按次收费的方式在客户需求 侧有更高的成长上限。总体来看,AIGC 新品的定价要高于传统创意软 件,有望为万兴科技带来新的盈利点,提升用户 ARPU。

2. 智能驾驶是 AI 大模型落地的重要场景

2.1. 自动驾驶:AI 大模型有助于我们提升覆盖小概率路况的效率

2.1.1. 对小概率路况的覆盖是自动驾驶落地的核心问题

由于一旦发生事故造成的后果极为严重,自动驾驶是一个对小概率情况 非常敏感的场景。由于交通事故将会产生非常严重的后果,对于主机厂 而言,在责任明晰之前,即使是 99.99%的可靠性也是不能接受的,因为 这可能意味着每卖出 10000 台车可能就会产生一起事故。行业特点决定 了要实现自动驾驶就必须先对长尾场景进行有效覆盖。

测试里程的积累是有效覆盖小概率路况的前提。根据广汽的预测,要实 现 L4 级自动驾驶所需要的长尾场景覆盖程度,至少需要完成 10 亿个测 试场景,最小测试里程也需要 10 亿公里,这两个数据分别是实现 L2 级 自动驾驶的 10 万倍、1 万倍

此前,测试里程的积累主要有两种方式。一种是通过自动驾驶车队来进 行数据采集,以 Waymo 为代表;一种是通过私家车进行数据采集,以特斯拉为代表。

1.通过自动驾驶车队进行路测来覆盖小概率路况的方法效率比较低。 Waymo 是自动驾驶领域的霸主,但是在过去很多年里,感知问题、 行人问题、软件问题等方面,Waymo 的接管频率并没有收敛(基于 加州路测报告)。毫无疑问,Waymo 的自动驾驶能力是逐年增强的。 那么,Waymo 在软件问题、行人问题等方面的表观“退步”就只能 用它在覆盖更多的小概率路况来解释。比如,在高速公路等路况相 对简单的场景下测试获得好的结果之后,Waymo 会把路测地点逐渐 向难度更高的城区街道进行拓展。

2.众包方式能在一定程度上提升对小概率路况的覆盖效率。特斯拉采 用影子模式取代测试车队。影子模式本质上是通过众包的方式来解 决场景的快速积累问题。在这一模式下,即使在人进行驾驶的时候 特斯拉自动驾驶系统同样也在进行计算自己会怎么做,然后和人的 选择进行对比。如果自动驾驶系统和人的选择不一致,就对这类数 据进行汇集,然后交由工程师判断自动驾驶系统的选择是否合理。 2020 年 3 月,特斯拉就申请了从车队中获取自动驾驶训练数据的专 利。由于特斯拉的汽车数量远远多于自动驾驶测试车队,影子模式 可以更快地实现对驾驶长尾场景的积累,同时得到的结果也有更强 的统计学意义。截至 2019 年末,特斯拉累计交付搭载自动辅助驾 驶硬件的车辆 85 万辆,AP 激活状态下累计行驶里程已超过 20 亿 公里,远远超过竞争对手(Waymo 为 2000 万公里)。由于特斯拉保 有量持续攀升,其他竞争对手和特斯拉之间在数据积累量以及长尾 场景覆盖程度上的差距将会越拉越大。

2.1.2. 大模型对于覆盖小概率路况意义重大

2.1.2.1. 大模型可以大幅提升场景生成、标注的效率 随着 AI 大模型的出现,我们覆盖自动驾驶小概率路况的效率有望大幅 提升,这种效率提升至少源于两个方面:

场景生成

利用 AI 大模型进行场景生成是覆盖小概率路况的新思路。相对于 单纯的路测,直接进行场景生成,并将仿真结果与路测相结合对于 快速实现路况覆盖大有裨益。比如毫末已发布 DriveGPT 雪湖·海 若,可以实现三项能力:

1)按照概率生成很多个场景序列,每个场景序列都是未来可能会 出现的一种实际路况;

2)在所有场景序列都产生的情况下,能对场景中最关注的自车行 为轨迹进行量化。可以实现在生成场景的同时就产生自车未来 的行车轨迹;

3)基于所生成的轨迹,实现决策逻辑链的输出。

值得注意的是,毫末的雪湖·海若引入了类似于 GPT 系列模型中的 人类反馈强化学习机制。即把系统和驾驶员的判断和决策进行对比, 若对比结果一致,系统会被打高分,反之则会被打低分。这与特斯 拉 FSD 的模式有异曲同工之妙。

数据标注

除场景生成外,AI 大模型在自动标注方面同样能够发挥重要作用。 在 AI 的 1.0 时代,数据标注主要依赖于人工,导致数据的标注时间 很长,且成本比较高。尤其在自动驾驶领域,由于路况复杂,存在 大量的标注需求。基于大模型可以实现自动标注,从而大幅度降低 成本,提升效率。如毫末智行的雪狐海若将场景识别能力对外开放。 此前采用普通的标注方案标注一张图片需要约 5 元,而 DriveGPT 雪湖·海若只需要 0.5 元,大幅节约了成本。

作为行业的领军者,特斯拉给出了通过道路重建作为车道线感知真 值进行 4D 标注的方案,其本质上是一个基于 Tesla 强大视觉感知能 力的众包建图。

1)2018 年之前:采用纯人工进行 2 维图像标注,效率较低;

2)2019 年:人工进行 3D 固定框的图像标注,当时的拓扑只是基 于单趟轨迹,重投影精度<3pixel,整个标注还比较依赖人工, 需要 3.5 小时进行一个 clip 标注;

3)2020 年:采用 BEV 空间进行标注,这里可以看到此时的建图已经是基于 BEV 感知进行的建图,重投影精度<7pixel,人工 标注耗时小于 0.1 小时,已经基本可以实现自动标注;

4)2021 年至今:首先对场景进行重建后在 4D 空间(关于 2021 年开始采用的 4D 标注,早在 19 年 Autonomous Day 上 Karpathy 就做过了介绍,当时 Tesla 使用的是 SfM 的方式进行周围场景 重建,然后再在重建的点云上进行 4D 标注)中进行标注,使 用 3D 特征进行多趟采集轨迹的聚合重建,重投影精度从 (<7pixel)优化到(<3pixel),人工标注耗时与 2020 相当,但 计算时间从 2hrs 降低到 0.5 和 hrs,可扩展性也变得非常强,可 以取代 500 万小时的人工作业量,人工仅需要检查补漏。

2.1.2.2. 大模型虽难以完全解决小概率路况的问题,但依然对自动驾驶 行业意义重大

当然,必须承认的是,大模型依然无法帮助我们 100%解决小概率路况 带来的问题。

1)大模型能力来自于深度学习,而不来自于强化学习。从技术路线来 看,大模型是“深度学习+人类反馈强化学习”。为了测试强化学习 对于模型能力的影响,Open AI 分别基于 GPT-4 基础模型和加入强 化学习的 GPT-4 模型运行了一系列考试中的多项选择题部分。结果 显示,在所有的考试中,基础的 GPT-4 模型的平均成绩为 73.7%, 而引入强化学习后的模型的平均成绩为 74.0%,这意味着强化学习 并没有显著改变基础模型的能力,换句话说,大模型的能力来自于 模型本身。根据 Open AI 的表述,强化学习的意义更多地在于让模 型的输出更符合人类的意图和习惯,而不是模型能力的提升(有时 甚至会降低模型的考试成绩)。

2)既然大模型没有摆脱深度学习框架,这就意味着现阶段的 AI 背后 依然是统计学,无法彻底解决残差问题。换言之,“能力的不可解 释性”问题依然无法在根本上得到解决,我们依然无法实现 100% 的正确,只能通过覆盖更多小概率路况的方式来提升安全性。

3)大模型理论上难以帮助我们实现小概率路况的 100%覆盖。从本质 上来说,利用 AI 大模型进行路况生成虽然能大幅提升效率,但依 然类似穷举。而通过穷举法实现对小概率路况的全覆盖从理论上不 太可能实现,本质的原因在于“路况本身是一个无限场景”。试想 一下,如果我们要打开一个密码箱,我们只需要从“000”到“999” 全部尝试一遍,箱子就必然已经被打开了;同样的道理,在棋类运 动中,每一步可以“落子”的情况都是有限的集合,换句话说,所 有可能性是也是可以被遍历的,所以这两个场景都是“有限场景”, 而公开道路自动驾驶场景则是一个“无限场景”。

但我们不能因大模型难以 100%解决问题而低估其对自动驾驶行业的帮助。无法单纯从技术上解决问题并不意味着大模型对于自动驾驶的落地 没有意义。我们认为,技术的突破和法律、伦理的放缩将“相向而行”, 从而最终在一个可以接受的安全性范围内实现平衡。可以试想一下,如 果人类没有发明汽车,可能也不会有目前那么多的交通事故,但显然并 不会有人因为这一点抵制汽车这一为人类社会带来巨大帮助的发明。

2.2. AI 助力智能座舱交互体验提升

智能座舱交互属性毫无疑问会不断上升。

1)从必要性角度:汽车行业正从卖方市场转向买方市场,行业演进的 核心驱动因素由技术与产品转变为消费者需求。传统汽车工业已走 过百年,随着行业的高度成熟,这一市场正逐渐由卖方市场转变为 买方市场,行业向前发展的关键因素也从技术的突破和产品的打磨 转向消费者的需求变化。

3)从可行性角度:随着 EE 架构的集中化,以及主控芯片算力的提升, 将可以支撑越来越多新的功能点。

AI 大模型可以丰富和革新人与车辆的交互方式。在座舱内,驾驶员会与汽车通过语音、视觉等多种方式产生交互,毫无疑问,AI 大模型有助于 交互体验的提升。如驾驶员将可以通过自然语言的方式和系统进行沟通, 比如选择一条更快的路或是收费更少的路;或者系统会对驾驶员的各种 习惯进行学习,比如什么时间在什么地方喜欢买咖啡,从而对驾驶员进 行建议;再或是基于天气提示驾驶员带雨伞等等。

2.3. AI 带动车辆研发设计效率提升

随着项目周期的压缩,汽车研发效率正变得越来越重要。

1)汽车的开发周期正逐渐缩短,这使得供应商的项目周期被大幅压缩, 此前项目可能是 2-3 年,而现在可能是 1 年多甚至不到 1 年,同时 主机厂的定制化需求却越来越多,更短的开发周期和更多的定制化 需求对 Tier1 的智能制造能力提出了更高的要求。

2)随着自动驾驶功能模块逐渐增加,需要测试的里程数快速增加,并 没有完全足够的时间进行路测,同时由于涉及到安全,测试环节本 身不能简化,所以设计、测试的效率在一定程度上正逐渐成为制约 项目能否快速及时交付的重要因素

AI 大模型对于汽车设计师效率的提升意义重大。比如中科创达 Genius Canvas 将语言能力、视觉渲染以及特效制作能力结合在一起,可以通过 辅助概念创作、辅助 3D 元素设计、辅助特效代码生成和辅助场景搭建 及制作多方面帮助设计师完成创作过程,从而优化工作流程,并提高设 计师的工作效率。概念创作方面,它能够把 3-4 周的工作周期缩短到 1 周,节省 70%的时间。3D 元素设计方面,它能够把 4~6 周的工作周期 缩短到 3 天,节省 85%的时间。特效及场景制作方面,它能够节省 90% 的时间。

2.4. 国内智能驾驶公司积极拥抱 AI 新趋势

2.4.1. 中科创达:推出 Genius Canvas,提升 HMI 交互体验

中科创达重视 AI 技术,利用 kanzi 推动智能驾驶舱的发展。在 2022 年, 中科创达公布与地平线成立合资公司,聚焦智能驾驶赛道。kanzi 是一 个具有强大实时 3D 渲染能力的工具。中科创达推出的智能驾驶舱 3.0 使用了 Kanzi for Android 这种新技术,使得 Android 系统和 Kanzi 完 美对接,实现了 3D 唱片、可定制实景导航、实时界面个性化定制、跨 屏幕跨系统应用等功能。

中科创达利用 Kanzi 实现智能驾驶舱多屏交互。由于智能驾驶涉及人机 共驾,智能汽车所承载的驾驶员信息、车外环境信息、车辆信息等越来 越多,需要有更多的空间、分区域地呈现给用户,并确保和驾驶员有良 好交互。基于 Kanzi for Android 支持的多屏联动,在导航的过程中可以 实现地图跨屏,全方位呈现 3D 导航;在导航结束时,可将地图由副驾 驶屏收缩至中控屏。多方选择以适应更多的个性化需求。

中科创达 Genius Canvas 赋能汽车产业发展,打造全新 HMI 交互体验。 Genius Canvas 的一个工具是大模型引擎,它能够把想法和理念转化为文 案,并进一步转化为创意和作品,最终通过技术手段转化为应用程序。 Genius Canvas 的第二个工具来源于 KANZI 产品。Kanzi 与大模型结合 后,能够利用大模型的知识库及创新能力,快速创作丰富多彩的 Kanzi HMI 概念效果及特效,构建多样的 3D 模型及形象库,并且在车机系统 中能够实现实时预览功能。目前,全球已有超过百款车型选用了 Kanzi, 每年有数千万辆搭载 Kanzi 技术的量产车型落地

2.4.2. 德赛西威:联合高校推进大模型本地化,赋能自动驾驶

德赛西威联合高校推进大模型本地化部署。德赛西威已和中山大学、南 洋理工大学等高校合作,通过尝试和布局基于大模型的数字虚拟助手、 图像数据自动标注、自动场景创建、自动编程等,构建技术支撑,相关方案已经在上海车展上亮相。在 AI 大模型本地化过程中,德赛西威能 够为客户提供差异化、全方位的技术支持和解决方案。

AI 大模型技术可以和德赛西威现有技术形成完美融合。比如,AI 大模型 可以在感知融合、感知预测和规划上实现更为精准的数据补充和预测, 从而在行为预测方面给予自动驾驶更多地帮助,并给出更多的控制选择

2.4.3. 虹软科技:已发布可商业落地的 AIGC 产品

公司已发布 AIGC 产品,助力小 B 客户大幅降低商品展示成本。1)商 业拍摄市场空间超 500 亿元,虹软方案能大幅降低对模特的依赖,降低 商品展示成本,实现对于原方案的替代。2)采用目前市场上的方案在 很多细节处存在畸变和失真,虹软的方案能使得商品展示“所见即所得”。 3)公司计划在 2023 年推出静态商品展示图解决方案,包括商品加背景 静态图像的生成,以及商品加数字模特图像生成,后续计划推出动态视 频以及 3D 内容。

商业模式:与公司手机、汽车业务类似,AIGC 商业模式分为会员服务 费和生产流量费两部分。1)在会员服务会部分,公司会根据不同的会 员等级开放不同的功能,比如不同的场景库和模型库;此外,公司可以 针对一些增值的 API 做差异化的定制开发。2)在生成流量费部分,公司将按照生成内容的实际算力消耗直接定价。

虹软科技是非常稀缺的能够将 AIGC 技术进行产品化落地的公司。在目前阶段,投资者非常关注哪些公司能在 AIGC 方面形成真正的产品,并 产生商业价值。虹软作为安卓系手机拍摄算法的全球霸主和汽车视觉算 法的领先者,在图像处理方面拥有超过 20 年的技术积累,是非常稀缺 的能够在现阶段将 AIGC 技术进行产品化落地的公司。

2.4.4. 经纬恒润:自主开发驾驶仿真测试软件,推出智能座舱 AI 单品

在自动驾驶仿真方面,经纬恒润自主开发仿真软件,助力驾驶测试。经 纬恒润自主研发了综合驾驶测试仿真软件 ModelBase,这一软件可以被 用于乘用车、商用车的整车电控系统、ADAS 系统的设计、测试和验证。 涉及电控系统的全开发周期,包括早期的算法仿真测试,控制器的硬件 在环测试,半实物台架测试,以及车辆在环测试。目前这一软件已经被 已应用于一汽、东风、蔚来等 50 余个项目中。

在智能座舱交互方面,经纬恒润基于 AI 技术开发了音乐律动氛围灯等 一系列产品。经纬恒润音乐律动氛围灯具有实时歌曲特征识别和离线歌 曲特征识别两种模式。其中离线歌曲特征识别模式的相关功能就是基于 AI 音乐风格分类算法和 AI 音乐段落划分算法进行实现。通过音乐特征 识别,为氛围灯音乐律动提供丰富的效果组合,提升用户体验

3. 金融是 AI 落地核心场景之一

3.1. 金融行业敢于尝试新技术,是 AI 落地核心场景之一

相比于其他行业,金融行业在新技术应用上有三个特点。第一个特点, 是很重视新技术发展,并且敢于尝试。因为金融行业的日常业务活动涉 及大量交易,技术上的微小进步有可能会为客户带来巨大的收益,因此 金融机构对于新技术很敏锐,会积极追求将新技术应用于日常业务。第 二个特点,是金融行业 IT 预算充足,对于性价比没有其他行业那么敏 感,在 IT 乙方的眼里,金融机构甲方客户往往是最好吃的一块蛋糕。 第三个特点,是金融机构对于系统稳定性和数据安全有极高的要求。这个特点往往会跟第一个特点冲突,但是系统安全永远是金融机构的底线, 在此底线之上才会去追求新技术的应用。不管是证券、银行还是保险, 一旦核心系统出现故障超过一定时间,就容易收到监管函,相关 IT 部 门领导需要承担管理责任。例如 2022 年 5 月 16 日,招商证券集中交易 系统发生故障,9 月 8 日收到深交所监管函(澎湃新闻报道)。

在过去十年里面,银行、证券、保险等行业都应用了大量新技术,去提 升系统的安全性、可用性,包括在信息系统的国产化方面也做了大量的 工作,这背后是金融机构的大量科技投入。2022 年,6 家国有大行在金 融科技方面投入金额均超百亿元。其中工商银行科技投入金额达 262.24 亿元,位居国有大行榜首。该行金融科技人员 3.6 万人,占全行员工的 8.3%,数据分析师超 7700 人。建设银行、农业银行分别以 232.90 亿元 的金融科技投入和 232.11 亿元的信息科技投入资金紧跟其后。其中, 建设银行在年报中提到,金融科技人才工程被列为全行首个重大人才项目,着力推进“懂科技的管理人才”“懂业务的科技人才”“懂行情的市场化 IT 人才”三类人才队伍建设,研发费和科技人员人力费用等费用性支出 保持持续增长。

(本文仅供参考,不代表我们的任何投资建议。如需使用相关信息,请参阅报告原文。)

本报告总计:57页

受篇幅限制,仅列举部分内容!

报告来源公众号:【百家全行业报告】

展开全文
文章关键词
#人工智能 #微软 #wps

大家都在聊

热门评论

相关推荐

热门视频

查看更多视频

热点搜索

打开APP 追踪24小时热点新闻
打开APP 追踪24小时热点新闻