2023年05月05日GPT已拉开AIGC技术革命序幕
海外为鉴,看国内大模型与终端应用投资机会安装应用商店
行业研究 · 海外市场专题
互联网 · 互联网Ⅱ
投资评级:超配(维持评级)
证券研究报告 |
证券分析师:谢琦
S0980520080008
本报告的重点
•海外发展:现阶段海外大模型发展领先,GPT4已呈现出的内容生成与交互能力,Google、Meta等也已发布相关产品,预计将带来可观的增量市场与效率提升,已给相关应用(微软、彭博等)带来巨大变化,预计相似的变革也将在国内发生。
•国内大模型:国内成熟大模型落地具备较好的条件:业内已有相对成熟的方法路径(Transformer等)、大模型(GPT2、Meta-LLaMA等)及相关数据基础,而芯片短期看并未成为发展限制,百度、阿里、字节、华为、腾讯等巨头均加速布局,百度、阿里、商汤发布大模型且迭代进展迅速,预计国内GPT3级模型或在不久的将来出现,对国内产业链形成巨大影响。
•应用场景展望:考虑现阶段国内大模型未完全成熟,因此更多是借鉴海外路径演绎国内发展。目前看海外应用端已经百花齐放,办公、搜索、教育、对话社交、游戏、金融、电商、图片视频等领域已出现大量产品创新,GPT plugin插件推出后相关产品和场景有望进一步扩展。
•投资策略:
•1)大模型环节:具备哪些禀赋的企业更可能在大模型竞争中脱颖而出?我们认为,大模型整体来说还是大厂的生意,综合算力资源、算法人才、数据积累及产品先发四个核心要素,目前百度领先,关注字节、阿里、华为、腾讯等企业进展。
•2)应用场景环节:具备哪些禀赋的企业能够在技术变革下守住基本盘并更上一层楼,而哪些企业可能面临被替代的风险?
我们认为,有以下禀赋的企业: ①原有产品场景壁垒高,且受益于AIGC出的信息获取、内容生成能力; ②有独特垂直的高质量数据;③有用户粘性与深度;④本身有较强的AI技术研发与落地能力;加持自有大模型或外部模型API有望上台阶,关注腾讯、阿里、百度,以及游戏、金融、教育、办公等垂直领域有高质量数据与场景的优质企业。反之,如无上述禀赋,或面临被大模型降维竞争风险。
•风险因素:技术进展低于预期,竞争超预期,内容、数据与技术监管风险,中美科技竞争风险
目录
1.GPT带动AIGC技术革命,驱动海外互联网软件产业巨大变革
1)GPT的发展背景:全球AI产业厚积薄发,OpenAI技术突破
2)AIGC技术已对海外互联网软件产业链带来巨大变化
3)展望:多模态应用、GPT插件等有望带来更大的变革
2.核心变量——大模型:国内大厂加速布局,成熟大模型落地前景可期
1)从GPT看大模型的核心竞争要素:算力、算法、数据、生态
2)从中美差异看国内大模型发展路线:国内大厂加紧追赶,模型与应用齐头并进
3.应用展望:从海外路径看国内发展
1)海外应用:AIGC应用百花齐放
案例:办公写作、搜索、教育、对话社交、游戏、金融、电商、图片视频
2)海外经验:“AI赋能”or“被AI替代”?
3)国内应用:有待成熟大模型落地,巨大效率提升下机遇与挑战并存
国内头部互联网企业应用落地场景分析
4. 投资策略与重点标的:
1)大模型及相关生态:百度领先,关注阿里、腾讯、字节、华为等
2)垂直应用领域:海外关注微软,国内关注腾讯、阿里、百度及垂直领域有高质量数据与场景的优质企业5.风险因素:技术进展低于预期,竞争超预期,内容、数据与技术监管风险,中美科技竞争风险
1.1GPT:自然语言处理领域突破性创新,拉开生产力革命序幕
图:消费级应用达到一亿用户花费时长
资料来源:Similarweb
图:ChatGPT产品功能展示
资料来源:ChatGPT
•ChatGPT引发巨大关注。2022年11月30日,OpenAI推出人工智能大语言模型产品ChatGPT,能根据用户的文本输入,产生相应的智能回答,能进行多轮对话与反馈,支持各领域知识场景与多语言内容,其综合语言处理能力接近真人而处理效率显著更高,ChatGPT产品发布以来引发巨大关注,上线两个月后月活突破1亿,日活用户超1200万。
•GPT相关技术有望拉开文本信息处理的生产效率革命。语言文本处理是人类世界最重要的工作内容之一,每年全球投入大量的人员和资源用于处理各种语言文本以协调社会分工,如果AI能够协助人类大幅提升语言文本处理效率,将带来巨大的生产力效率提升。
消费级应用1亿用户达成时长(月)
ChatGPT2
TikTok9
Instagram30
Pinterest41
Spotify55
Telegram61
Uber70
Google Transalte78
•算力、数据、模型方法等底层要素的持续进步是ChatGPT发展的重要基础与驱动。
•算力提升:大规模深度学习模型的参数和数据量大幅提升,如GPT-3大模型包含1750亿参数,如果采用单片V100需要训练超过300年。而近年AI算力技术持续进步是大模型发展重要先决条件,英伟达CEO表示过去十年,通过提出新处理器、新系统、新互连、新框架和算法,并与数据科学家、AI 研究人员合作开发新模型,已使大语言模型的处理速度提高100万倍(英伟达财报会议)。
•数据积累:随着数字时代的到来,生成数据的工具和软件愈发普遍,数据总量呈指数增长,可供AI训
练的数据质量和数量均有很大提升,ChaGPT训练数据超过45TB。
•模型方法:GPT-1、GPT-2、GPT-3版本持续优化,迭代到GPT3.5( ChatGPT的模型 ) 已在自然语言理解和内容生成上取得极大性能提升,后续GPT4在参数、语料与能力进一步提升。
图:GPT大模型在文字生产的出表现,标志着生成式AI(AIGC)的巨大进步
资料来源:国信证券研究部整理,OpenAI,《GPT-4 Technical Report》OpenAI
1.1发展驱动:底层技术持续积累形成质变,驱动AI产品突破
时序记忆性:可以连续多轮对话,⼤幅提升了对
⽤户意图的理解;
持续迭代:可以利用户数据持续训练,随着规模
增长,模型性能稳定提升;
训练速度快:利用Transformer可以并行训练;
准确性的提升:根据《GPT-4 Technical Report》
在语言基准测评中平均准确率超过80%,在所有
测试上都优于现有的LM,超过SOTA水平;
人类可纠偏:模型采用teacher model+强化学习,
主动承认错误和⽆法回答的问题,更正答案;
通用性:模型训练是通用的,可以适用于不同的
任务;
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论