对不起，AI大模型不是风口

“我们正处在全新起点，这是一个以大模型为核心的人工智能新时代，大模型改变了人工智能，大模型即将改变世界。”——5月26日，百度创始人、董事长兼CEO李彦宏先生在2023中关村论坛发表了《大模型改变世界》演讲。

李彦宏指出，大模型成功地压缩了人类对于整个世界的认知，让我们看到了实现通用人工智能的路径。

越来越多的人相信，第四次产业革命正在到来，而这次革命正是以人工智能为标志的。

人工智能技术再次成为人类创新的焦点，大模型在许多领域的应用越来越广泛，今年以来更是在全球掀起了狂潮。一夜之间，什么元宇宙、区块链、Web3.0之类的风口全都消失了，只有大模型才是唯一的C位。

😝有需要的小伙伴，可以V扫描下方二维码免费领取🆓

AI大模型到底是什么？

**
**

大模型（Foundation Model）是指通过大规模的数据、算法和计算能力训练出的高精度深度学习模型，通常具有千万亿次的计算能力，可以在语音识别、自然语言处理、图像识别等领域，实现人类甚至超越人类的性能表现。

大模型通常有以下几大特点：

1、巨大的参数量：大模型通常包含数十亿个参数，需要大量的数据和计算资源来训练。

2、强大的内容生成能力：能够生成高质量的文本和图像，为自然语言处理和计算机视觉等领域的应用提供了强大的工具。

3、深厚的语义理解：能够理解文本和图像的深层语义信息，为自然语言处理和计算机视觉等领域的应用提供了深厚的语义理解能力。

4、高效的推理能力：能够进行高效的推理和推断，为自然语言处理和计算机视觉等领域的应用提供了高效的推理能力。

5、需要的计算资源较多：训练和推理需要大量的计算资源，如GPU和TPU等，需要高性能的计算集群和云计算平台。

提到大模型，我们不得不再次提起今年爆火的chatGPT来：

人工智能的四层架构分别是：算力层、框架层、模型层和应用层，其中：

1、算力层：主要包括芯片、处理器、云计算和超算等硬件等基础设施， AI需要有强大的计算能力来支持各种算法和应用的训练、推断和分析，算力层就是为人工智能提供强大的计算和存储能力的基础。

2、框架层：人工智能算法的开发需要使用各种编程语言和框架，框架层是人工智能的基石，例如TensorFlow、PyTorch、MXNet等。这些框架能够提供高效的计算图优化、分布式训练等功能，提高人工智能应用的开发和训练效率。

3、模型层：指的是在框架层中训练好的各种人工智能模型，包括深度学习模型、传统机器学习模型、强化学习模型等，典型的预训练大语言模型八廓openAI 的GPT、百度的文心大模型，以及Google的bard大模型等。这些模型是人工智能应用的核心，能够解决各种问题，例如图像识别、自然语言处理、推荐系统等。

4、应用层：应用层处于人工智能的最上层，指的是人工智能技术在各个领域的应用，例如智能客服、人脸识别、自动驾驶等。这些应用能够帮助企业和用户提升效率、改善体验、实现创新等，同时应用需求也会反向推动模型、框架和算力的升级和创新。

我们大多数人所接触到的AI，往往是处于应用层。

但是ChatGPT和文心一言比较特殊，既属于模型层，也属于应用层。

GPT是基于人工智能领域的大数据和机器学习技术，通过大量的训练和优化，可以用来生成人类自然语言的大模型；同时，它也是一个应用，可以通过与用户的交互和对话，提供有用的信息和帮助，比如回答问题、提供建议、生成文本摘要等。因此，他们处于模型层和应用层之间。

所以如果把每天来跟我们进行直接对话交互的chatGPT图文界面比喻成它的“嘴巴”，那么背后思考我们所提出这些问题的“大脑”，正是大模型这种东西。

国内外的大模型玩家有哪些？

在国外，大模型的研究起步较早，其中的重量级玩家主要包括谷歌、微软、亚马逊、Facebook等大型科技公司。

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

图：国外知名大模型简介

在国内，随着人工智能技术的不断发展，大模型的应用也越来越广泛。目前国内的大模型玩家主要包括百度、阿里巴巴、腾讯、华为等大型科技公司。其中，百度的文心一言、阿里巴巴的通义系列、腾讯的混元、华为的盘古等是大模型领域的代表作品。这些公司拥有庞大的数据和计算资源，以及丰富的应用场景，可以支持大模型的开发和应用。

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

AI大模型，真的是风口吗？

“今天的初创公司，很多叫做大模型的，包括创业者，也包括互联网大厂我们都不投。” ——嘉御基金创始合伙人、董事长卫哲表示嘉御基金会投有数据的具体应用，但不投大模型。

今年以来，投资界对大模型相关公司出现了很微妙的态度：既有一些机构回避投资大模型公司，而与此同时，投资大模型的“入场券”（投资门槛）却悄然从5000万美元提高到了1亿美元。

5月7日，AIGC创建者大会在上海举行。线性资本创始合伙人兼CEO王淮发表了他的看法：“我们个人感觉这里面创业公司的机会相对小。”王淮表示，“历史上创业公司能够成功很大的原因是你‘为别人所不敢为’，或者做别人认为不会起来、不太看得重的东西，这一类的创业模式我们称之为‘桃花源式的创业’。而大模型需要一些必须成功的要素，要有算力，要有钱；在中国，还必须要有政府支持。”

从王淮等人的介绍来看，大模型的应用前景的确是非常广阔，但并不是所有企业和创业者都可以在这个领域取得成功，特别是中小创业公司。大模型需要大量的数据和计算资源来进行训练和优化，需要有强大的技术团队和丰富的应用场景来支持。对于中小企业和初创公司来说，进入大模型领域会面临很多困难和挑战。

究其原因，从我们前面说过的大模型的特点就可以看出来：

首先，大模型需要消耗大量的计算资源进行训练和优化，需要有足够的资金来支持，作为一个初创企业，就算融资到了独角兽级别，在大模型领域10亿美元这钱也根本不经烧。

其次，大模型的开发和应用需要有一个相对稳定且强大的技术团队和管理团队，需要大把大把很贵且很有经验的人长期来进行调参和优化。对于创业公司，其组织和管理经验往往不是很足，很难长期顺利运行下去这样的项目。

最后，由于大模型的应用场景非常广泛，因此其需要有丰富的数据和场景来进行不断滋养，作为一个没什么用户基础和数据基础的中小公司，很难训练得出来。

因此，对于中小企业和初创公司来说，还是需要谨慎考虑直接进入大模型领域。

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传