1.2.1 由ChatGPT爆火说起

2022年11月30日,美国OpenAI公司发布了一个全新的对话式AI模型ChatGPT,它由GPT-3.5系列大型语言模型微调而成,不仅能与人类进行自然的多轮对话,给出高效、精准的回答,还能生成编程代码、电子邮件、论文、小说等各类文本,引起了全世界的广泛关注。

美国哲学家约翰·塞尔曾将人工智能划分为弱人工智能和强人工智能。能够完成某一项特定任务的人工智能是弱人工智能,也被称为专用人工智能或狭义人工智能,这样的人工智能包括机器翻译、计算机下棋、图像识别等。在记忆(存储)、推理、计算方面,计算机的能力很接近甚至超过人类。能够在任何领域或任务中都表现出超越人类的能力的人工智能则是强人工智能,也被称为通用人工智能或广义人工智能。还有人将“感知”和“认知”的区别看作划分弱人工智能和强人工智能的标准。

ChatGPT使用互联网上大量公开的语料(Token)信息,对公众开放模型,收集用户的反馈并不断迭代优化模型,形成“数据飞轮”,强化机器的自我学习能力。作为生成式人工智能的典型代表,ChatGPT无疑向强人工智能迈进了重要一步。

2023年3月,新一代GPT-4正式发布。它利用深度学习大模型的优势,据说是用1.8万亿条参数来模拟人类语言的模型,支持文字、图像等多模态输入,可以应用于考试、问答、写代码、翻译等方面,表现超过了先前发布的GPT-3.5。2024年2月,OpenAI公司发布了由文字输入到1分钟视频输出的Sora,表明人工智能发展又取得了新的进步。对比来看,人脑大约有800亿个神经元和高达百万亿级别数量的神经元触突,但是一天的功耗只有200多瓦时,而ChatCPT每天的功耗却高达50万千瓦时。

OpenAI是一家位于美国硅谷的人工智能公司,成立于2015年,起初公司定位为非营利机构。Open就是开源、开放的意思。创始人包括萨姆·阿尔特曼、彼得·蒂尔、里德·霍夫曼和埃隆·马斯克,他们共同的目标是开发出一款机器人来帮助完成基本的家务劳动。后来,马斯克希望将OpenAI置于特斯拉公司内,这与其他创始人的合作理念产生了分歧,他一气之下退出了OpenAI公司,宣布要在特斯拉公司内部开发一款面向家庭的人形机器人。

在马斯克退出后最关键的时刻,微软公司于2019年投资了10亿美元,才使得OpenAI公司存活了下来。微软公司为OpenAI确定了发展目标:能够与人类进行交流并帮助人类完成各种创造性的工作,公司的性质从非营利机构转变为营利主体。人工智能的大模型也从早期的开源变成不开源,OpenAI在GPT-1、GPT-2时期采用开源方式快速发展,在GPT-3时期转为闭源。

2021年8月首届人工智能日(AI Day)活动中,特斯拉公司发布了正在开发人形机器人Optimus的消息。在2022年10月特斯拉第二届AI Day活动中,Optimus正式亮相,它重73千克,高1.72米,能够完成搬运重物和给植物浇水等工作。特斯拉公司在设计这款产品时,尽可能利用其汽车产品上已经使用的技术以降低成本,预计售价为2万美元。但是这个产品的上市时间一拖再拖,近来变得语焉不详了。

回过头来再说OpenAI。经过几年的发展,微软公司除了通过10亿美元投资得到丰厚回报,还利用股东的优势,将ChatGPT的应用导入微软公司的产品中,例如,在搜索引擎Bing、办公软件Office、协同应用Team中导入ChatGPT以增强软件功能。微软公司还用基于大模型开发的智能辅助办公系统Copilot代替原来的语音识别系统Cortana,除了继承语音识别功能,Copilot也是软件开发工具。利用这个工具和微软公司的云Azure,软件开发者可以开发出智能辅助技术的软件,供用户使用。

以ChatGPT为标志,人工智能技术的发展开始进入全新的发展阶段——强人工智能阶段,从过去的“感知”世界转变为开始“认知”世界,除了传统的记忆(存储)、分析、判断功能,它还具有一定的模仿创造功能。只要是在互联网上出现的信息,它都可以迅速地将其收集归并,按照一定的逻辑形成最终的作品。目前,ChatGPT以语言文本的功能为主,也提供绘画、图像等功能。但是模拟不是创造,距离真正实现“认知”功能还任重道远。举例来说,它可以按照人类给定的主题模仿齐白石的作品风格画一幅画,尽管不是出自齐白石之手,却完全可以乱真,但这毕竟是模仿,人工智能缺少创造性,因此不可能绘出与齐白石齐名甚至超越齐白石的画作。当然,ChatGPT绘画也好,作诗也罢,都不如它的文本表达那么出色,不过这也为之后的发展留出了空间。人工智能最终不可能超越人类,当然这只是我个人的理解和看法。

人们一般把参数数量达到数亿或数十亿级甚至更多的深度学习模型称为大模型,如 Sora和GPT-3。从 GPT-3 到 GPT-4,其参数数量就增长了约10倍,从 1750亿增长至约1.8万亿。后续的 AI 大模型要超越 GPT-4,其参数数量还将以指数级规模增长。当大模型参数足够大的时候,经过不断学习与训练,就可以实现人工智能的应用。当然,从规避公司风险的角度出发,这种大模型的设计,必须在政治、宗教、法律、种族、道德、风俗等方面设定一些限制。

像ChatGPT这样的通用大模型,采用了深度学习等算法,基于神经网络架构来处理和生成自然语言,其本质是通过大规模的文本数据的学习、训练和微调,掌握语言的模式和规律,产生了改变人机互动模式的颠覆性结果。

在通用大模型发生重大突破的背景下,专用大模型的行业应用,尤其是在汽车行业这样的重点行业中的实际应用是可以预期的。例如,专用大模型完全可以利用大量的驾驶数据和传感器数据进行训练,以帮助开发自动驾驶技术。这些模型应用于行驶路径规划、交通感知、障碍物检测和驾驶决策等方面,可以提高自动驾驶系统的准确性、可靠性和安全性。

这一轮由OpenAI引领的生成式人工智能的发展非常迅猛,各类大模型、应用场景涌现。人工智能对国内汽车企业来说既是机遇也是挑战。