AI正面临一个难以突破的硬性天花板
近几个月来,围绕人工智能的炒作达到了疯狂的程度。据说,特斯拉将在一两年内完全实现无人驾驶,人工智能明年将比人类更聪明,到2040年,十亿台AI驱动的机器人将取代人类工人,而这些仅仅是埃隆·马斯克今年至今所作的承诺。整个AI行业充斥着这样的预测和承诺,人工智能的发展似乎正处于一条我们人类无法阻挡的不可阻挡的指数增长轨迹上。然而,事实远非如此。你看,AI开始遇到发展的天花板,收益递减,使这些夸张的承诺变得完全空洞。让我来解释一下。
要理解这样的一个问题,我们应该了解AI工作的基本原理。现代AI使用深度学习算法和人工神经网络来寻找数据中的趋势。然后,它们可以从这些数据中推断出新的数据,或沿着同一趋势线生成新数据。这一过程从“训练”AI开始,将大量数据输入AI进行分析,使其能够找到这些趋势。之后,可以查询AI以获得输出。这一基本概念推动了计算机视觉、自动驾驶汽车、聊天机器人和生成性AI的发展。这是一个有些简化的解释,但现在我们有必要了解的就是这些。
过去几年中,AI已变得更加强大。这部分归功于更好的编程和算法开发。但这也有90%的原因是AI接受了更大的数据集训练。这使它们能够更准确地理解数据中的趋势,因此也能更准确地生成结果。但问题是,我们看到AI训练的回报急剧减少,无论是数据还是所需的计算能力方面。
从数据说起。假设我们构建了一个简单的计算机视觉AI,旨在识别狗和猫,并使用100张狗和猫的图像和视频对其进行训练,它能正确识别它们60%的时间。如果我们将训练图像和视频数量翻倍至200,其识别率会有所提高,但只是边际提高到大约65%。如果再次将训练图像和视频翻倍至400,其改进将更为边际,大约为67.5%。
这部分是因为当你拥有较小的数据集时,每增加一个新的训练图像,相对于在更大的数据集中增加一个新的训练图像,你能够处理的新数据比例更大。然而,这也是因为AI可以在小数据集中迅速发现新的联系和趋势,因为它只需找到适用于少数几个示例的趋势。但随着数据集的增大,发现适用于整个数据集的新趋势和联系变得越来越难。这些来自更大数据集的新趋势和联系使AI变得更好、更有能力。因此,我们看到提高AI一定量的训练数据需求在急剧增加,因为我们在AI训练中达到了收益递减的点。
还有另一个问题。AI训练非常耗费计算资源。AI必须将每个数据点与数据集中的每个其他数据点进行比较,以发现这些联系和趋势。这意味着你每向AI训练数据库中添加一点数据,训练该AI所需的计算工作就会呈指数增长。因此,即使你能获得足够多的数据来训练这些不断进步的AI,所需的物理计算力和能源最终会增长到不可能的程度。
遗憾的是,有证据表明我们正处于训练数据集增长的收益递减和使用这一些数据集所需的计算能力指数增长共同制约AI发展的硬性天花板阶段。
以OpenAI的旗舰AI ChatGPT4为例。它相对于ChatGPT3的改进小于ChatGPT3相对于ChatGPT2的改进,尽管它更准确,但仍然存在与ChatGPT3相同的问题,比如虚构事实和缺乏理解。现在,OpenAI对其AI的开发方式守口如瓶,但专家们已经调查并发现,ChatGPT3使用的训练数据集大约是ChatGPT2的78倍,而ChatGPT4使用的数据集是ChatGPT3的571倍!然而,尽管训练数据集的大小显著增加,ChatGPT4仍然存在重大缺陷,这严重限制了其使用场景。例如,它不能被信任编写任何事实性内容,因为它仍然会编造事实。
有估计显示,ChatGPT4的原始训练数据集为45TB的纯文本。这意味着,要使下一代AI像ChatGPT4相对于ChatGPT3那样有显著的改进,训练数据集将需要增加到数万TB。即使使用OpenAI的可疑方法,获取和准备这么多的纯文本数据简直不切实际。然而,实际使用这个数据集来训练他们的AI可能会使用如此多的能源,以至于成本使AI完全不可行,即使对于一个非营利组织也是如此。
这不是夸张。OpenAI的首席执行官Sam Altman公开表示,需要像核聚变这样的能源突破,才能使先进的AI变得可行。遗憾的是,即使我们真的解锁了核聚变,它在本世纪甚至可能在下个世纪都不太可能比我们当前的能源更便宜。事实上,没有任何形式的能源预计会显著低于我们目前所拥有的。因此,这种针对AI能源问题的提议解决方案具有深刻的误导性。
这种观点得到了一些非常严肃的研究的支持。马萨诸塞大学阿默斯特分校的一项研究研究了提高图像识别AI性能到超过95%准确率的计算和能源成本。他们发现,训练这样的模型将花费1000亿美元,并产生与纽约市一个月的碳排放量相当的碳排放。请记住,这是对于一个仍然有5%的时间出错的AI而言。该研究还强调,将准确率提高到99%将需要指数级的更多成本和碳排放。
完全无人驾驶汽车。他们的自动驾驶和全功能自动驾驶(FSD)只能通过这种类型的AI计算机视觉感知周围的世界,而要使FSD实现完全自动驾驶,其图像识别准确率需要接近100%。正如这项研究所显示的,即使是特斯拉这样的公司,也可能需要更多的资金才能使他们的AI达到这种水平。
换句话说,除非AI行业能找到一种方法,使其AI训练和计算负载更高效,否则它将无法突破这一限制,AI的发展将完全停滞。现在,可能的解决方案已经在地平线上,例如更高效的AI硬件结合模拟和量子技术,以及需要显著较小训练数据集的新AI架构。然而,这些概念仍处于初级阶段,在大多数情况下要几十年时间才能在现实世界中使用。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
上海大量房屋已步入“中老年”?龚正市长:计划明年在全市推开房屋养老金制度
青岛一男子拖欠1400元餐费2年,女店主“卑微”催要令网友心酸,当事人最新回应
Marshall发布全新便携音箱Emberton III和Willen II:999元起
AMD Ryzen 5 7600X3D将于9月初发布 6核Zen 5搭配3D V-Cache
与中坚力量共成长,2024建信信托艺术大奖评委会特别奖获奖艺术家凌海鹏