之前,计算机科学及其应用的重大进步总是让我觉得很兴奋,而AI则让我感觉不一样了。
一幅程序员被最近的人工智能发展压垮的图画
为了弄清楚我为什么会这样感觉,我不得不回顾过去这几十年,比较当时的科技进展与现在的科技趋势。
80年代的个人计算机个人电脑是我接触技术的入门——它们让我开始玩游戏,最终开始编程。我对此有美好的回忆,使用像MEMMAKER这样的工具从我的机器中榨取更多内存,仅仅是为了在我的DOS电脑上运行一些新游戏的盗版版本。
个人计算机形状、尺寸和架构各异。它们有各种各样的名称,并由不同的供应商销售。基本上可以随心所欲地使用这些设备。可以随心更换零件。可以玩游戏,写软件,或者用来做完全不同的事情。
从一个工程师的角度来看,这些机器的内部构造是可以理解的。凭借一些技巧和热情,你甚至可以自己造一台。
互联网(也就是九十年代的互联网)突然你的网速变得比电脑的运行速度更有趣。我花了好几个小时在网吧里和陌生人聊天,他们也像我一样,在探索这个新奇的世界。
早期的互联网对我来说感觉很开放和容易访问。它是基于开放、互操作的协议,如TCP/IP、HTTP、SMTP等构建的。你可以在Geocities上建个网站。如果Geocities挂了,你可以把网站挪到别的地方,甚至可以自己架设。没有哪家公司或机构能控制互联网的大部分。
智能手机(大约在2005年左右)一种新的形式因素和交互方式被引入。虽然我们之前见过类似的设备大小和触摸屏,但iPhone是第一个把这一切整合在一起的设备,得益于无处不在的移动互联网接入。
大多数智能手机大多可以通过相同的方式获得,就像其他电脑一样。它们是小巧、联网、可编程的小型电脑,各种输入设备一应俱全。
我明白智能手机的工作原理,我可以编程它们,也知道它们的局限。
我对人工智能特别是刚刚宣布的Sora这种文字转视频模型感到非常兴奋,但同时,我又感觉自己被排除在外了。
我想理解事物是如何运作的。对我来说,AI就像是一个黑盒子。需要阅读大量论文和掌握大量数学知识,才能真正理解为什么某个提示X会产生某个结果Y,这让我觉得难以承受。甚至一些顶尖的科学家也承认,他们真的不了解AI是如何工作的。
“如果我们打开像ChatGPT这样的AI系统看内部,你只会看到每秒几百万的数字在快速翻转,”AI科学家Sam Bowman说,“而我们完全搞不清楚这些数字代表什么意思。”
对我来说,作为一个工程师,这真是让人极其不满。如果不理解某样东西的工作原理,我们将永远只是使用者。
表面上看,任何人都能打开ChatGPT会话,或向OpenAI的API发送一些JSON。我指的是获取让AI成为可能的核心技术的权限。
将这些数字进行调整以得到结果(推理),尤其是首先确定这些数字(训练阶段),这需要大量的资源、数据和技能。
AI不是普通人用的工具。
如果你和我一样,你可能有一些用AI建造一些酷炫东西的想法。那么,你很可能会创建一个GPT包装器。
你可能在想,什么是GPT封装工具?它是指任何软件或SaaS,依赖于别人的产品,例如你无法轻易复制或替换的AI产品(例如ChatGPT)。
如果我开发一个需要持久存储的应用,我可能选择用Postgres和S3来保存数据。如果这些服务不可用了,我会改用其他的关系型数据库、键值存储或分布式文件系统。但如果OpenAI忽然不让我用了怎么办?如果他们改价了,让我运行不划算怎么办?如果OpenAI扩展服务,让我的产品变得多余了怎么办?
老翁对着云喊(来源:https://knowyourmeme.com/memes/old-man-yells-at-cloud)
我是不是就像那个生气的老头儿对着云挥拳发泄怒气?但愿不是这样。