六十年来,企业知识管理系统屡屡失败,其根源在于企业在采购时过分依赖熟悉感而非技术上的正确性。这种倾向导致企业不断购买看似安全但效果不佳的产品,从专家系统、语义网到现代的知识图谱和RAG技术,每一波技术浪潮都未能兑现承诺,造成了数千亿美元的损失。作者认为,真正的突破在于利用语言模型自动从非结构化内容中提取结构化知识,并结合图数据库和不可篡改的审计日志,从而打破“手动编码”与“无结构wiki”之间的两难困境。巴西Nubank银行的成功案例证明,选择非传统技术栈(如Clojure和Datomic)才是创新之路。企业必须摒弃对熟悉技术的依赖,勇于采纳真正解决问题的新架构。
敌人名为“熟悉感”
企业软件行业数十年来一直混淆了两个概念:简单(Simple)和容易(Easy)。Clojure语言的创造者Rich Hickey对此有精辟的论述:
简单是客观的:如果两个事物没有交织、没有互相锁定,移除一个不会导致另一个崩溃,那么它们就是简单的。
容易是相对的:对谁来说容易?容易是近在咫尺的,是熟悉的。
整个企业技术选型体系——从分析师报告、招标评分到供应商名录——都是一台奖励熟悉感而非正确性的机器。这是过去四十年来所有失败的共同结构性原因:采购方购买了他们熟悉的,而非正确的东西。
熟悉感扼杀企业智能的五种方式
1. 熟悉的供应商
微软的SharePoint拥有超过两亿月活用户,但同时也被用户称为“文档等死的地方”。这恰好说明了问题:企业IT部门因为SharePoint与Office捆绑而购买它,而业务部门则因为别无选择而容忍它。产品的实际质量并不决定销售,供应商的熟悉度才是关键。
2. 熟悉的语言和架构
大型企业的招聘页面充斥着Java、.NET、Oracle等字眼,这并非偶然,而是一种策略。企业选择Java并非因为它是最合适的工具,而是因为“Java”这个词是内部晋升委员会、外部审计师和采购官都能假装理解的。
有人常说“我们招不到Clojure开发者”,但这其实是一种误解。选择非主流但更合适的语言(如Clojure)并非招聘的障碍,而是一个高效的过滤器。它能吸引那些真正懂得用数据而非形式思考的优秀工程师。随着AI越来越多地参与软件编写,语言的熟悉度变得越来越不重要。LLM关心的是代码的效率和数据的结构性,而在这些方面,那些因“不熟悉”被拒绝的语言往往表现更优。
3. 熟悉的采购流程
企业软件采购是一个典型的“柠檬市场”,买家在购买前无法验证质量,购买后难以更换,过程中也缺乏衡量结果的机制。
- 供应商知道实施的困难和高失败率,因此他们销售的是“使用许可”,将执行风险完全转移给买家。
- 采购方为了规避个人职业风险,会选择最熟悉、品牌最响亮的供应商。即使项目失败,他们也可以说:“我们买的是行业标准。”
这种机制奖励的不是最好的产品,而是最擅长在柠檬市场中发出安全信号的、最熟悉的厂商。
4. 熟悉的失败
从1980年代的专家系统(如Cyc、XCON)到1990年代的知识管理项目,再到后来的语义网,这些系统都因同一个原因而失败:知识编码的成本和速度跟不上知识本身过时的速度。专家们忙于实际工作,无暇更新系统。
如今的生成式AI,通过编造看似可信的答案来绕过专家更新的环节,本质上是同一种失败模式的新变种。它用一个会产生幻觉的系统,替代了过去那个空洞、过时的数据库。
行业不断购买同一种注定会失败的模式,似乎从未吸取教训。
5. 熟悉的AI技术栈
检索增强生成(RAG)一度被视为企业知识管理的终极答案,但事实并非如此。
- 即便是顶级的商业RAG系统,也存在高达17%至34%的幻觉率。
- 作为RAG基础的向量数据库,其专业厂商正在被更熟悉的Postgres扩展(pgvector)所取代,尽管后者在性能和功能上远有不及。
- 微软自己也承认,其最初的GraphRAG方案因索引成本过高而无法在生产中使用。
根本的错误在于,人们以为可以简单地“给wiki加上AI”。但wiki本身就是问题所在,因为它缺乏实体、关系和演化历史等结构化信息。AI不应被添加到wiki上,它应该取代wiki。
“二选一”陷阱与第三种选择
过去几十年来,企业知识管理只有两个选择:
- 手动编码结构: 如专家系统。能产生智能,但需要庞大的专家团队来维护,经济上不可持续。
- 放弃结构: 如Wiki和SharePoint。易于推广,但无法产生智能,因为没有人做最困难的结构化工作。
如今,第三种选择已经出现。语言模型,在正确的工具链支持下,可以自动从非结构化文本中提取实体、关系和事实,将它们转化为一个可解析的知识图谱。这个过程无需用户进行额外的手动编码,从而在根本上打破了长久以来的“二选一”困境。
“不熟悉”方案的样貌:Nubank的启示
2013年,巴西数字银行Nubank的创始团队在技术选型时,做出了两个“不理智”的决定:他们选择了当时用户极少、被认为无法扩展到零售银行业务的Datomic数据库,以及基于它的Clojure语言。
他们没有选择熟悉的方案,而是根据问题本身的需求,从第一性原理出发思考。结果,Nubank成为了全球最大的独立数字银行,拥有超过1亿客户。这个案例有力地证明了:
技术选择本身就是因果性的。 拒绝熟悉、选择正确的架构,才是通向大规模成功的路径。
检视当前技术栈的四个测试
如果你的系统在以下测试中有多于一项不合格,那么它很可能只是“熟悉感”的产物,而非一个正确的智能工具。
- 差距分析测试: 你的系统能否回答关于“缺失”的问题?例如,“哪些战略风险没有任何对应的缓解措施?”如果不能,它就不是智能工具,只是一个带聊天界面的搜索引擎。
- 实体解析测试: 你的系统能否将“JPMorgan Chase & Co.”、“JPMC”和“Chase Manhattan”解析为同一个实体,并提供可审计的证据?如果不能,它只是在做字符串匹配。
- 时间旅行测试: 你能否查询一年前你的系统认为什么是真实的?如果不能,你就没有一个真正的审计日志。
- 主权测试: 如果某个外国的法律或政策发生变化,你对自身数据的访问和控制会受到影响吗?如果会,你的数据主权就是不完整的。
结语
企业知识管理领域在过去几十年里耗费了巨额资金,却始终在重复同样的错误。“给wiki加上AI”是这个错误的最新版本。真正的出路在于构建能够取代wiki的新一代系统。幸运的是,构建这种新系统所需的基础技术——能够提取结构的语言模型、能够安全存储结构的图数据库和能够证明其来源的不可变账本——现在已经成熟。
我们必须认识到,熟悉感是敌人。我们曾经错误地将它等同于安全。现在是时候做出改变了。