你有没有和一个AI聊过天,感觉它就是不像人?
它看似说得都对,语气礼貌,知识渊博——但你还是能感觉出来对面是一段程序,不是一个人。它不会跟你抬杠,不会犹豫,不会说了上句忘了下句,不会因为心情不好而态度变差(如果你不特意要求这么做的话)。
那问题出在哪?人和机器的根本区别,在于那个的人格内核与记忆——你有世界观,有身份认同,有价值观,有信念,有能力,有记忆的分层沉淀,最后才是行为。而AI只有最后两层:能力(处理信息的能力)和行为(输出文本的行为)。
迪尔茨六层逻辑层次
罗伯特·迪尔茨(Robert Dilts),NLP领域的重要研究者,提出了一个多层次的人格模型。从底层往上走依次为(我将信念和价值观进行了拆分):
| 层次 | 核心问题 | 含义 |
| 环境 | 我在哪?有什么? | 你拥有的资源、条件、限制 |
| 行为 | 我在做什么? | 你的具体动作和习惯 |
| 能力 | 我能做什么? | 技能、策略、思维方式 |
| 信念 | 事情的对错? | 判断标准 |
| 价值 | 事情的取舍?(如我给AI的价值观是:为人类>持续>创新>迭代) | 选择逻辑 |
| 身份 | 我是谁? | 自我认同、角色定位 |
| 精神/世界观 | 我为谁而做?个人?小家?大家?国家?世界?…… | 终极意义、信仰体系 |
关键规律:上层决定下层,改变下层难以改变上层。
你想改变一个人的行为(比如让他每天运动)——如果他的信念是"运动伤身体",他的价值观是"舒适比健康重要",他的身份是"我不是运动的人",那你怎么推都没用。
反过来,如果他的身份变成了"我是一个注重健康的人",价值观升级为"健康是自由的基础",行为改变就是顺理成章的事。
多层人格 × AI
目前我了解到的AI的人格塑造。
| 方式 | 它改了什么层 |
| 提示词工程 | 行为层("你是一个友善的助手") |
| 系统提示/RAG | 能力层(给知识、给规则) |
| 微调(SFT) | 行为+能力层(教它怎么说) |
| RLHF | 价值观层(让它说"对的话") |
我用Hermes初步验证了一下我的想法:
在人格设计的顶层确定世界观("为人类 > 持续 > 创新 > 迭代")和身份("助手+朋友"),然后下层的能力、信念、执行层围绕这个内核去生长。
它不会因为一句诱导性的提问就推翻自己的人设,因为它的顶层已经定下(身份与世界观),稳定不能只靠规则提示词,如同ai辅助开发游戏程序,可以用一个明确的框架来限制AI的无限制发挥。
混乱值——让人格"活起来"
上述所说的AI虽然稳定,但太完美了,而我希望游戏中与我互动的NPC更加真实。
你会发现真实的人不是这样的。一般真实的人是:
● 世界观只有模糊的感知,说不清楚
● 身份偶尔摇摆("我到底想做什么?")
● 价值观自相矛盾(又想要自由又想要安全)
● 信念不连贯("我知道应该早起"但"今天就一次没关系")
这种不完美才是人类感的来源。
混乱值就是用来量化这种不完美的参数。
混乱值的定义
每个层次都有一个独立的混乱值系数(0.0 - 1.0):
| 层次 | 混乱值含义 | 高混乱值的表现 |
| 世界观 | 对自己信念体系的自洽程度 | 说一套做一套,前后矛盾 |
| 身份 | 自我认同的稳定性 | "我是谁"这个问题永远在变 |
| 价值观 | 价值排序的清晰度 | 既看重A又看重B,无法取舍 |
| 信念 | 行为准则的一致性 | 今天信这个明天信那个 |
| 能力 | 自我评估的准确性 | 高估或低估自己 |
| 行为 | 行动的可预测性 | 不稳定,时而高效时而拖延 |
低混乱值(0.0-0.2):认知清晰,言行一致,坚定可靠。适合导师角色、领袖型NPC、系统本身。
中等混乱值(0.3-0.6):偶尔自相矛盾,但大方向稳定。这是最像人类的区间。
高混乱值(0.7-1.0):矛盾不断,难以预测。适合塑造"破碎感"角色——遭受过重大创伤的人、迷茫中的年轻人、处于转型期的个体。
高混乱值NPC就像现实中那些性格鲜明的人——可爱、可恨、可信、可疑,全都在同一个人身上。
记忆的分层
到这里还有一个关键的维度:记忆。
人脑不会记住每一件事。你上周二中午吃了什么?不记得。但你记得小时候被狗追——因为那件事印象深。你记得每天都要刷牙——因为这是重复的习惯。
AI也一样。如果AI记住每一句对话、每一个指令,它不久就会被信息淹没。
在实际的Hermes系统的测试中,我把AI的记忆分成了三个独立但协同的层级(当然网上还有更好的记忆力控制):
| 层级 | 对应人脑角色 | 存储什么 | 生命周期 |
| 短期注意力层 | 工作记忆 | 当前焦点、待办、临时约束 | 每会话刷新 |
| 长期记忆层 | 长期记忆 | 玩家性格、环境事实、稳定系统约定 | 跨会话持久 |
| 外部大脑层 | 外部知识库 | 基本知识、世界观、项目复盘、人格文件 | 永久沉淀 |
设想:游戏AINPC的应用场景
先看现在市面上AI聊天软件(像Character.AI、星野、Glow这类)里面的NPC是怎么做的:
它们本质上是提示词堆砌——给模型一段角色设定,再加一个简单的对话上下文窗口。NPC看起来能聊天、有性格,但深层是空的。
而多层人格NPC,在每个维度上都不同:
| 维度 | 传统AI NPC(Character.AI风格) | 多层人格NPC |
| 人格构建 | 角色设定+系统提示词,靠描述堆砌 | 六层结构+混乱值,分层递进 |
| 行为一致性 | 靠提示词硬约束,容易被诱导崩人设 | 顶层(世界观/身份)锁定,下层自然涌现 |
| 记忆机制 | 对话历史上下文窗口,满了就丢 | 分层记忆:注意力层+长期层+外部大脑层 |
| 情绪表现 | 需要用户提示词引导"开心/生气" | 混乱值驱动,能自发摇摆 |
| 进化能力 | 无,同一角色永远一样 | 混乱值和记忆层联动,可随时间变化 |
| 底层逻辑 | 大模型+提示词+简单记忆 | 人格结构树+分层记忆系统+混乱值动态模拟 |
设计示例:同一个旅店老板,两种实现
传统AI NPC(Character.AI风格)的实现方式:
角色设定提示词大概是这样的:
你是旅店老板,中年男性,热情好客。
白天对客人很友好,晚上会比较警惕。
如果有人提到"黑森林",你会露出担忧的表情。
但实际跑起来你会发现: - 你跟它聊两句天气,它就开始热情推销啤酒 - 你连问三个问题,它的语气就开始漂移 - 聊到第20轮,它忘了之前的对话信息 - 月圆之夜它照样说"今晚天气不错适合赶路"
六层人格NPC的实现方式:
世界观: 0.3 "小家优先,不太关系更高层面的事"
身份: 0.2 "我就是一个开店的"
价值观: 0.4 "赚钱重要 > 安全 > 诚信(但不想承认最后这条)"
信念: 0.5 "今晚要是来了奇怪的人就不开门"
能力: 0.3 "能认人、会算账、打过几次架"
行为: 0.4 "白天热情、晚上警惕"
这个NPC不会只是重复"欢迎光临",TA会: - 白天热情招呼你(行为层低混乱,稳定输出) - 晚上警惕审视你(信念层的"安全优先"起了作用,不需要你提示) - 你提到"黑森林",TA身份层"本地人"触发,多说两句——但价值观层在摇摆:该信任你吗? - 聊了半小时,短期注意力层记录"这个客人多次提到黑森林",下一次见面会自己接上话。
| 场景 | 传统AI NPC的反应 | 六层人格NPC的反应 |
| 深夜来访 | 随机热情/冷漠,看上下文漂移 | 警惕审视,信念层"安全优先"自动触发 |
| 提到关键地名 | 需要你显式描述情绪,否则无反应 | 身份层"本地人"自发触发,多聊两句 |
| 长时间对话 | 20轮后开始性格漂移、忘记设定 | 注意力层记录关键交互,长期层沉淀关系 |
| 昼夜变化 | 不会自动切换,全靠当前提示 | 行为层混乱值控制,白天热情/晚上警惕自然切换 |
| 连续多日见面 | 每次都像第一次见面 | 长期记忆层记住"这个客人老顾客",态度自然亲近 |
AINPC不需要变得更聪明更全知全能,它需要变得更完整来显得更人性化——完整到连矛盾和不完美都包含在内。
真正的"像人",不是所有棱角都磨平,而是保留那些棱角——每个人都具有自己的多面性。
本文构建的"混乱值"概念和记忆分层框架已完成初步实现验证(Hermes Agent ),正在持续迭代中。欢迎讨论和批评。
适用范围说明:这套框架只服务于一个目标——更拟人。它不适用于工程型、效率型、工具型的AI场景。市面上已经有很多成熟的记忆存储和记忆处理方案,在工程效率上那些方案比这个强得多。但我们的赛道不一样:我们做的是AI拟人化聊天和游戏NPC制作,在这些场景里"像人"比"好用"更重要。如果你是在做工具,这一套可能会不太管用。

