与 Grok-3 探讨 Base62x 编码

人工智能 AI,尤其是通用人工智能 AGI (Artificial General Intelligence)的发展正如火如荼。
上次我们大概是在一年前的2024年4月探讨过《人工智能AI眼中的Base62x》 ( https://ufqi.com/blog/base62x-in-ai-agi-story/ ),当时的大致结论是说届时的 AI 是
“在扯蛋的事情上很专业,在专业的事情上很扯蛋。”

一年后的2025年2月,中国人工智能初创企业 DeepSeek 发明了一种能够大幅降低 LLM 大语言模型的方法,随机引发了又一轮的 AI 领域的军备竞赛。截至发文时,这一领域的最新尝试是来自世界首富 Elon Musk 的 xAI 团队的 Grok-3 ,兼备 DeepSeek 的高性价比和世界首富不惜成本的大力出奇迹。
我们原本计划是,用 Base62x 这个冷僻的小众应用作为试金石每两年进行一次评测,这次如此激烈而猛烈地推进,让我们忍不住要提前一年来进行新一轮的测试。这次是在 Grok-3 上与其就 Base62x 展开对话,作为言听计从的机器人, Grok-3 的表现的确令人耳目一新。

2025年2月20日中午,我与 Grok-3 开展了一次长达2个小时的多轮次的对话,对话过程大致记录如下。整个对话持续两个多小时,形成了一份多达126页,27K文字的对话聊天记录。
期间有多次成功尝试,向 Grok-3 解释了新名词 Base62x ,并让她去 Github 上读取相关文档和代码,对于 Grok-3 的每一步尝试都给予及时的响应和纠正。Grok-3 能够理解、小结、反思双方的误解,并不断的纠正、逐步达成共识。

Discuss Base62x with Grok-3, summary

这是令人进步的成就,她几乎具备了高中、甚至大学生的智力水平了。
遗憾的是,限于时间关系,持续两个多小时之后,在最后的对字节进行 位操作阶段,Grok-3 有较为明显的计算错误,最终还是失败了—— Grok-3 的知识库中,目前尚未能完全理解和应用 Base62x 。

对话是从第一个问题开始,

Q1:
could you please encode the string “The cat is Chasing a mouse.” by Base62x?

A1:
It seems there’s a slight misunderstanding. “Base62x” isn’t a widely recognized standard encoding scheme like Base64. Did you perhaps mean Base62 (a variant of Base64 that uses alphanumeric characters [0-9, a-z, A-Z] to represent data)? Or maybe you’re referring to a custom encoding? Since Base62x isn’t clear, I’ll assume you meant Base62 for now. If I got this wrong, please clarify!

Discuss Base62x with Grok-3, Q1

实话说,第一个问答, Grok-3 表现非常精彩,好到出乎意料! 这也是我们愿意继续对话下去的愿意之一。她很认真,没有糊弄用户,用 Base62 去强奸用户的真实意志 Base62x . 这正是我们所期许的,也是上之前一篇 Blog 所预计的:

可是我们的提问是 Base62x 啊,估计只有极其严谨或者自信、且坦承的少数人会回答:
Base62x , 我不懂这个带 x 的啊….

于是带着这份期许,我们试图给 Grok-3 更多资料,让她理解并运用 Base62x , 而不是通常意义上的 Base62. 第二个问题:

Q2:
no, I mean it, Base62x please, base62x from github.

A2:
15 web pages
I apologize for the confusion earlier. You specifically requested “Base62x” encoding, referencing the implementation from GitHub. After reviewing available information, it seems you’re referring to the Base62x encoding scheme developed by wadelau (available at github.com/wadelau/Base62x), which is an alternative to Base64 that avoids non-alphanumeric symbols and includes a unique twist with marker bytes (x) for improved efficiency. Unlike standard Base62, Base62x introduces a custom approach with additional logic for encoding/decoding binary data.

Discuss Base62x with Grok-3, Q2

Grok-3 首先进行了联网搜索,找到 15个网页,并进行了概括总结 Base62x 的相关特征。
整个概况总结非常合理准确,并且在理解的基础上进行了实际 Base62x 的编码操作。好得超乎意料, Grok-3 具备自我学习能力,这实在是精彩和难得可贵的地方。

下面进入各种扣细节的地方,不断的 clarifying, 用户只要有耐心, Grok-3 绝对是勤勉忠实的好伙伴。前后多轮次,大约几十轮的对话,Grok-3 依然能够不知疲倦地进行持续的 recap context。这是难得可贵的另一面。

Discuss Base62x with Grok-3, Alphabet
Discuss Base62x with Grok-3, Chinese and six-bit groups
Discuss Base62x with Grok-3, bitwise operations
Discuss Base62x with Grok-3, bitwise operations remedy

临近对话结束, Grok-3 卡壳在位运算的操作上,有明显的计算错误,且指出来后,她也能改正。
由于时间关系,没有一一订正所有位操作的错误。估计再多些时间和步骤, Grok-3 能够最终掌握 Base62x 的编码规则。

号称目前世界上最先进的 AI 居然会在单字节的位操作这种基本运算中犯错实在是出乎意料。这让我想起2025年春节前我辅导孩子的小学奥数题目遇到的问题,

一道奥数题目求解: 一个较大的整数,由 1234…1994199519961997 组成,问这个较长的大整数被9整除的余数是多少?

这个奥数题目由于涉及到的数据较大,大概是6000多位长的一个整数,无法直接通过除法运算得出结果。Grok-3 能够知道需要用到数学上 数的同余性质 ——如果一个数各个位数上的数字之和能被 9 整除,则这个数也能被 9 整除。
接下来就是计算 1234…1994199519961997 有多少位,这些位上的数字之和是多少。大问题拆解成了加减乘除的简单运算,但就是这样的小问题,2025年2月,拿这个问题问不同的AI,甚至同一个AI的不同版本,甚至同一个AI不同时间提问,都会给出各个不同的答案。
或许现在的AI,已经剑走偏锋,慎于难而忽于易,没被旗杆绊倒,却被羊橛子绊倒了。单字节的位运算,一个整数有多少位,每位上数字之和,这不应该是新问题。

自2015年我初次参加中国计算机学会的“机器学习”集训班以来,十年来目睹人工智能 AI 飞速发展。从技术角度看,在2018年前后,通过反向传播等算法可以完全模拟任何二维坐标、三维坐标系内任何曲线这一突破之后,AI 的大门彻底打开,随后强化学习再次赋能,这些是算法层面的探索。
在算力层面,随着英伟达 GPU 的大规模应用,AI 如虎添翼。
2022年11月来自 OpenAI 的 ChatGPT 又将 AI 揭开新篇章, 生成式 AI 正式进入人的视野。

这些简短的 AI 发展回顾,从认知科学上来说,刚好符合了最近阅读的心理学经典著作《津巴多普通心理学 Psychology: Core Concepts》( https://ufqi.com/news/ulongpage.12674.html )里的相关研究的描述。

在认知心理学研究中,在代表人类智力水平的“思维与智力”一节中,相关研究发现,善于思考的人具备的普遍的能力可以分为两类——
一类是算法思维,就是已知的公式和程序,可以用来应对和解决被明确界定的问题,它遵循着一个直接从问题一步步引向答案的程序;
另一类是启发式思维,涉及主观价值或有太多未知因素的问题,或者复杂到无法用已有的公式计算的问题。

第一类较容易理解,工程应用上都是如此,从导航软件的路径规划到火箭发射的计算等等,都是如此。
第二类较为复杂,但认知科学家还是进一步地将启发式思维分为三个之类:
a. 逆向思维,从结果出发,逆向反推先导条件或者可能的路径;
b. 寻找类比,识别新问题和老问题的相似性或者进行类比;
c. 拆解细分, 将一个大问题分解为多个小问题。

对比发现 AI 的认知与思考能力,似乎也遵循这些规律,初期的 AI 试图学习和理解现有的公式和算法,拥有这些知识和能力后,就能够使用第一类算法思维来解决相应的问题。
更进一步的,对于开放式问题,就需要有启发式思维,显然本文起初要讨论的 Base62x 就是一种新的“算法”, 对于 Grok-3 这样先进的 AGI 来说,也是陌生的。

在前述就 Base62x 与 Grok-3 对话的过程中,她先是采取类比的方法,将 Base62x 使用类似传统 Base62 的编码算法,然后根据互动逐步修正算法,直至最终能够完全掌握这种新的编码“算法”。

拥有这种可塑性的通用人工智能 AGI 正式打开了通往硅基生命的大门。
相信通过不断的迭代升级,AGI 智能体会逐渐追平甚至超越普通人的智能水平,然后在某个奇点时刻拥有意识,进而能够复制另外一个完全相同甚至更先进的“子代”智能体——实现繁殖。

在此之前,针对 Grok-3 来说, Base62x 仍是一个冷僻的小众的 test case.
也由此,我们可以得知 Grok-3 比之前的 OpenAI 的 ChatGPT 和 Google Gemini 都有巨大的质的飞跃。



Base62x: An alternative approach to Base64 for only-alphanumeric characters in output.
Base62x is an non-symbolic Base64 encoding scheme. It can be used safely in computer file systems, programming languages for data exchange, internet communication systems, and is an ideal substitute and successor of many variants of Base64 encoding scheme.

Base62x 是一种无符号的Base64编码方案。
在计算机文件系统、编程语言数据交换、互联网络通信系统中可以安全地使用,同时是各种变种Base64编码方案的理想替代品、继任者。

base62x-algorithm
Base62x Algorithm

此条目发表在Base62x, 编程技术, 计算机技术分类目录,贴了, , , , , , , 标签。将固定链接加入收藏夹。

发表评论

您的电子邮箱地址不会被公开。 必填项已用*标注

Captcha Code