Stephen Wolfram相关信息有关于Stephen Wolfram的Writings等相关链接包括ABOUT、WRITINGS、PUBLICATIONS、MEDIA、SCRAPBOOK、CONTACT等还有其在X、Facebook、LinkedIn、SoundCloud、Twitch等平台的链接。同时有文章分类如人工智能、宏观视角、生物学等众多类别。目录包含顶部、基本设置、有限状态机策略、可能的有限状态机空间、获胜的复杂性、不同规模机器之间的竞争、有限状态机的自适应进化、囚徒困境呢、所有可能游戏的空间、元胞自动机策略、元胞自动机与有限状态机、元胞自动机策略的自适应进化、图灵机策略、讨论、历史与个人笔记、致谢等内容。程序间的博弈竞争的规则学2026年6月4日发布此研究。无论是在生物学、经济学、政治学等众多领域常遇到可建模为两个主体反复相互竞争的情况。每一步中每个主体从一组特定行动中选其一按博弈论方式主体根据自己和对手行动获固定“收益”。主体靠特定固定程序即“策略”决策决策输入是主体和对手过去行动序列。长期以来好奇系统考虑所有可能策略会怎样可应用规则学方法解决。假设每步主体有两种行动用特定图标表示采用“匹配或不匹配”游戏收益规则。绘制不同策略下主体累积收益将一定步数后累积收益最大主体视为“获胜主体”以此对不同程序排名探索竞争的规则学。可用多路图表示所有可能行动序列每个主体在“匹配或不匹配”游戏中有累积收益特定策略会在多路图中定义特定路径。思考获胜策略基于的程序是复杂还是简单竞争会导致复杂性还是简单性。研究生物进化和机器学习最小模型发现自适应进化常使简单目标以复杂方式实现探讨目标是战胜其他主体时潜在开放性竞争是否会导致更复杂行为或程序。有限状态机策略有限状态机可视为定义简单的程序研究由其定义的策略。给出一个3个状态的有限状态机示例用对手行动序列在有限状态机图中定义路径根据到达状态颜色确定下一个行动。有时将有限状态机状态排列在一条线方便可总结使用特定输入所采取的路径。两个有限状态机相互竞争时一个机器输出成为另一个机器输入。使用“匹配或不匹配”游戏收益规则可得出机器累积收益最终认为主体2获胜。这里设置是确定性的与博弈论中常研究的设置不同。可能的有限状态机空间具有s个状态的有限状态机可能图数量为(2 s²) s但部分图对应机器行为相同不同机器数量更少。2状态机器2状态情况下有22个不同机器用数字标识。给出这些机器两两竞争示例及平均收益在所有有限状态机两两竞争中行动序列最终会周期性周期最多等于机器状态数乘积。显示22个2状态机器相互竞争结果评估“总体获胜者”可查看机器与其他机器竞争平均收益获胜者是机器26还给出其与其他2状态机器竞争平均收益及实际行为。列出所有不同机器按平均收益排名情况让排名前三亚军机器与所有机器竞争。可总结机器行为竞争步数会影响结果2状态机器最大周期为4步最大瞬态为3步实际平均收益随总步数变化前几步排名会变化但此情况确定最终获胜者不需要太多步数。还有关于“平均”含义的补充说明若用中位数代替平均值表现突出的获胜机器是机器1172。3状态机器对于956个3状态不同机器给出“竞争数组”、每台机器平均收益及分布。在“匹配或不匹配”游戏中排名靠前机器情况排名第一的机器1164与所有3状态机器竞争平均收益可能极限平均收益分布最常见行为形式。两台3状态机器竞争最大可能周期为9机器1164最大周期为7有792对3状态机器会产生周期为9的行为3状态机器最大瞬态结果为8。补充说明“平均”的含义讨论一台机器与其他机器竞争“平均”表现之前将“平均”定义为与每台其他机器竞争收益平均值若用中位数表现突出获胜机器是机器1172给出此情况下平均收益及其分布中位数“异常高”原因是该机器所有平均收益中恰好有1/2为 1相应平均值因平均收益分布“左尾”被拉低。获胜的复杂性查看每个2状态有限状态机与其他2状态机器竞争实际行为并按平均收益排序平均收益为0时行为简单其他平均收益时行为更复杂。通过查看压缩大小了解复杂性956个3状态机器结果显示平均收益与行为复杂性估计无强相关性平均收益最高机器中行为复杂程度差异大说明获胜机器行为特征非特别复杂或简单详细结构决定哪些机器获胜。不同规模机器之间的竞争探讨状态数更多的有限状态机是否比状态数少的机器表现更好。2状态机器与其他2状态机器竞争最佳平均收益约为0.1513状态机器与2状态机器竞争最佳平均收益为0.5933状态机器平均收益分布更宽因其可能数量更多似乎能更好“智取”2状态机器。在与2状态机器竞争中表现最佳的3状态机器是机器1234虽不总能确定获胜但多数情况能获胜它能表现得和许多2状态机器一样与它们“产生共鸣”。4状态机器中在与2状态机器竞争表现最佳的是机器109828在22个2状态机器中只有6种情况收益小于 1可认为它成功“涵盖”大多数2状态机器行为。有限状态机的自适应进化思考能否用有限状态机建立最小模型模拟竞争主体进化情况。研究所有可能有限状态机空间探讨通过自适应进化找到的机器序列。对有限状态机进行连续突变顶点突变反转颜色边突变反转颜色或重新路由。假设对手是3状态机器1165用4状态机器进行自适应进化从随机4状态机器开始对其进行连续随机突变若不降低平均收益就接受得到典型“适应度曲线”最终收益达到最大值 1各种“突破”收敛到“完美解决方案”不同随机突变“适应度曲线”总体形式相同。绘制自适应进化过程如何“在规则空间中移动机器”。4状态机器与所有2状态机器竞争时适应度增加但未达到 1最佳机器仍会输给一些2状态机器最终平均收益约为0.62。10个状态机器可自适应进化出对每个2状态机器极限收益都为 1的机器可看作“通用获胜者”能针对不同对手有不同“专门部分”对956个3状态机器作为对手时表现良好平均收益 0.603但有一些机器未获胜。若机器和对手都进行自适应进化交替对机器及其对手突变保留不降低平均收益的突变。两台最初相同的4状态机器平均收益进化情况有时一台机器获胜有时对手获胜通过自适应进化找到的机器很快忘记最初状态状态数更多的机器获胜交替情况通常更少。囚徒困境呢之前基于“匹配或不匹配”游戏现在考虑“囚徒困境”游戏给出该游戏收益情况通常将特定图标解释为“背叛”和“合作”。可基于有限状态机为囚徒困境游戏定义策略给出2状态机器之间迭代游戏例子收益由囚徒困境游戏决定。