互联网死了？斯坦福大学表示，三分之一的新网站是人工智能生成的

简而言之

到 2025 年中期，新发布的网站中有 35% 是由人工智能生成或人工智能辅助的，而在 ChatGPT 2022 年 11 月推出之前这一比例为零。

已证实的效果是语义收缩和人为积极性，而不是错误信息或风格同质性，尽管大多数人都这么认为。

当人工智能普及率达到 35% 时，模型崩溃风险从理论问题转变为下一代基础模型的实证问题。

一项新研究给出了目前互联网中有多少内容是由人工智能生成的数字：35%。根据斯坦福大学、伦敦帝国理工学院和互联网档案馆的研究，到 2025 年中期，新发布的网站被分类为人工智能生成或人工智能辅助的网站所占的比例。在 2022 年 11 月 ChatGPT 推出之前，这一数字基本为零。

“我发现人工智能接管网络的速度相当惊人，”伦敦帝国理工学院研究员、该论文的合著者 Jonáš Doležal 告诉 404 Media。 “经过人类几十年的塑造，互联网的很大一部分在短短三年内就被人工智能定义了。”

这项名为“人工智能生成文本对互联网的影响”的研究利用了互联网档案馆 Wayback Machine 33 个月的网站快照，并使用名为 Pangram v3 的人工智能文本检测器对每个页面进行分类。

已证实的危害：共鸣，而非事实

研究人员测试了关于人工智能内容对网络的影响的六种假设。只有两个接受数据审查。

第一个：我们正在变成一群以同样方式行事的愚蠢 NPC……或者更科学地说，网络在语义上变得越来越不多样化。

人工智能生成的网站的成对语义相似度得分比人类编写的网站高 33%。相同的想法总是以几乎相同的方式表达。

该论文表明，在线奥弗顿窗口可能正在缩小，不是通过审查或协调活动，而是因为语言模型针对接近其训练分布的输出进行了优化。

第二：网络变得异常活跃。

AI 内容的积极情绪得分比人类内容高出 107% 以上。研究人员将这一点与法学硕士有据可查的阿谀奉承倾向联系起来——接受了人类认可信号的训练，他们写出的文本让人感觉干净、无摩擦和乐观。

互联网上充斥着欢乐、同质化的内容，可能会在没有任何人拉动杠杆的情况下大规模地边缘化人类的异议。

尽管公众普遍相信，但该研究发现没有统计上显着的证据表明人工智能内容正在降低互联网的事实准确性。研究人员发现人工智能流行率和事实错误率之间没有有意义的相关性。

风格单一文化假设——人工智能将个人声音扁平化为通用的统一语域——是受访者最强烈的信念（83% 同意）。数据并没有证实这一点。人物层面的分析发现，与人工智能流行率相关的风格同质性没有统计学上的显着增加。

模型崩溃问题刚刚成为现实

更广泛的利害关系超出了话语质量。当人工智能普及率达到 35% 时，模型崩溃的理论风险（未来模型在人工智能生成的数据训练后性能退化）从学术关注转向了实证现实。未来基于当代网络爬行训练的基础模型将不可避免地摄取大量由人工智能生成且语义多样性明显较低的数据。

该团队目前正在与互联网档案馆合作，将这项研究转变为一种持续的实时监控工具，实时跟踪人工智能在网络中的份额，而不是作为一次性快照。

与该研究同时进行的一项美国调查发现，大多数美国人已经相信所有六种负面假设，包括数据不支持的假设。不经常使用 AI 的人相信 AI 危害的可能性比经常使用的人高 12%。死亡互联网理论的信徒们，看看数据吧：互联网并没有死亡，但 35% 的新内容在某种程度上可能是僵尸内容。