尊龙凯时人生就是博z6com
每一个新动态都是尊龙凯时向前迈进的新脚步

尊龙凯时人生就是搏|dnf达7|研究:反复使用AI生成的内容来训练AI可造成“模

2024-09-16

  IT之家 9 月 5 日消息✿ღ★,当地时间 9 月 4 日✿ღ★,据《福布斯》报道✿ღ★,牛津大学的伊利亚・舒梅洛夫博士和他的团队发现✿ღ★,当生成式 AI 软件仅依赖于由 AI 生成的内容时✿ღ★,回答的质量开始恶化尊龙凯时人生就是搏✿ღ★。这项研究已经发表在《自然》杂志上✿ღ★。

  在最初的两次查询后✿ღ★,答案逐渐偏离准确性✿ღ★,到第五次时✿ღ★,质量显著下降尊龙凯时人生就是搏✿ღ★,到了第九次连续查询时✿ღ★,回答已完全退化为无意义的胡言乱语✿ღ★。研究人员将这种生成式 AI 内容的循环过度使用称为“模型崩溃”✿ღ★,即 AI 在不断污染自己的训练集后尊龙凯时人生就是博·(中国)官网✿ღ★,✿ღ★,输出的内容逐渐偏离现实✿ღ★,最终变得毫无价值✿ღ★。

  舒梅洛夫表示✿ღ★:“令人惊讶的是✿ღ★,模型崩溃发生得如此迅速且难以察觉✿ღ★。最初✿ღ★,它会影响到少数数据 —— 那些代表性不足的数据尊龙凯时人生就是搏✿ღ★。接着尊龙凯时人生就是搏✿ღ★,✿ღ★,它会影响输出的多样性dnf达7尊龙凯时人生就是搏尊龙凯时人生就是搏(中国)官网✿ღ★。✿ღ★,导致差异性减少✿ღ★。有时✿ღ★,你会观察到对多数数据的微小改进尊龙人生✿ღ★,✿ღ★,但这种改进掩盖了少数数据表现的恶化尊龙凯时人生就是搏✿ღ★。模型崩溃可能带来严重后果尊龙凯时人生就是搏✿ღ★。”

  研究人员通过一种方法确定了“模型崩溃”现象的存在✿ღ★:使用一个预训练的 AI 驱动的维基百科dnf达7✿ღ★,然后让 AI 模型基于自己生成的内容进行更新✿ღ★。受污染数据的影响逐渐导致原本的训练集被侵蚀✿ღ★,输出的信息也随之变得难以理解dnf达7✿ღ★。例如✿ღ★,在第九次查询循环后✿ღ★,研究中的维基百科条目从关于 14 世纪英国教堂尖顶的内容滑稽地变成了一篇关于各种颜色的短尾兔子的论文✿ღ★。

  报道称✿ღ★,根据亚马逊网络服务(Amazon Web Services)团队在 6 月发布的另一项研究✿ღ★,大约 57% 的网络文本都经过了 AI 算法的翻译✿ღ★。如果互联网上的人类生成数据迅速被 AI 过滤内容覆盖dnf达7尊龙凯时人生就是搏✿ღ★,且舒梅洛夫的研究发现属实dnf达7✿ღ★,那么 AI 可能正在“自我毁灭”—— 并同时“毁灭”互联网✿ღ★。

  研究得出结论✿ღ★,要实现 AI 的长期可持续发展尊龙凯时人生就是搏✿ღ★,唯一方法是确保其能够访问现有的非 AI 生成内容人工智能✿ღ★,✿ღ★,并持续引入新的人工生成内容✿ღ★。