当前位置：首页 > 资讯 > > 正文

陶哲轩称GPT4需校准

来源：量子位时间：2023-06-17 20:56:38

梦晨发自凹非寺
量子位 | 公众号 QbitAI

【资料图】

数学家 陶哲轩 刚刚自曝，在 GPT-4发布之前 就从微软那里获得了 访问资格 。

也就是和微软154页《AGI的火花》论文里同款，未经过安全训练但能力更强的 满血版 。

他让GPT-4针对论文提出问题来准备讲座。

他让GPT-4生成数学证明，并发现过去阅读人类作品的经验完全不适用了。

对于AI在数学研究中的表现，他给出的大胆却又严谨的预言：

当与形式证明验证器、互联网搜索和数学符号包等工具整合时，2026年的AI，如果使用得当，将成为数学研究中值得信赖的共同作者，而且在许多其他领域也是如此。

除了数学研究，他也把GPT-4用在了生活中。

他经常使用GPT-4回答一些随意、措辞含糊的问题，这些问题以前需要在搜索引擎里精心调整关键词才行。

还有一位亲戚拿到重症诊断的同事，被GPT-4写的慰问信感动得哭了。

在对话中，GPT-4可以充当富有同情心的倾听者、热情洋溢的反馈者、富有创造力的灵感来源、翻译者或教师，又或是魔鬼的代言人。

……

微软邀请他依据自己的体验写了一篇文章，在开头处他总结到：

在过去的几十年里，人类已经习惯了从信息技术中期待某些东西……
随着GPT-4等生成式AI工具的出现，所有这些期望都需要重新校准，如果不是完全放弃的话。

以下是陶哲轩全文翻译整理，由公开发行版GPT-4完成。

拥抱变化和重新设定期望

在过去的几十年里，人类已经习惯了从信息技术中期待某些东西。以下是其中的一些：

硬件和软件将以摩尔定律的速度改进（例如性能、用户体验和可靠性），然后过渡到更加渐进式的改进。单个软件工具可以可靠地产生高质量的输出，但输入数据必须具有最高质量，并且必须以工具要求的特定方式精心格式化。工具越先进，规范和边界情况就越复杂，这使得工具之间（尤其是不同提供商之间）的互操作性成为一个重要的技术挑战，除非有精心设计的标准。人类将做出所有关键的决策；软件工具通过成功或失败地执行人类指示的命令来影响决策过程。

随着GPT-4等生成式AI工具的出现，所有这些期望都需要重新校准，如果不是完全放弃的话。

这些工具在处理含糊的（甚至略有错误的）自然语言提示或从网页或PDF中提取的嘈杂数据时表现非常出色。

我可以将最近的一篇数学预印本的前几页PDF输入GPT-4，让它生成半打有关该预印本的专家可能会提出的聪明问题。我打算使用这类提示的变体来准备将来的演讲或开始阅读技术复杂的论文。

最初，我努力使提示尽可能精确，这是基于我与编程或脚本语言的经验。

最终在我放弃这种谨慎，并简单地向AI提供大量原始文本时，取得了最好的结果。

这种鲁棒性可能使AI工具与传统软件工具相结合，或者彼此相结合，或者与个人数据和偏好相结合。它将它将颠覆各种工作流程，而目前孤立使用的人工智能工具只是在暗示有这种能力。

在对话中，GPT-4可以充当富有同情心的倾听者、热情洋溢的反馈者、富有创造力的灵感来源、翻译者或教师，或者是魔鬼的代言人。

它们可以帮助我们在各个维度上繁荣发展。由于这些工具允许各种各样的输入，我们仍在尝试如何充分利用它们。

我现在经常使用GPT-4回答我过去需要使用精心准备的搜索引擎查询的随意和含糊的问题。

我请它为我必须编写的复杂文件提供初稿建议。我认识的一些人已经利用这些工具惊人的人工情感智能来获得支持、安慰和一个安全的环境来探索他们的感受。我的一位同事被GPT-4生成的一封安慰信感动得热泪盈眶，这封安慰信是写给一个近期收到毁灭性医学诊断的亲戚的。

在对话中，GPT-4可以充当富有同情心的倾听者、热情洋溢的反馈者、富有创造力的灵感来源、翻译者或教师，又或是魔鬼的代言人。

它们可以帮助我们在各个维度上繁荣发展。

目前的大型语言模型（LLM）经常能够在特定知识领域（例如我自己所从事的研究数学）中令人信服地模仿正确的专家回应。但众所周知，仔细观察时，回答往往是荒谬的。

人类和AI都需要发展分析这种新类型文本的技能。

我过去依赖的用于“嗅出”错误数学论证的文体信号在LLM生成的数学中几乎无用。只有逐行阅读才能分辨出是否有实质内容。奇怪的是，即使是无意义的LLM生成的数学，往往也引用了正确的相关概念。

通过努力，人类专家可以将这些不起作用的观点改进为正确且独创的论据。

2023年水平的AI已经可以为从业数学家提供有建设性的提示和有前景的线索，并积极参与决策过程。

当与正式证明验证器、互联网搜索和符号数学软件包等工具整合时，我预计，例如2026年水平的AI（如果使用得当）将成为数学研究领域以及许多其他领域值得信赖的合作作者。

那么接下来呢？这不仅取决于技术，还取决于现有人类制度和实践如何适应。

当AI指导的研究生撰写的入门级数学论文现在可以在不到一天的时间里生成——并且具有未来AI工具更好的准确性时，研究期刊将如何改变其出版和引用实践？我们的研究生教育方法将如何改变？我们是否会积极鼓励和培训我们的学生使用这些工具？

我们在很大程度上没有准备好应对这些问题。将会有惊人的AI辅助成就展示和勇敢的实验来将它们纳入我们的专业结构。但也将出现令人尴尬的错误、争议、痛苦的破裂、激烈的争论和仓促的决策。

我们通常的技术范例将无法作为导航这些未知水域的充分指南。也许最大的挑战将是以尽可能安全、明智和公平的方式过渡到一个新的AI辅助世界。

One More Thing

陶哲轩还在个人博客中分享了这篇文章的创作中的一些花絮。

他自己和GPT-4先分别写了一份。

又让GPT-4看了自己写的之后，要求GPT-4把它的文章改成自己的风格。

最后又让GPT-4直接改写了自己的初稿，并贴在一起方便大家比较。

（最后还是用了他自己写的）

感兴趣的话可以去看看～

原文： /ai-anthology/terence-tao/

4个版本比较： /about/ai-generated-versions-of-the-ai-anthology-article/

参考链接： [1]/@tao/110534826121112802

— 完 —

量子位 QbitAI · 头条号签

关注我们，第一时间获知前沿科技动态

关键词：

上一篇：小高层11层买3楼好还是10楼好_11层小高层买几楼好 11层小高层买3楼的弊端与好处

下一篇：最后一页

精心推荐

2022-12-15

世界观速讯丨异动快报：ST升达（002259）12月15日9点36分触及涨停板

12月15日盘中消息，9点36分ST升达（002259）触及涨停板。目前价格3 23，上涨4 87%。其所属行业燃气目前下跌。领涨股为ST升达。该股为天然气概念热股。
2022-12-14

中泰化学: 2022年第十次临时股东大会决议公告

证券代码：002092 证券简称：中泰化学公告编号：2022-139 新疆中泰化学
2022-12-14

环球观热点：绥化13岁子女抚养费怎么规定

1、有固定收入的，抚养费一般可按其月总收入的百分之二十至三十的比例给付。负担两个以上子女抚养费的，比例可适当提高，但一般不得超过月总收
2022-12-14

生命受到威胁咋办全球快播报

生命受到威胁要立刻报警，行为人依法受到治安处罚，如果情节恶劣的，构成刑事犯罪，依法判处刑事处罚。相关法律依据如下：一、有下列寻衅滋事
2022-12-13

全球快播：12月13日佳沃食品（300268）龙虎榜数据：游资赵老哥上榜

沪深交易所2022年12月13日公布的交易公开信息显示，佳沃食品（300268）因日涨幅达到15%的前5只证券登上龙虎榜。2、子公司从事冷冻海洋海产品进

X 关闭

陶哲轩称GPT4需校准

拥抱变化和重新设定期望

One More Thing

精心推荐

资讯

行业排行

产业

不用跑北京在家门口也能挂上顶...

“十四五”期间河北省将优化快...

张家口市宣化区：光伏发电站赋能...

“张同学”商标被多方抢注涉及...

山东济南“防诈奶奶团”花式反诈...

广州新增1例境外输入关联无症状...

西安报告初筛阳性病例转为确诊病例

广东东莞新增本土确诊病例2例 ...

中缅边境临沧：民警深夜出击捣毁...

“土家鼓王”彭承金：致力传承土...

陶哲轩称GPT4需校准

拥抱变化和重新设定期望

One More Thing

精心推荐

资讯

行业排行

产业

不用跑北京 在家门口也能挂上顶...

“十四五”期间 河北省将优化快...

张家口市宣化区：光伏发电站赋能...

“张同学”商标被多方抢注 涉及...

山东济南“防诈奶奶团”花式反诈...

广州新增1例境外输入关联无症状...

西安报告初筛阳性病例转为确诊病例

广东东莞新增本土确诊病例2例 ...

中缅边境临沧：民警深夜出击捣毁...

“土家鼓王”彭承金：致力传承土...

不用跑北京在家门口也能挂上顶...

“十四五”期间河北省将优化快...

“张同学”商标被多方抢注涉及...