陶哲轩甩出调教GPT-4聊天记录,点击领取大佬的研究助理

来源:IT之家时间:2023-06-26 12:37:37   阅读量:7420   

鹅妹子嘤,天才数学家陶哲轩搞数学研究,已经离不开普通人手里的“数学菜鸡”GPT 了!

就在他最新解决的一个数学难题下面,陶哲轩明确指出自己“使用了 GPT-4”,后者给他提出了一种可行的解决方法。

借助 GPT-4,他不仅成功地突破了这一难题,还将答案分享在了 MathOverflow 上:

它给我提供了最终的解题思路,接下来我只需要继续计算就行。

为了给更多数学家分享用 GPT-4 工作的便利性,陶哲轩还将自己的聊天记录 po 了出来,里面完整地记载了他和 GPT-4 的对话。

可以看见,在这份聊天记录中,他把 GPT-4 称呼为“专业数学合作者”,而不仅仅是一个普通的数学助手。

这个身份属实不一般了,不知道之后陶哲轩写论文的时候会不会把 GPT-4 列为共同作者。

不仅如此,戳对话记录底部的“continue this conversation”按钮,还能一键把对话记录导入自己的 ChatGPT 中,突然闯入人类大师和 AI 的交谈。

陶哲轩解决了什么新问题?

陶哲轩研究的问题,是一个两天前在数学网站 MathOverflow 上更新的提问。

这个名叫“优雅的递归之 A301897”问题,具体长这样:

其中,A301897 是一个被整数数列网站 OEIS 收录的数列:

这个数列中有一系列来自长度为 n 的排列 b 的数,它们有一个共同点,就是满足 Diaconis-Graham 不等式且等号成立。

Diaconis-Graham 不等式由戴康尼斯和葛立恒(没错,就是“最大数”之父 Ronald Graham)于 1977 年共同提出,属于概率统计方面的研究。

显然,这一大段提问中不仅夹杂着大量专业数学公式,而且还涉及需要跳转的网页资料。

作为数学公认不太好的“数学菜鸡”,GPT-4 真的能像一名专业数学家那样快速读懂公式、给出解决问题的专业建议吗?

事实上,相比直接把问题复制粘贴给 GPT-4,陶哲轩做了三件事:

  • 首先,做一些提示工程,明确 GPT-4 的“身份”和“目标”。其中身份是“一个擅长给技巧性建议的数学合作专家”,目标是“提供一些建议”而非解决问题。

  • 然后,相比直接把大段公式复制进 GPT-4 提问栏,陶哲轩选择将问题描述转成 Markdown 格式。

完整的提问过程长这样:

GPT-4 很快给出了 8 个具体的建议:

1、理解问题:在深入证明之前,确保你理解了问题中的每一项。如果你不熟悉 Diaconis-Graham 不等式,研究一下它,了解表达式 a 和 R (n, q) 中的每一项代表什么。

2、简化表达:有时候,复杂的表达可以被简化。例如,你可能想看看表达式中 a 的二项式系数是否可以简化,或者是否可以用更简单的方式计算总和。

3、归纳法:由于 R 是递归定义的,因此证明猜想的一种自然方法是使用数学归纳法。你可能想要证明,如果这个猜想对 n 成立,那么它对 n+1 也成立。

4、生成函数:另一种方法是使用生成函数。尝试找到 a 和 R (n, 0) 的生成函数,然后证明它们是相等的。这有时可以把一个复杂的组合问题变成一个更简单的代数问题。

5、渐近分析:正如你提到的,分析 a 和 R (n, 0) 的渐近行为可能会对它们的关系有一些深入的了解。这有时可以用斯特林的阶乘近似来实现,或者通过分析表达式中的主导项来实现。

6、数值证据:虽然不是证明,但收集数值证据有时可以让我们了解如何证明一个猜想。因为你有 PARI / GP 代码,可以用数值来检查猜想,你可能想读一读每个序列的前几项,看看是否能发现任何模式。

7、寻找类似问题:有时,一个问题或猜想是一个已知问题的泛化或变体。在组合文献中寻找类似的问题或定理,看看它们的证明是否可以适用于这个问题。

8、寻求反馈和合作:不要犹豫,从同事那里寻求反馈,或者在 MathOverflow 这样的论坛上发布你的部分结果。协作和同行评议通常是解决复杂数学问题的关键。

最终,陶哲轩使用建议 4,也就是生成函数的方法,成功解决了问题。

当然,解决问题的过程并不需要用到 GPT-4,采用 MAPLE 工作表 + 纸笔手动计算就能完成。陶哲轩也尝试了渐进分析的方法,不过事实证明还是用生成函数更有效。

简单来说,陶哲轩只是用 GPT-4 给自己提供不同的解题思路,也就是“解题灵感”,但具体怎么解答,也就是更加数学的方法,他则不会交给 GPT-4 来完成。

至于“查资料”这种 GPT-4 的应用,陶哲轩也发挥到了极致。

例如在思考问题时,他还会把自己的“灵光乍现”拿出来和 GPT-4 讨论一下,例如他觉得这个问题和卡特兰数有相似之处,希望 GPT-4 帮他查找一下对应的资料。

GPT-4 很快给出了对应的回答,这也促使陶哲轩对另一个问题产生了新的灵感。

简单来说,陶哲轩在短短两段与 GPT-4 的对话中,展示了数学家使用 GPT-4 的正确姿势 —— 找灵感和查资料。

这样一来,即使“数学菜鸡”如 GPT-4,也能成为数学家的 AI 助理了。

大佬是怎么玩儿 GPT 的

分享人类大师和 AI 的聊天记录之余,陶哲轩的乳齿象博文里还附带着一份贴心指南,是他使用 ChatGPT 和 GPT-4 的经验之谈。

根据他过去的实操经验,最要紧的第一点:

不要试图让 AI 直接回答问题,因为这几乎肯定会得到一些看起来专业的废话。

为了避免 GPT 成为废话文学大王,行之有效的方案如下:

让 AI 扮演合作者的角色,而后让它提供策略建议。

Like this:

除此之外,“数学菜鸡”GPT,在大数学家手里能有什么用处?

陶哲轩大概的意思是酱婶儿的:

ChatGPT 数学能力虽然不咋滴,但对做学术研究的人来说是个发散思维的好工具。

怎么解释用来“发散思维”这句话呢?

陶哲轩表达出来的观点是,既然 ChatGPT 在具体数学问题上给出的答案是不完全正确的,那不如索性发挥发挥它生成答案部分正确的特性。

简而言之,就是让它帮你找灵感 balabalabla:

在处理数学问题时,可以让 ChatGPT 这类大语言模型做一些半成品的语义搜索工作。

也就是说,ChatGPT 不用提供确切的答案,只用生成一些可能的提示。

这样一来,依据 GPT 生成的提示 + 传统搜索引擎搜索,就能很轻松 get 答案。

而且他还自曝,在 GPT-4 发布之前,他本人就从微软那里获得了访问资格。

也就是和微软 154 页《AGI 的火花》论文里同款,未经过安全训练但能力更强的满血版。

与此同时,对于 AI 在数学研究中的表现,陶哲轩给出的大胆却又严谨的预言:

当与形式证明验证器、互联网搜索和数学符号包等工具整合时,2026 年的 AI,如果使用得当,将成为数学研究中值得信赖的共同作者,而且在许多其他领域也是如此。

除了数学研究,GPT-4 已经是陶哲轩生活中的全方位小助手了。

他经常使用 GPT-4 回答一些随意、措辞含糊的问题,这些问题以前需要在搜索引擎里精心调整关键词才行。

还有位同事,因为亲戚拿到重症诊断而郁郁寡欢。为此,陶哲轩让大手一挥,让 GPT-4 洋洋洒洒写了封慰问信。

结果呢?同事眼含热泪,被感动哭了。

最后说回陶哲轩用 GPT-4 解决数学难题这事儿上来。

在 MathOverflow 下,有的网友觉得他不应该用 GPT 来回答数学问题,感觉是个很敏感的话题。

但还是有人表示了资瓷,表示觉得真的是泰库辣~

陶哲轩倒是毫不避讳地站出来表明了自己的立场,他倒不觉得有啥不好:

现在的担忧,跟维基百科流行初期时大家讨论的重点也没啥区别……

现在在维基百科上 get 初始线索,并且在引为论点时附上链接,展现它是我论据的一部分,都是大伙儿习以为常的事情。

并且陶哲轩看法还挺坚定,那就是“相信大家以后也会觉得用 GPT 来支持研究,没啥不妥当的呢”~

加入陶哲轩和 GPT-4 的对话:

参考链接:

声明:以上内容为本网站转自其它媒体,相关信息仅为传递更多企业信息之目的,不代表本网观点,亦不代表本网站赞同其观点或证实其内容的真实性。投资有风险,需谨慎。

猜您喜欢
推荐阅读
电子行业年报综述:行业虽面临压力整体仍保持相对稳健增长
电子行业年报综述:行业虽面临压力整体仍保持相

电子年度报告摘要2021年,电子行业尽管受到全球疫情和行业周期的干扰,但仍保持稳定增长态势。2021年,申万电子行业整体...更多

2022-05-16 13:21:00
潮安登塘举办乡村振兴电商特训班,培养农特产品带货能手
潮安登塘举办乡村振兴电商特训班,培养农特产品

“我以前是刷短视频的。不知道别人的视频怎么拍的这么好?通过老师的讲解,我终于领悟了,受益匪浅!”5月14日至15日,潮州...更多

2022-05-16 13:18:00
2022前四月住宅新开工面积同比下降28.4%
2022前四月住宅新开工面积同比下降28.4

北京商报今日讯——5月16日,国家统计局发布2022年1-4月全国房地产开发投资数据。1-4月份,房地产开发企业房屋施工...更多

2022-05-16 12:51:00
西北地区绿色电力交易实践与思考
西北地区绿色电力交易实践与思考

绿色电力交易是指以绿色电力产品为标的物的中长期电力交易,是中长期电力市场体系中全新的交易品种。绿色电力交易的目的是将新能...更多

2022-05-16 12:39:00
华为鲁勇:打造数字经济新动能让更多的人从数字技术中受益
华为鲁勇:打造数字经济新动能让更多的人从数字

在2022年世界电信和信息社会日到来之际,我谨代表华为向广大客户、产业链合作伙伴和各界朋友致以诚挚的问候,期待与您携手共...更多

2022-05-16 11:46:00
GSMA:中国大陆5G渗透率36.82%位居全球第二
GSMA:中国大陆5G渗透率36.82%位居

近日,GSMA发布了最新的统计信息。截至2022年第一季度,在全球5G渗透率排名中,南韩以44.92%位居第一,其次是中...更多

2022-05-16 11:22:00
看了这款潮野SUV哈弗大狗,我直接退掉了CRV的订单
看了这款潮野SUV哈弗大狗,我直接退掉了CR

费用在心里。随着国家自主品牌趋势的觉醒,对应这个细分市场的产品也越来越丰富。我们不再需要在少数合资品牌中挑三拣四,可以进...更多

2022-05-16 11:20:00
统计局:前4月全国固定资产投资153544亿元同比增长6.8%
统计局:前4月全国固定资产投资153544亿

据国家统计局网站消息,1-4月,全国固定资产投资153544亿元,同比增长6.8%。其中,民间固定资产投资86872亿元...更多

2022-05-16 11:20:00
+ 点击查看更多精彩
1521
    最近更新
上市公司高质量发展势头强劲
    近日,中国上市公司协会根据4805家上市公司...
主板、创业板、科创板排名前100公司去年实现净利润3.91万亿高质量发展
    内生增长动力不断提升。从营业总收入来看,主板...
读者期待“红五月”行情
    本周a股走出了相对外围市场的独立行情,大众证...
锂电铜箔行业扩产潮起!诺德股份投建10万吨超薄项目产能激增330%明年或
    不考虑下游需求,锂电池上游材料的扩张节奏从未...
2022款上汽大通MAXUST70澳洲版焕新上市售价12.78万元起
    5月13日,2022款MAXUST70澳版S...