前沿AI模型同场竞技炒股结果亏多赚少 金融业最难的工作还得靠真人

  人工智能(AI)还没有准备好取代你的基金经理,一系列公开测试说明了其中缘由。

前沿AI模型同场竞技炒股结果亏多赚少 金融业最难的工作还得靠真人-第1张图片

  在全球领先AI模型参与的一系列新的交易竞赛中 ,迄今为止AI的表现并不算好 。大多数系统蒙受了亏损。它们交易过于频繁,在收到完全相同指令时会作出截然不同的决策。而且目前仍无人知道,这些缺陷会否随着模型迭代升级而消失 ,还是揭示了大语言模型与市场实际运作方式之间存在的根本性鸿沟 。

  以科技初创公司Nof1运营的Alpha Arena为例。该平台让八个主要前沿AI系统同台较量,开展四场比赛,其中包括Anthropic的Claude、谷歌的Gemini 、OpenAI的ChatGPT以及埃隆·马斯克的Grok。每个系统在每场比赛开始前都获得1万美元资金 ,随后在两周内自主交易美国科技股 。挑战包括依据多种信号交易、采取防御性策略、对竞争对手表现作出反应,以及使用高杠杆操作。

  整体投资组合最终亏掉了约三分之一资金。在全部32组结果中,模型仅有6次实现盈利 。Grok 4.20在一项可获知竞争对手表现的挑战中取得最佳成绩。它只进行了158笔交易;在相同提示下 ,阿里巴巴的千问则交易了1418次。

  Alpha Arena只是越来越多相关实验中的一个 。这些实验都在测试,大语言模型能否胜任金融业最困难的工作:战胜市场 。尽管这些竞赛远谈不上具有学术严谨性,但它们迄今最公开地展示了 ,当这些系统尝试承担华尔街一些利润最丰厚 、风险最高的工作时 ,会发生什么。

  这些初步结果之所以重要,是因为交易正是金融业对于完全交给AI仍保持谨慎的少数工作之一。过去几年,从摩根大通到Balyasny Asset Management等行业巨头 ,几乎已将这项技术用于其他各个环节 。如今,大语言模型已在量化机构中用于解析新闻,在对冲基金中起草备忘录 ,在大型银行中识别欺诈等。但在真金白银的交易上,“人类参与”仍是行业信条,似乎也是情有可原。

  Nof1创始人Jay Azhang表示:“大语言模型本身其实无法真正赚钱 。你基本上需要一整套非常复杂的约束框架、支撑系统和数据平台 ,才有可能给它们一个发挥的机会。”

  他说,大语言模型擅长做研究,也擅长为某些任务寻找并调用合适工具。但它们目前仍不知道 ,影响股价波动的诸多变量 —— 包括分析师评级、内部交易和市场情绪变化等 —— 各自究竟有多重要 。它们往往把握不好交易时机,错误设定仓位规模,而且买卖过于频繁。

  AI博客Flat Circle追踪了11个与市场相关的竞技平台 ,所有平台都至少有一个模型实现盈利。但在这11个平台中 ,只有两个平台的模型中位数实现盈利,这表明大多数模型都难以战胜市场 。

  这一结果与人类的表现如出一辙,因为众所周知 ,多数主动管理型基金同样跑输大盘。而且就像人类一样,这些模型也容易出现明显偏颇。多场竞赛显示,AI系统在收到相同指令时会作出非常不同的决定 ,这对部署它们的机构具有重大影响 。Azhang举例说,在Alpha Arena最近一轮比赛中,Claude大多倾向做多 ,Gemini并不排斥做空,而千问则更愿意借助高杠杆承担风险 。

  运营Intelligent Alpha的Doug Clinton表示:“它们有自己的‘个性’,你必须像管理人类分析师那样去管理它们。 ”他说 ,如果让模型意识到自己表现出某种偏见,结果可以得到改善。Intelligent Alpha有一个由大语言模型驱动的基金,就AI预测企业盈利的表现发布其自身的基准 。

  Intelligent Alpha的基准为10个AI模型提供财务申报文件 、分析师预测、业绩电话会纪要、宏观经济数据以及最多10次网络搜索权限。由于聚焦范围更窄 ,大语言模型在这项测试中的表现更为积极。2025年第四季度 ,OpenAI的ChatGPT对盈利预期变动方向的判断准确率达到68%,创下迄今最佳成绩 。Clinton表示,这些模型通常会随着每次新版本发布而持续改进。

标签:

相关推荐

  • 天域半导体:中国证监会受理公司H股全流通计划的申请

    天域半导体:中国证监会受理公司H股全流通计划的申请

      天域半导体(02658)发布公告,中国证券监督管理委员会已受理公司代表公司若干股东向中国证监会提交的关于建议实施H股全流通的申请。根据相关申请文件,公司已申请将公司该等股东所持有每股面值为人民币1.0元的3.34亿股已发行未上市股份转换为每股面值人民币1.0元的H股,有关股份占公司于本公告日期已发行股本总额约84.999962%。于取得所有相关批准(包...

    2026/06/01
  • 【疫情工作补助,关于疫情工作人员补助方案】

    【疫情工作补助,关于疫情工作人员补助方案】

    官方公布:抗疫医务人员补助明细补助标准直接接触待排查病例或确诊病例相关人员:补助对象:直接接触待排查病例或确诊病例,从事诊断、治疗、护理、医院感染控制、病例标本采集和病原检测等工作相关人员。补助标准:每人每天300元。参加疫情防控的其他医务人员和防疫工作者:补助对象:参加疫情防控的其他医务人员和防疫工作者。补助标准:每人每天200元。补助对象范围核心一线人...

    2026/06/01
  • 伦敦外疫情(伦敦的疫情)

    伦敦外疫情(伦敦的疫情)

    伦敦再次封城,小留学生家长继续喊话:求祖国包机接孩子们回来,这能接...〖壹〗、伦敦出现超级病毒,现已决定全面封城,此次发布的禁令有些着空前未有的严格,中国在伦敦的小留学生们生活再次面临困难,于是家长们又向媒体喊话:希望祖国能帮他们回来……这是第二次!早在三四月份时,就有不少的小留学生家长痛哭流涕地向媒体喊话:15000多名英国小留学生被滞留,请求祖国包机...

    2026/06/01
  • 疫情吃面图片(疫情期间吃好吃的说说)

    疫情吃面图片(疫情期间吃好吃的说说)

    两包泡面暴露的人性,疫情结束婚姻也结束了〖壹〗、在疫情期间,上海的一对夫妻因两包泡面而引发的家庭矛盾,最终导致了婚姻的破裂。这一事件不仅反映了疫情期间物资短缺对家庭关系的考验,更深刻地揭示了人性中的自私与冷漠。事件背景上海疫情期间,一对夫妻和孩子被困在家中,面临物资短缺的困境。一天晚上,当妻子在辅导孩子作业时,丈夫询问晚餐吃什么,妻子提议吃面。〖贰〗、上...

    2026/06/01
  • 【红码疫情,红码疫情长啥样】

    【红码疫情,红码疫情长啥样】

    杭州绿码红码是什么〖壹〗、杭州绿码和红码是“杭州健康码”系统中用于标识个人健康风险状态的两种颜色代码,分别代表不同的健康状况和通行权限。绿码:含义:表示持有者健康状况正常,无疫情相关风险,可自由通行。使用场景:在杭州及周边地区,绿码是进入公共场所、乘坐公共交通、跨区域通行等场景的必备凭证。〖贰〗、“杭州健康码”是利用互联网大数据进行新冠病毒疫情防控的措施,...

    2026/06/01
  • 公安疫情吃劲/疫情期间公安工作措施

    公安疫情吃劲/疫情期间公安工作措施

    当前我国疫情防控工作正处于关键时期和吃劲阶段必须更加突出什么_百度...〖壹〗、当前我国疫情防控工作正处于关键时期和吃劲阶段必须更加突出对于疫情防控的管理。〖贰〗、疫情防控工作要求坚定必胜信念,警惕松懈心态:当前防控处于最吃劲的关键阶段,各级党委和政府需高度警惕麻痹思想、厌战情绪、佥幸心理、松劲心态,继续毫不放松抓紧抓实抓细防控工作,不获全胜决不轻言成功。...

    2026/06/01
  • 【疫情妈妈生日,疫情妈妈生日文案】

    【疫情妈妈生日,疫情妈妈生日文案】

    请教一下在疫情期间不要聚集怎么给老妈过八前十寿?自己家里的人,要给老妈煮上鸡蛋,煮上长寿面,一起祝贺老妈的80大寿,虽然不能召集更多的亲属和朋友,但是自己家人的心意一定要表达。80也是一个整寿,家里人要把生日晚餐办得既热闹,又节俭。让妈妈体会到生日的快乐,同时不影响更多的人。不敢出去买奶油,就这样吧,祝奶奶生日快乐,希望疫情赶紧过去,各位同行辛苦了。由于今...

    2026/06/01
  • 【钟南山谈疫情死亡率,疫情再传新噩耗,钟南山】

    【钟南山谈疫情死亡率,疫情再传新噩耗,钟南山】

    钟南山:中国当前不适用完全开放,开放要逐步进行〖壹〗、钟南山认为中国当前不适用完全开放,应坚持动态清零并逐步开放,具体内容如下:完全开放不适用原因:奥密克戎传播力强:当前流行的奥密克戎毒株症状轻,死亡率相对德尔塔病毒较低,但传播力强。〖贰〗、总结钟南山院士的观点是对中国疫情防控策略的全面总结与前瞻指引。其核心逻辑是:承认完全开放的现实风险,肯定动态清零的阶...

  • 疫情脱贫工作(疫情,脱贫)

    疫情脱贫工作(疫情,脱贫)

    乡镇党建办主任近三年工作总结〖壹〗、乡镇党建办主任近三年工作总结三年来,我历经多个岗位锻炼,主要从事了团委、党建、脱贫攻坚、疫情防控、乡村振兴等相关工作,虽身兼多职、任务繁重,但始终秉持实事求是的工作作风和脚踏实地的实干精神,扎实做好每一项工作。〖贰〗、乡镇党建办主任近三年工作总结工作方面近三年来,我历经多个岗位的锻炼,主要从事了团委、党建、脱贫攻坚、...

    2026/06/01
  • 武汉广疫情/武汉 疫情通报

    武汉广疫情/武汉 疫情通报

    武汉武广有疫情吗没有。通过查询相关资料了解到武汉武广开在2022年2月开始实现了低分险地区的要求,并截止到2022年9月5号没有新的确证病例出现。也没有新疫情,但是每天都是正常做核酸以防万一。没有。截止到2022年12月3日武汉汉口武广是没有疫情的,是属于常态化管控区域的,该地区中的环境优美,设施齐全,深受人们的喜爱。武广和武商是两个不同的商业实体,它们之...

    2026/06/01
返回顶部