Agent 驱动的市场数据解读管线 · feed → LLM → 信号 → 交易系统
本页目录
- TL;DR
- Wiki route
- 四阶段管线 · 逐阶段
- 阶段 1 · 摄取(Ingest)
- 阶段 2 · 解读 · LLM 摄入
- 阶段 3 · 路由 · 信号 → 交易系统
- 阶段 4 · 执行 · 确定性算法 + 交易前控制
- 现实部署 · 2026-05 公开披露
- Goldman Marquee + Marquee AI
- JPMorgan IndexGPT / SpectrumGPT
- BlackRock Aladdin Copilot
- Morgan Stanley AI @ Morgan Stanley
- Bloomberg Terminal AI · BloombergGPT 产品化
- Renaissance / Two Sigma / Citadel 内部 AI 研究
- 日本特有 · 瑞穗 / 三井住友 / 三菱日联内部 LLM
- 幻觉控制 · 五层防御
- 审计链要求 · 合规组合
- 延迟层级 · LLM 能 / 不能做什么
- 与 agent 经济堆栈的组合
- Sources
- Related
TL;DR
2026 的 Agent 驱动市场数据管线是一个 四阶段复合体:(1) 摄取(ingest) 来自 Bloomberg、Reuters / Refinitiv、日经、交易所直连行情、监管发布、公司申报的原始市场数据;(2) 通过 LLM(BloombergGPT、JPM 内部 LLM、经授权部署的 Anthropic Claude 或 OpenAI GPT)解读(interpret),生成结构化特征(情绪、事件抽取、摘要、情景);(3) 将结构化特征作为 信号 路由(route) 进下游交易 / 风险 / 投资组合系统;(4) 通过受交易前控制约束的确定性算法 执行(execute)。现实部署包括 Goldman Marquee + Marquee AI、JPMorgan IndexGPT / SpectrumGPT、BlackRock Aladdin Copilot、面向 FA 端使用的 Morgan Stanley AI @ MS,以及经 Bloomberg Terminal AI 产品化的 BloombergGPT。主导运营设计的两种故障模式是 幻觉(LLM 生成源文档中并未出现的「事实」)和 陈旧状态解读(LLM 基于训练数据而非当前行情作答)。缓解措施是分层的:针对实际行情的检索增强生成(RAG)、结构化输出约束、要求引用的输出、模型卡 + 版本标记、用于合规审计的 prompt + 输出日志。审计链要求可追溯至 SR 11-7 (美联储模型风险管理)、MIFID-II RTS 6 (欧盟算法治理)、FSA AI 原则(日本) 和 FCA AI in financial services 指引 — 这些都要求部署方能在事后监管审查中复现任何 AI 驱动的决策。
Wiki route
This entry sits under agent-economy index. Read it against LLM agent finance application overview for the broader application landscape, AI-driven trading regulation Japan 2026 for the regulator overlay that constrains how this pipeline is governed, agent custody and authorization framework for the spend / authorization granularity on the execution side, agent identity DeFi and TradFi bridge for the identity attestation of pipeline outputs, and agent payment protocol four-way comparison for the settlement layer. For market-data infrastructure context see Japan market maker and liquidity provider landscape and CEX API SDK ecosystem comparison.
四阶段管线 · 逐阶段
阶段 1 · 摄取(Ingest)
来源(2026-05 生产模式):
- Bloomberg Terminal feed + B-PIPE(Bloomberg Professional Information Pipeline)— 大多数 G-SIB 以约 $25K/年/席位授权该 feed,外加用于程序化访问的 B-PIPE。该 feed 包含新闻、价格、基本面、监管披露、公司行动通知。
- Reuters Eikon / Refinitiv Workspace(LSE 收购后现称 LSEG Workspace)— 与 Bloomberg 同级,西方新闻 + 宏观 feed 更强
- 日经 feed(Nikkei QUICK)— 日本特有的公司披露 + JGB / 股票 / 外汇新闻
- 交易所直连 feed — TSE、OSE、NYSE、NASDAQ、CME、LSE 经 ITCH / OUCH 协议的直连二进制 feed;对延迟敏感的 HFT 路径
- 监管发布 — EDGAR (SEC)、TDnet (JPX)、Companies House(英国)、AMF(法国)、MAS / BaFin / ASIC 发布;通常通过抓取或授权再分发方获取
- 公司 IR 发布 — 公司新闻稿通讯社(BusinessWire、PR Newswire,日本的 KYODO、JIJI);因文本丰富而对 LLM 友好
- 另类数据 — 卫星(Planet Labs)、信用卡支出(Yodlee、Plaid)、网页抓取(合规的)、ESG(MSCI、Sustainalytics)
为何摄取并不简单:每个来源都有自己的授权、延迟、schema 和访问模式。生产管线必须先将它们全部归一化为单一的结构化事件流,然后才能喂给 LLM。2025-2026 参考架构在总线层使用 Kafka / Kinesis / Pub/Sub,并按来源类型采用 Avro / Protobuf schema。
阶段 2 · 解读 · LLM 摄入
LLM 选项(2026-05):
| LLM | 来历 | 是否金融调优? | 使用方(公开) |
|---|---|---|---|
| BloombergGPT | Bloomberg 自研,50B 参数,在 40+ 年 Bloomberg 金融语料上训练 | 是(纯金融训练) | Bloomberg Terminal AI 界面(2024-2025产品化);不对外授权 |
| Anthropic Claude (Opus / Sonnet) | Anthropic 前沿模型 | 否(通用),但可微调 | BBVA、瑞穗、Goldman 开发工具;临时的对冲基金研究 |
| OpenAI GPT-4o / GPT-5 | OpenAI 前沿模型 | 否(通用),但可微调 | Morgan Stanley AI 助手、JPM SpectrumGPT(变体)、BofA 试点 |
| JPM 内部 LLM | JPMorgan 自研,在内部语料上训练 | 是 | JPM IndexGPT、SpectrumGPT |
| Google Gemini Pro / Ultra | Google 前沿模型 | 否,但有 Vertex AI 调优 | 已披露的花旗试点 |
| Cohere Command R+ | Cohere 通用模型 | 专为 RAG / 搜索特化 | 与 BlackRock Aladdin Copilot 相邻 |
| NEC cotomi / NTT tsuzumi / PFN PLaMo | 日本本土模型 | 有一定金融特化 | 瑞穗 / 三菱日联 / 三井住友内部试点 |
为何金融调优与通用的区别重要:在网页数据上训练的通用 LLM,在解析 10-Q / 有価証券報告書 / IFRS 财务报表方面,弱于在数百万份此类文档上微调过的模型。BloombergGPT 的 2023 发表(arxiv.org/abs/2303.17564)证明了在相同参数量下,相对通用 LLM 在金融特定基准上有实质性的超越表现。权衡:BloombergGPT 不对外授权;想要等同能力的机构,要么授权 Bloomberg 产品化的 Terminal AI 界面,要么在自己的金融语料上微调通用模型。
解读操作(该阶段要求 LLM 做什么):
- 事件抽取 — 「从这条新闻流中抽取并购公告」
- 情绪打分 — 「这份财报电话会议记录的情绪,按 -1 到 +1 的标度」
- 摘要 — 「总结这份 10-K 相对上期的关键变化」
- 问答检索 — 针对一个语料库,「CFO 关于外汇对冲说了什么?」
- 情景生成 — 「给定这份央行声明,生成三种合理的市场反应」
- 结构化数据抽取 — 「从这份财报新闻稿中抽取净利润、营收、EPS」
阶段 3 · 路由 · 信号 → 交易系统
LLM 的输出是一个 结构化信号,而非交易订单。该信号将 LLM 的解读作为带类型的特征承载,并喂入:
- 酌情型 PM / 交易员 — 信号以带置信度 + 引用的推荐形式,呈现在 Bloomberg Terminal / 内部投资组合屏幕上
- 系统化策略 — 信号成为多因子模型中的一个特征(例如「news_sentiment_score」与传统动量 / 价值因子结合)
- 风险管理 — 信号标记出改变投资组合尾部风险估计的情景
- 订单路由 — 对执行算法而言,信号影响采用哪种子订单战术(例如情绪波动加剧 → 更保守的 TWAP)
关键设计选择:LLM 并不直接发出交易订单。它发出 结构化特征,由下游系统在各自的风险控制下消费。正是这一边界,使该管线保持在 MIFID-II 第 17 条 + RTS 6 + FIEA 第 38-2 条 + Reg SCI 合规范围之内。
阶段 4 · 执行 · 确定性算法 + 交易前控制
执行层 与非 AI 算法交易并无不同。交易前风险控制(价格护栏、规模上限、重复订单速率、账户级敞口)、kill-switch、交易后监控 — 全部完全照常适用。AI 信号作为执行算法众多输入之一流入;算法的决策逻辑是确定性且可审计的。
这是该生产架构的 关键安全属性:AI 处于 创意生成端;确定性系统处于 执行端。审查一笔交易的监管机构可经由执行算法的确定性日志回溯订单,并单独审查 AI 的信号生成日志。
现实部署 · 2026-05 公开披露
Goldman Marquee + Marquee AI
Goldman 的机构客户门户 Marquee 已集成 LLM 驱动的分析,叠加于 Goldman 专有的市场数据 + 研究语料之上。Marquee AI 为 PM 提供用于研究检索、情景模拟和交易创意生成的对话式界面。公开披露强调面向 PM 的使用,而非直接执行;由此产生的交易仍要经过 Goldman 带完整风险控制的执行算法。
JPMorgan IndexGPT / SpectrumGPT
IndexGPT(2024-2025上线):LLM 驱动的主题篮子构建。用户以自然语言指定一个主题(「与大盘科技股低相关的 AI 基础设施敞口」);IndexGPT 基于 JPM 的内部 LLM + 结构化特征引擎提议成分权重。输出是一份 篮子推荐;用户决定是否交易它。
SpectrumGPT(合规 / 研究端):用于合规文档审查、研究呈现和交易理由记录的 LLM。面向内部;不面向客户。
BlackRock Aladdin Copilot
Aladdin 是 BlackRock 的投资组合风险与分析平台,既供内部使用,也授权用于机构客户约 $21T 的资产。Aladdin Copilot 在其上叠加 Cohere 驱动的对话式 AI,为 PM 提供对投资组合状态、风险分析和假设情景的自然语言访问。面向 PM;不直接发出交易。
Morgan Stanley AI @ Morgan Stanley
OpenAI 驱动、面向 FA 的助手,用于从 MS 的 100K+ 文档语料中检索研究、起草客户沟通和回答流程性问题。任何沟通发送至客户前均由 FA 审查并批准。它本身并非市场数据解读管线,但就交易笔数(每日 FA 查询数)而言,是公开披露的最大 LLM-in-finance 部署。
Bloomberg Terminal AI · BloombergGPT 产品化
BloombergGPT 于 2023以研究形式发表。到 2024-2025, ,Bloomberg 在 Terminal 中产品化了 LLM 驱动的界面:跨 feed 的自然语言搜索、长新闻文章摘要、针对财报记录的问答、情绪标记的新闻流。Terminal 用户将这些作为功能访问,而非直接调用 LLM。
Renaissance / Two Sigma / Citadel 内部 AI 研究
未详细公开披露。公开的招聘模式 + 论文发表表明,存在大量针对市场数据解读的内部 LLM 与 ML 研究。其对生产交易的影响按设计即不透明(产生 alpha 的机构不会披露)。
日本特有 · 瑞穗 / 三井住友 / 三菱日联内部 LLM
瑞穗 M-AI Insight、SMBC GAI、MUFG 内部 AI — 全部大规模部署用于合规、研究和客服支持的内部使用。公开披露强调内部使用;面向客户的金融决策仍受人类审查者把关。
幻觉控制 · 五层防御
LLM 必然会产生幻觉。在金融领域,单个幻觉数字就可能造成真实损失。2026 的生产防御层:
- 检索增强生成(RAG) — 将实际源文档(新闻文章、申报、记录)作为上下文提供给 LLM;输出以检索到的文本为条件。减少「凭记忆」的幻觉,但不能消除它。
- 结构化输出约束 — 要求 LLM 输出符合某 schema 的 JSON(例如
{"event_type": "M&A", "acquirer": str, "target": str, "value_usd": float, "citation": str})。格式约束减少自由文本捏造。 - 引用要求 — 要求 LLM 包含一个文段引用(
"citation": "Reuters article ID 12345, paragraph 3"),使下游系统能针对源验证该主张。若引用无法解析,该输出被拒绝。 - 置信度阈值 — 丢弃低于校准置信度的输出(使用 log-prob 或自一致性采样)。将不确定的情况路由至人工审查。
- 交叉验证 — 针对同一输入运行多个 LLM 并比较;分歧触发人工审查。
没有任何单层是足够的。生产系统组合其中 3-5 层。审计链记录 每一层的裁决 供监管机构审查。
审计链要求 · 合规组合
审计链必须在事后监管审查中复现 LLM 驱动的决策。2026 参考字段:
| 字段 | 原因 |
|---|---|
| 输入数据哈希 + 时间戳 | 复现导致该决策的输入 |
| 模型标识符 + 版本 + checkpoint | 复现产生该输出的确切模型 |
| 完整 prompt + system prompt | 复现该 LLM 调用 |
| 完整输出文本 | 展示 LLM 说了什么 |
| 结构化输出验证结果 | 展示输出是否符合 schema |
| 引用验证结果 | 展示主张是否可追溯至源 |
| 置信度分数 / log-prob | 展示校准后的确定性 |
| 下游消费系统 + 决策 | 展示对 LLM 输出做了什么 |
| 最终交易 / 信号 / 推荐 | 展示端到端可追溯性 |
| 人工审查事件(如有) | 展示是否触发了 HITL |
日志成本 并不微小:高吞吐管线每天可生成 TB 级的审计日志。2026 参考架构使用分级存储(热:Postgres / TimescaleDB 中 30 天;温:S3 / GCS 中 1 年;冷:Glacier / Archive Storage 中 7 年)以满足保留要求(SR 11-7:通常 5-7 年;MIFID-II RTS 6:5 年;FIEA:某些记录 10 年)。
这一组合是 agent legal and tax liability framework 中 部署方问责 原则与 AI-driven trading regulation Japan 2026 中监管框架的运营实现。
延迟层级 · LLM 能 / 不能做什么
| 延迟层级 | LLM 适用? | 用例 |
|---|---|---|
| HFT / 微秒级(二进制 feed → 订单) | 否(LLM 推理为 100ms-10s) | LLM 无法存在于这个环路中 |
| 盘中量化(数秒至数分钟) | 是(用于信号生成,非直接执行) | 情绪 / 事件抽取信号 |
| 日内交易 / 波段(数分钟至数小时) | 是 | 财报电话会议解读、新闻流分析 |
| 持仓 / 投资组合管理(数小时至数天) | 是 | 研究综合、情景模拟、投资组合再平衡推荐 |
| 策略研究 / 回测(离线) | 是(大量使用) | 生成假设、综述文献、起草策略文档 |
2026 的生产现实:LLM 集中于 研究 / 投资组合 / 信号生成层,由确定性系统处理 执行层。跨越边界(LLM 不经确定性算法直接发出订单)在技术上可行,但在监管和运营上被回避。
与 agent 经济堆栈的组合
该管线是 agent 经济的 上游信号生成端。其组合:
- 管线(本条目)— 从市场数据生成结构化信号
- 应用 — LLM agent finance application overview (c) 交易与执行类别消费信号
- 身份 / 认证 — agent identity DeFi / TradFi bridge 用于认证管线输出
- 托管 / 授权 — agent custody and authorization framework 用于执行端的支出 / scope
- 监管叠加 — AI-driven trading regulation Japan 2026
- 责任 — agent legal and tax liability framework
Sources
- BloombergGPT research paper (arxiv.org/abs/2303.17564)
- Bloomberg Terminal AI product announcements (bloomberg.com/professional/blog and /products/ai)
- Reuters / Refinitiv (now LSEG Workspace) product pages (reuters.com / refinitiv.com)
- Nikkei feed and IR releases (nikkei.com/info/en)
- Goldman Marquee + Marquee AI (goldmansachs.com/marquee)
- JPMorgan IndexGPT public press (jpmorgan.com/technology/news/indexgpt)
- Morgan Stanley AI @ MS press releases (morganstanley.com)
- BlackRock Aladdin (blackrock.com/aladdin)
- US Federal Reserve SR 11-7 model risk management (federalreserve.gov)
- BIS WP 1194 (bis.org)
- Japan FSA news (fsa.go.jp/en/news)
- UK FCA discussion papers on AI (fca.org.uk)
- ESMA documents (esma.europa.eu)
Related
- Wiki Index
- agent-economy index
- LLM agent finance application overview
- AI-driven trading regulation Japan 2026
- agent custody and authorization framework
- agent identity DeFi and TradFi bridge
- agent legal and tax liability framework
- agent payment protocol four-way comparison
- Claude Code extension architecture
- Japan market maker and liquidity provider landscape
- CEX API SDK ecosystem comparison
- derivatives INDEX
- fintech INDEX