feat: Add tool correlation, toolInput metadata, and unknown-type fallbacks to parser

- Extend ParsedMessage.meta with toolInput to expose raw tool arguments - Add toolUseRegistry to correlate tool_result blocks back to originating tool_use - Set toolInput on tool_call messages and populate meta.toolName/toolInput on tool_result - Fix tool_result with is_error:true now correctly produces type "error" - Add catch-all for unknown top-level event types (emits system message) - Add catch-all for unknown assistant content block types (emits system message) - Add unit tests covering all 8 scenarios including regression cases Co-Authored-By: Claude Sonnet 4.6 <noreply@anthropic.com>
2026-03-06 16:02:50 +01:00
parent 2bef0fa682
commit ee6b0da976
2 changed files with 291 additions and 2 deletions
--- a/apps/web/src/lib/parse-agent-output.test.ts
+++ b/apps/web/src/lib/parse-agent-output.test.ts
@@ -0,0 +1,264 @@
+import { parseAgentOutput } from "./parse-agent-output";
+
+function chunk(events: object[]): string {
+  return events.map((e) => JSON.stringify(e)).join("\n");
+}
+
+describe("parseAgentOutput", () => {
+  // 1. toolInput is set on tool_call messages
+  it("sets meta.toolInput on tool_call messages", () => {
+    const input = chunk([
+      {
+        type: "assistant",
+        message: {
+          content: [
+            {
+              type: "tool_use",
+              id: "tu1",
+              name: "Read",
+              input: { file_path: "/foo.ts" },
+            },
+          ],
+        },
+      },
+    ]);
+    const messages = parseAgentOutput(input);
+    const toolCall = messages.find((m) => m.type === "tool_call");
+    expect(toolCall).toBeDefined();
+    expect(toolCall!.meta?.toolInput).toEqual({ file_path: "/foo.ts" });
+  });
+
+  // 2. tool_result with tool_use_id gets meta.toolName and meta.toolInput from registry
+  it("correlates tool_result to its tool_use via registry", () => {
+    const input = chunk([
+      {
+        type: "assistant",
+        message: {
+          content: [
+            {
+              type: "tool_use",
+              id: "tu1",
+              name: "Read",
+              input: { file_path: "/foo.ts" },
+            },
+          ],
+        },
+      },
+      {
+        type: "user",
+        message: {
+          content: [
+            {
+              type: "tool_result",
+              tool_use_id: "tu1",
+              content: "file contents",
+            },
+          ],
+        },
+      },
+    ]);
+    const messages = parseAgentOutput(input);
+    const toolResult = messages.find((m) => m.type === "tool_result");
+    expect(toolResult).toBeDefined();
+    expect(toolResult!.meta?.toolName).toBe("Read");
+    expect(toolResult!.meta?.toolInput).toEqual({ file_path: "/foo.ts" });
+  });
+
+  // 3. tool_result with no matching registry entry has no meta.toolName
+  it("tool_result with unknown tool_use_id has no meta.toolName", () => {
+    const input = chunk([
+      {
+        type: "user",
+        message: {
+          content: [
+            {
+              type: "tool_result",
+              tool_use_id: "unknown-id",
+              content: "output",
+            },
+          ],
+        },
+      },
+    ]);
+    const messages = parseAgentOutput(input);
+    const toolResult = messages.find((m) => m.type === "tool_result");
+    expect(toolResult).toBeDefined();
+    expect(toolResult!.meta?.toolName).toBeUndefined();
+  });
+
+  // 4. tool_result with is_error: true produces type: "error" and meta.isError: true
+  it("tool_result with is_error: true produces error message", () => {
+    const input = chunk([
+      {
+        type: "user",
+        message: {
+          content: [
+            {
+              type: "tool_result",
+              tool_use_id: "tu1",
+              is_error: true,
+              content: "something went wrong",
+            },
+          ],
+        },
+      },
+    ]);
+    const messages = parseAgentOutput(input);
+    const errorMsg = messages.find((m) => m.content === "something went wrong");
+    expect(errorMsg).toBeDefined();
+    expect(errorMsg!.type).toBe("error");
+    expect(errorMsg!.meta?.isError).toBe(true);
+  });
+
+  // 5. tool_result from a Task tool_use gets correct meta.toolName and meta.toolInput
+  it("tool_result from Task tool_use has correct meta", () => {
+    const taskInput = {
+      subagent_type: "Explore",
+      description: "find files",
+      prompt: "search for *.ts",
+    };
+    const input = chunk([
+      {
+        type: "assistant",
+        message: {
+          content: [
+            {
+              type: "tool_use",
+              id: "tu2",
+              name: "Task",
+              input: taskInput,
+            },
+          ],
+        },
+      },
+      {
+        type: "user",
+        message: {
+          content: [
+            {
+              type: "tool_result",
+              tool_use_id: "tu2",
+              content: "found 10 files",
+            },
+          ],
+        },
+      },
+    ]);
+    const messages = parseAgentOutput(input);
+    const toolResult = messages.find((m) => m.type === "tool_result");
+    expect(toolResult).toBeDefined();
+    expect(toolResult!.meta?.toolName).toBe("Task");
+    expect(toolResult!.meta?.toolInput).toEqual(taskInput);
+  });
+
+  // 6. Unknown top-level event type produces a system message
+  it("unknown top-level event type produces system message", () => {
+    const input = chunk([{ type: "future_event_type", data: {} }]);
+    const messages = parseAgentOutput(input);
+    expect(messages).toHaveLength(1);
+    expect(messages[0].type).toBe("system");
+    expect(messages[0].content).toBe("[unknown event: future_event_type]");
+  });
+
+  // 7. Unknown assistant content block type produces a system message
+  it("unknown assistant content block type produces system message", () => {
+    const input = chunk([
+      {
+        type: "assistant",
+        message: {
+          content: [{ type: "image", data: "base64..." }],
+        },
+      },
+    ]);
+    const messages = parseAgentOutput(input);
+    expect(messages).toHaveLength(1);
+    expect(messages[0].type).toBe("system");
+    expect(messages[0].content).toBe("[unsupported content block: image]");
+  });
+
+  // 8. Previously passing behavior unchanged
+  describe("previously passing behavior", () => {
+    it("system event with session_id produces system message", () => {
+      const input = chunk([{ type: "system", session_id: "sess-123" }]);
+      const messages = parseAgentOutput(input);
+      expect(messages).toHaveLength(1);
+      expect(messages[0].type).toBe("system");
+      expect(messages[0].content).toBe("Session started: sess-123");
+    });
+
+    it("assistant text block produces text message", () => {
+      const input = chunk([
+        {
+          type: "assistant",
+          message: {
+            content: [{ type: "text", text: "Hello, world!" }],
+          },
+        },
+      ]);
+      const messages = parseAgentOutput(input);
+      expect(messages).toHaveLength(1);
+      expect(messages[0].type).toBe("text");
+      expect(messages[0].content).toBe("Hello, world!");
+    });
+
+    it("assistant tool_use block produces tool_call message with meta.toolName", () => {
+      const input = chunk([
+        {
+          type: "assistant",
+          message: {
+            content: [
+              {
+                type: "tool_use",
+                id: "tu1",
+                name: "Bash",
+                input: { command: "ls -la", description: "list files" },
+              },
+            ],
+          },
+        },
+      ]);
+      const messages = parseAgentOutput(input);
+      const toolCall = messages.find((m) => m.type === "tool_call");
+      expect(toolCall).toBeDefined();
+      expect(toolCall!.meta?.toolName).toBe("Bash");
+    });
+
+    it("result event with is_error: false produces session_end", () => {
+      const input = chunk([
+        {
+          type: "result",
+          is_error: false,
+          total_cost_usd: 0.01,
+          duration_ms: 5000,
+        },
+      ]);
+      const messages = parseAgentOutput(input);
+      expect(messages).toHaveLength(1);
+      expect(messages[0].type).toBe("session_end");
+      expect(messages[0].content).toBe("Session completed");
+    });
+
+    it("result event with is_error: true produces session_end with meta.isError", () => {
+      const input = chunk([
+        {
+          type: "result",
+          is_error: true,
+          total_cost_usd: 0.01,
+          duration_ms: 5000,
+        },
+      ]);
+      const messages = parseAgentOutput(input);
+      expect(messages).toHaveLength(1);
+      expect(messages[0].type).toBe("session_end");
+      expect(messages[0].meta?.isError).toBe(true);
+    });
+
+    it("non-JSON line produces error message with raw line as content", () => {
+      const rawLine = "This is not JSON at all";
+      const messages = parseAgentOutput(rawLine);
+      expect(messages).toHaveLength(1);
+      expect(messages[0].type).toBe("error");
+      expect(messages[0].content).toBe(rawLine);
+    });
+  });
+});
--- a/apps/web/src/lib/parse-agent-output.ts
+++ b/apps/web/src/lib/parse-agent-output.ts
@@ -10,6 +10,7 @@ export interface ParsedMessage {
  timestamp?: Date;
  meta?: {
    toolName?: string;
+    toolInput?: unknown;
    isError?: boolean;
    cost?: number;
    duration?: number;
@@ -80,6 +81,7 @@ export function parseAgentOutput(raw: string | TimestampedChunk[]): ParsedMessag
      : raw.map((c) => ({ content: c.content, timestamp: new Date(c.createdAt) }));

  const parsedMessages: ParsedMessage[] = [];
+  const toolUseRegistry = new Map<string, { name: string; input: unknown }>();

  for (const chunk of chunks) {
    const lines = chunk.content.split("\n").filter(Boolean);
@@ -113,7 +115,14 @@ export function parseAgentOutput(raw: string | TimestampedChunk[]): ParsedMessag
                type: "tool_call",
                content: formatToolCall(block),
                timestamp: chunk.timestamp,
-                meta: { toolName: block.name },
+                meta: { toolName: block.name, toolInput: block.input },
+              });
+              toolUseRegistry.set(block.id, { name: block.name, input: block.input });
+            } else {
+              parsedMessages.push({
+                type: "system",
+                content: `[unsupported content block: ${block.type}]`,
+                timestamp: chunk.timestamp,
              });
            }
          }
@@ -149,10 +158,20 @@ export function parseAgentOutput(raw: string | TimestampedChunk[]): ParsedMessag
                  output.length > 1000
                    ? output.substring(0, 1000) + "\n... (truncated)"
                    : output;
+                const isError = block.is_error === true;
+                const originatingCall = block.tool_use_id
+                  ? toolUseRegistry.get(block.tool_use_id)
+                  : undefined;
                parsedMessages.push({
-                  type: "tool_result",
+                  type: isError ? "error" : "tool_result",
                  content: displayOutput,
                  timestamp: chunk.timestamp,
+                  meta: {
+                    ...(isError ? { isError: true } : {}),
+                    ...(originatingCall
+                      ? { toolName: originatingCall.name, toolInput: originatingCall.input }
+                      : {}),
+                  },
                });
              }
            }
@@ -180,6 +199,12 @@ export function parseAgentOutput(raw: string | TimestampedChunk[]): ParsedMessag
              duration: event.duration_ms,
            },
          });
+        } else {
+          parsedMessages.push({
+            type: "system",
+            content: `[unknown event: ${event.type ?? "(no type)"}]`,
+            timestamp: chunk.timestamp,
+          });
        }
      } catch {
        // Not JSON, display as-is