feat(shared): add dynamic-truncator utility for context-aware output truncation

Extract and generalize dynamic output truncation logic from grep-output-truncator. Provides context window-aware truncation that adapts based on remaining tokens. Features: - truncateToTokenLimit(): Sync truncation with configurable header preservation - getContextWindowUsage(): Get current context window usage from session - dynamicTruncate(): Async truncation that queries context window state - createDynamicTruncator(): Factory for creating truncator instance 🤖 GENERATED WITH ASSISTANCE OF [OhMyOpenCode](https://github.com/code-yeongyu/oh-my-opencode)
2025-12-14 10:54:05 +09:00
parent d3e317663e
commit 521bcd5667
2 changed files with 165 additions and 0 deletions
--- a/src/shared/dynamic-truncator.ts
+++ b/src/shared/dynamic-truncator.ts
@@ -0,0 +1,164 @@
 import type { PluginInput } from "@opencode-ai/plugin"
 const ANTHROPIC_ACTUAL_LIMIT = 200_000
 const CHARS_PER_TOKEN_ESTIMATE = 4
 const DEFAULT_TARGET_MAX_TOKENS = 50_000
 interface AssistantMessageInfo {
  role: "assistant"
  tokens: {
    input: number
    output: number
    reasoning: number
    cache: { read: number; write: number }
  }
 }
 interface MessageWrapper {
  info: { role: string } & Partial<AssistantMessageInfo>
 }
 export interface TruncationResult {
  result: string
  truncated: boolean
  removedCount?: number
 }
 export interface TruncationOptions {
  targetMaxTokens?: number
  preserveHeaderLines?: number
  contextWindowLimit?: number
 }
 function estimateTokens(text: string): number {
  return Math.ceil(text.length / CHARS_PER_TOKEN_ESTIMATE)
 }
 export function truncateToTokenLimit(
  output: string,
  maxTokens: number,
  preserveHeaderLines = 3
 ): TruncationResult {
  const currentTokens = estimateTokens(output)
  if (currentTokens <= maxTokens) {
    return { result: output, truncated: false }
  }
  const lines = output.split("\n")
  if (lines.length <= preserveHeaderLines) {
    const maxChars = maxTokens * CHARS_PER_TOKEN_ESTIMATE
    return {
      result: output.slice(0, maxChars) + "\n\n[Output truncated due to context window limit]",
      truncated: true,
    }
  }
  const headerLines = lines.slice(0, preserveHeaderLines)
  const contentLines = lines.slice(preserveHeaderLines)
  const headerText = headerLines.join("\n")
  const headerTokens = estimateTokens(headerText)
  const truncationMessageTokens = 50
  const availableTokens = maxTokens - headerTokens - truncationMessageTokens
  if (availableTokens <= 0) {
    return {
      result: headerText + "\n\n[Content truncated due to context window limit]",
      truncated: true,
      removedCount: contentLines.length,
    }
  }
  const resultLines: string[] = []
  let currentTokenCount = 0
  for (const line of contentLines) {
    const lineTokens = estimateTokens(line + "\n")
    if (currentTokenCount + lineTokens > availableTokens) {
      break
    }
    resultLines.push(line)
    currentTokenCount += lineTokens
  }
  const truncatedContent = [...headerLines, ...resultLines].join("\n")
  const removedCount = contentLines.length - resultLines.length
  return {
    result: truncatedContent + `\n\n[${removedCount} more lines truncated due to context window limit]`,
    truncated: true,
    removedCount,
  }
 }
 export async function getContextWindowUsage(
  ctx: PluginInput,
  sessionID: string
 ): Promise<{ usedTokens: number; remainingTokens: number; usagePercentage: number } | null> {
  try {
    const response = await ctx.client.session.messages({
      path: { id: sessionID },
    })
    const messages = (response.data ?? response) as MessageWrapper[]
    const assistantMessages = messages
      .filter((m) => m.info.role === "assistant")
      .map((m) => m.info as AssistantMessageInfo)
    if (assistantMessages.length === 0) return null
    const lastAssistant = assistantMessages[assistantMessages.length - 1]
    const lastTokens = lastAssistant.tokens
    const usedTokens = (lastTokens?.input ?? 0) + (lastTokens?.cache?.read ?? 0)
    const remainingTokens = ANTHROPIC_ACTUAL_LIMIT - usedTokens
    return {
      usedTokens,
      remainingTokens,
      usagePercentage: usedTokens / ANTHROPIC_ACTUAL_LIMIT,
    }
  } catch {
    return null
  }
 }
 export async function dynamicTruncate(
  ctx: PluginInput,
  sessionID: string,
  output: string,
  options: TruncationOptions = {}
 ): Promise<TruncationResult> {
  const { targetMaxTokens = DEFAULT_TARGET_MAX_TOKENS, preserveHeaderLines = 3 } = options
  const usage = await getContextWindowUsage(ctx, sessionID)
  if (!usage) {
    return { result: output, truncated: false }
  }
  const maxOutputTokens = Math.min(usage.remainingTokens * 0.5, targetMaxTokens)
  if (maxOutputTokens <= 0) {
    return {
      result: "[Output suppressed - context window exhausted]",
      truncated: true,
    }
  }
  return truncateToTokenLimit(output, maxOutputTokens, preserveHeaderLines)
 }
 export function createDynamicTruncator(ctx: PluginInput) {
  return {
    truncate: (sessionID: string, output: string, options?: TruncationOptions) =>
      dynamicTruncate(ctx, sessionID, output, options),
    getUsage: (sessionID: string) => getContextWindowUsage(ctx, sessionID),
    truncateSync: (output: string, maxTokens: number, preserveHeaderLines?: number) =>
      truncateToTokenLimit(output, maxTokens, preserveHeaderLines),
  }
 }
--- a/src/shared/index.ts
+++ b/src/shared/index.ts
@@ -9,3 +9,4 @@ export * from "./pattern-matcher"
 export * from "./hook-disabled"
 export * from "./deep-merge"
 export * from "./file-utils"
 export * from "./dynamic-truncator"