refactor(thinking): remove legacy utilities and simplify model mapping

2026-01-14 19:11:04 +08:00
parent 33d66959e9
commit 2262479365
9 changed files with 43 additions and 865 deletions
@@ -8,12 +8,6 @@ import (
 	"github.com/tidwall/sjson"
 )

-const (
-	GeminiThinkingBudgetMetadataKey  = "gemini_thinking_budget"
-	GeminiIncludeThoughtsMetadataKey = "gemini_include_thoughts"
-	GeminiOriginalModelMetadataKey   = "gemini_original_model"
-)
-
 // Gemini model family detection patterns
 var (
 	gemini3Pattern      = regexp.MustCompile(`(?i)^gemini[_-]?3[_-]`)
@@ -297,104 +291,6 @@ func ApplyDefaultThinkingIfNeeded(model string, body []byte) []byte {
 	return updated
 }

-// ApplyGemini3ThinkingLevelFromMetadata applies thinkingLevel from metadata for Gemini 3 models.
-// For standard Gemini API format (generationConfig.thinkingConfig path).
-// This handles the case where reasoning_effort is specified via model name suffix (e.g., model(minimal))
-// or numeric budget suffix (e.g., model(1000)) which gets converted to a thinkingLevel.
-func ApplyGemini3ThinkingLevelFromMetadata(model string, metadata map[string]any, body []byte) []byte {
-	// Use the alias from metadata if available for model type detection
-	lookupModel := ResolveOriginalModel(model, metadata)
-	if !IsGemini3Model(lookupModel) && !IsGemini3Model(model) {
-		return body
-	}
-
-	// Determine which model to use for validation
-	checkModel := model
-	if IsGemini3Model(lookupModel) {
-		checkModel = lookupModel
-	}
-
-	// First try to get effort string from metadata
-	effort, ok := ReasoningEffortFromMetadata(metadata)
-	if ok && effort != "" {
-		if level, valid := ValidateGemini3ThinkingLevel(checkModel, effort); valid {
-			return ApplyGeminiThinkingLevel(body, level, nil)
-		}
-	}
-
-	// Fallback: check for numeric budget and convert to thinkingLevel
-	budget, _, _, matched := ThinkingFromMetadata(metadata)
-	if matched && budget != nil {
-		if level, valid := ThinkingBudgetToGemini3Level(checkModel, *budget); valid {
-			return ApplyGeminiThinkingLevel(body, level, nil)
-		}
-	}
-
-	return body
-}
-
-// ApplyGemini3ThinkingLevelFromMetadataCLI applies thinkingLevel from metadata for Gemini 3 models.
-// For Gemini CLI API format (request.generationConfig.thinkingConfig path).
-// This handles the case where reasoning_effort is specified via model name suffix (e.g., model(minimal))
-// or numeric budget suffix (e.g., model(1000)) which gets converted to a thinkingLevel.
-func ApplyGemini3ThinkingLevelFromMetadataCLI(model string, metadata map[string]any, body []byte) []byte {
-	// Use the alias from metadata if available for model type detection
-	lookupModel := ResolveOriginalModel(model, metadata)
-	if !IsGemini3Model(lookupModel) && !IsGemini3Model(model) {
-		return body
-	}
-
-	// Determine which model to use for validation
-	checkModel := model
-	if IsGemini3Model(lookupModel) {
-		checkModel = lookupModel
-	}
-
-	// First try to get effort string from metadata
-	effort, ok := ReasoningEffortFromMetadata(metadata)
-	if ok && effort != "" {
-		if level, valid := ValidateGemini3ThinkingLevel(checkModel, effort); valid {
-			return ApplyGeminiCLIThinkingLevel(body, level, nil)
-		}
-	}
-
-	// Fallback: check for numeric budget and convert to thinkingLevel
-	budget, _, _, matched := ThinkingFromMetadata(metadata)
-	if matched && budget != nil {
-		if level, valid := ThinkingBudgetToGemini3Level(checkModel, *budget); valid {
-			return ApplyGeminiCLIThinkingLevel(body, level, nil)
-		}
-	}
-
-	return body
-}
-
-// ApplyDefaultThinkingIfNeededCLI injects default thinkingConfig for models that require it.
-// For Gemini CLI API format (request.generationConfig.thinkingConfig path).
-// Returns the modified body if thinkingConfig was added, otherwise returns the original.
-// For Gemini 3 models, uses thinkingLevel instead of thinkingBudget per Google's documentation.
-func ApplyDefaultThinkingIfNeededCLI(model string, metadata map[string]any, body []byte) []byte {
-	// Use the alias from metadata if available for model property lookup
-	lookupModel := ResolveOriginalModel(model, metadata)
-	if !ModelHasDefaultThinking(lookupModel) && !ModelHasDefaultThinking(model) {
-		return body
-	}
-	if gjson.GetBytes(body, "request.generationConfig.thinkingConfig").Exists() {
-		return body
-	}
-	// Gemini 3 models use thinkingLevel instead of thinkingBudget
-	if IsGemini3Model(lookupModel) || IsGemini3Model(model) {
-		// Don't set a default - let the API use its dynamic default ("high")
-		// Only set includeThoughts
-		updated, _ := sjson.SetBytes(body, "request.generationConfig.thinkingConfig.includeThoughts", true)
-		return updated
-	}
-	// Gemini 2.5 and other models use thinkingBudget
-	updated, _ := sjson.SetBytes(body, "request.generationConfig.thinkingConfig.thinkingBudget", -1)
-	updated, _ = sjson.SetBytes(updated, "request.generationConfig.thinkingConfig.include_thoughts", true)
-	return updated
-}
-
 // StripThinkingConfigIfUnsupported removes thinkingConfig from the request body
 // when the target model does not advertise Thinking capability. It cleans both
 // standard Gemini and Gemini CLI JSON envelopes. This acts as a final safety net