此页面或文档已过期，请点击链接跳转到新页面。

对话模型(Chat Model)

此页面或文档已过期，请点击链接跳转到新页面。

对话模型（Chat Model）接收一系列消息（Message）作为输入，与模型 LLM 服务进行交互，并接收返回的聊天消息（Chat Message）作为输出。相比于普通的程序输入，模型的输入与输出消息（Message）不止支持纯字符文本，还支持包括语音、图片、视频等作为输入输出。同时，在 Spring AI Alibaba 中，消息中还支持包含不同的角色，帮助底层模型区分来自模型、用户和系统指令等的不同消息。

Spring AI Alibaba 复用了 Spring AI 抽象的 Model API，并与通义系列大模型服务进行适配（如通义千问、通义万相等），目前支持纯文本聊天、文生图、文生语音、语音转文本等。以下是框架定义的几个核心 API：

ChatModel，文本聊天交互模型，支持纯文本格式作为输入，并将模型的输出以格式化文本形式返回。
ImageModel，接收用户文本输入，并将模型生成的图片作为输出返回。
AudioModel，接收用户文本输入，并将模型合成的语音作为输出返回。

Spring AI Alibaba 支持以上 Model 抽象与通义系列模型的适配，并通过 spring-ai-alibaba-starter AutoConfiguration 自动初始化了默认实例，因此我们可以在应用程序中直接注入 ChatModel、ImageModel 等 bean，当然在需要的时候也可以自定义 Model 实例。

Chat Model

ChatModel API 让应用开发者可以非常方便的与 AI 模型进行文本交互，它抽象了应用与模型交互的过程，包括使用 Prompt 作为输入，使用 ChatResponse 作为输出等。ChatModel 的工作原理是接收 Prompt 或部分对话作为输入，将输入发送给后端大模型，模型根据其训练数据和对自然语言的理解生成对话响应，应用程序可以将响应呈现给用户或用于进一步处理。

chat-model

使用示例

开发完整的 ChatModel 示例应用，您需要添加 spring-ai-alibaba-starter 依赖，请参考快速开始中的项目配置说明了解详情，您还可以访问 chatmodel-example 查看本示例完整源码。

以下是 ChatModel 基本使用示例，它可以接收 String 字符串作为输入：

@RestController
public class ChatModelController {
  private final ChatModel chatModel;

  public ChatModelController(ChatModel chatModel) {
    this.chatModel = chatModel;
  }

  @GetMapping("/simple/chat")
  public String simpleChat() {
    return dashScopeChatModel.call("hi");
  }
}

使用 Prompt 作为输入：

@RequestMapping("/chat")
public String chat(String input) {
  ChatResponse response = chatModel.call(new Prompt(input));
  return response.getResult().getOutput().getContent();
}

Streaming 示例：

@GetMapping("/stream/chat")
public Flux<String> streamChat(HttpServletResponse response) {

  // 避免返回乱码
  response.setCharacterEncoding("UTF-8");

  Flux<ChatResponse> stream = dashScopeChatModel.stream(new Prompt(DEFAULT_PROMPT, DashScopeChatOptions
      .builder()
      .withModel(DashScopeApi.ChatModel.QWEN_PLUS.getModel())
      .build()));
  return stream.map(resp -> resp.getResult().getOutput().getText());
}

通过 ChatOptions 在每次调用中调整模型参数：

@GetMapping("/custom/chat")
public String customChat() {

  DashScopeChatOptions customOptions = DashScopeChatOptions.builder()
      .withTopP(0.7)
      .withTopK(50)
      .withTemperature(0.8)
      .build();

  return dashScopeChatModel.call(new Prompt(DEFAULT_PROMPT, customOptions)).getResult().getOutput().getText();
}

Image Model

ImageModel API 抽象了应用程序通过模型调用实现“文生图”的交互过程，即应用程序接收文本，调用模型生成图片。ImageModel 的入参为包装类型 ImagePrompt，输出类型为 ImageResponse。

使用示例

spring-ai-alibaba-starter AutoConfiguration 默认初始化了 ImageModel 实例，我们可以选择直接注入并使用默认实例。

@RestController
public class ImageModelController {
  private final ImageModel imageModel;

  ImageModelController(ImageModel imageModel) {
    this.imageModel = imageModel;
  }

  @RequestMapping("/image")
  public String image(String input) {
    ImageOptions options = ImageOptionsBuilder.builder()
        .withModel("dall-e-3")
        .build();

    ImagePrompt imagePrompt = new ImagePrompt(input, options);
    ImageResponse response = imageModel.call(imagePrompt);
    String imageUrl = response.getResult().getOutput().getUrl();

    return "redirect:" + imageUrl;
  }
}

通过 ImageOptions 在每次调用中调整模型参数：

@GetMapping("/image/multipleConditions")
public ResponseEntity<?> multipleConditions(
    @RequestParam(value = "subject", defaultValue = "一只会编程的猫") String subject,
    @RequestParam(value = "environment", defaultValue = "办公室") String environment,
    @RequestParam(value = "height", defaultValue = "1024") Integer height,
    @RequestParam(value = "width", defaultValue = "1024") Integer width,
    @RequestParam(value = "style", defaultValue = "生动") String style) {

  String prompt = String.format(
      "一个%s，置身于%s的环境中，使用%s的艺术风格，高清4K画质，细节精致",
      subject, environment, style
  );

  ImageOptions options = ImageOptionsBuilder.builder()
      .height(height)
      .width(width)
      .build();

  try {
    ImageResponse response = imageModel.call(new ImagePrompt(prompt, options));
    return ResponseEntity.ok(response.getResult().getOutput().getUrl());
  } catch (Exception e) {
    return ResponseEntity.status(HttpStatus.INTERNAL_SERVER_ERROR)
        .body(Map.of(
            "error", "图像生成失败",
            "message", e.getMessage(),
            "timestamp", LocalDateTime.now()
        ));
  }
}

Audio Model

当前，Spring AI Alibaba 支持以下两种通义语音模型的适配，分别是：

文本生成语音 SpeechModel，对应于 OpenAI 的 Text-To-Speech (TTS) API
录音文件生成文字 DashScopeAudioTranscriptionModel，对应于 OpenAI 的 Transcription API