March 22, 2025
此次官方发布的 实现,包含完整的多智能体任务规划、思考与执行流程,可以让开发者体验 Java 版本的多智能体效果。它能够根据用户的问题进行分析,操作浏览器,执行代码等来完成复杂任务等。 项目源码及体验地址: 效果展示 话不多说,先看运行效果,以下是我们通过几个实际问答记录展示的 Spring AI Alibaba OpenManus 实际使用效果。 1. 打开百度浏览器,在搜索框输入:阿里巴巴最最近一周股价,根据搜索到的信息绘制最近一周的股价趋势图并保存到本地目录。 2. 我计划在接下来的五一劳动节假期到韩国旅行,行程是从杭州出发到韩国首尔,总预算为10000元。我想体验韩...
March 21, 2025
使用 Spring AI Alibaba 构建大模型联网搜索应用 Spring AI 实现了模块化 RAG 架构,架构的灵感来自于论文“”中详述的模块化概念。 本文介绍如何使用 Spring AI Alibaba 构建大模型联网搜索应用结合模块化 RAG(Module RAG)和信息检索服务(IQS)赋能大模型。 Spring AI 模块化 RAG 体系 总体上分为以下几个步骤: PreRetrieval 增强和转换用户输入,使其更有效地执行检索任务,解决格式不正确的查询、query 语义不清晰、或不受支持的语言等。 1. QueryAugmenter 查询增强...
March 20, 2025
Java 也能快速搭建 AI 应用?一文带你玩转 Spring AI 可观测性 概述 随着 LLM(大语言模型)基础技术的不断成熟和应用领域的广泛挖掘,越来越多的企业和开发者开始将 LLM 技术集成到自己的互联网服务架构中,市场上涌现出了一大批基于 LLM 技术搭建的爆款应用。Python 语言受益于其丰富的框架和社区生态,成为了众多开发者搭建这些 AI 应用时的第一选择。但随着 AI 应用架构日益成熟,吞吐量、访问性能、可扩展性、微服务生态等重要指标也成为众多开发者和运维人员关注的焦点。恰好,经历了互联网时代考验的 Java 语言在这些方面已经有了很成熟的解决方案和生态。那么,使用...
March 19, 2025
RAG 应用架构概述 核心组件 + Spring AI:Spring 生态的 Java AI 开发框架,提供统一 API 接入大模型、向量数据库等 AI 基础设施。 + Ollama:本地大模型运行引擎(类似于 Docker),支持快速部署开源模型。 + Spring AI Alibaba:对 Spring AI 的增强,集成 DashScope 模型平台。 + Elasticsearch:向量数据库,存储文本向量化数据,支撑语义检索。 模型选型 1. Embedding 模型:nomicembedtext:latest,用于将文本数据向量化。 2. Ollama Chat 模...
March 16, 2025
Spring AI Alibaba RAG Example 示例项目源码地址:https://github.com/springaialibaba/springaialibabaexamples/tree/main/springaialibabaragexample RAG 应用架构概述 1.1 核心组件 Spring AI:Spring 生态的 Java AI 开发框架,提供统一 API 接入大模型、向量数据库等 AI 基础设施。 Ollama:本地大模型运行引擎,大模型时代的 Docker,支持快速体验部署大模型。 Spring AI Alibaba:Spring AI ...
February 12, 2025
在 AI 智能体(AI Agent)开发的过程中,RAG(RetrievalAugmented Generation) 和 Tool Calling 已经成为两种至关重要的模式。RAG 通过结合检索技术和生成模型的强大能力,使智能体能够实时从外部数据源获取信息,并在生成过程中增强其知识深度和推理能力。通过这种方式,智能体不仅能依赖于模型的预训练知识,还能动态访问和处理更加广泛、详细的外部数据,从而显著提升其在复杂任务中的表现。 与此同时,Tool Calling 模式为智能体提供了调用外部工具的能力,极大地扩展了其应用范围。智能体可以通过调用外部工具(如天气预报、地图导航、社交媒体平台等)...
February 8, 2025
今年的春节注定不寻常,开源大模型领域的“国货之光”们接连发布新版本,多项指标对标 OpenAI 的正式版(收费服务)。 + 1月20日,DeepSeek R1 发布,在数学、代码、自然语言推理等任务上,性能比肩 OpenAI o1 正式版。[1] + 1月27日,Qwen2.51M:支持 100万 Token 上下文,其中 14B 的杯型在短文本任务上实现了和 GPT4omini 相近的性能,同时上下文长度是 GPT4omini 的八倍;长上下文任务在多个数据集上稳定超越 GPT4omini。[2] + 1月27日,DeepSeek JanusPro 发布,多模态理解和生成模型,其中 7B...
December 28, 2024
MCP 简介 是一个开放协议,它规范了应用程序如何向大型语言模型(LLM)提供上下文。MCP 提供了一种统一的方式将 AI 模型连接到不同的数据源和工具,它定义了统一的集成方式。在开发智能体(Agent)的过程中,我们经常需要将将智能体与数据和工具集成,MCP 以标准的方式规范了智能体与数据及工具的集成方式,可以帮助您在LLM之上构建智能体(Agent)和复杂的工作流。目前已经有大量的服务接入并提供了 MCP server 实现,当前这个生态正在以非常快的速度不断的丰富中,具体可参见:。 Spring AI MCP Spring AI MCP 为模型上下文协议提供 Java 和 Spr...
December 9, 2024
本文作者:刘军,Spring AI Alibaba 发起人,Apache Member。 编者按:6年前,2018年10月,阿里巴巴开源 Spring Cloud Alibaba,旨在帮助 Java 开发者通过 Spring Cloud 编程模型轻松开发微服务应用。6年后,大模型和 AI 正在深刻改变我们工作和生活的方方面面,不再是移动屏幕端,而是整个物理世界。恰逢其时,阿里云开源 Spring AI Alibaba,旨在帮助 Java 开发者快速构建 AI 应用,共同构建物理新世界,欢迎您加入社区,一起参与这件激动人心的事情。 近期,阿里云重磅发布了首款面向 Java 开发者的...