(improvement)(headless) Upgrade to the latest version of langchain4j and add support for embedding deletion operation and reset. (#1660)

2025-12-12 04:27:39 +00:00 · 2024-09-12 18:16:16 +08:00
parent 693356e46a
commit 4b1dab8e4a
16 changed files with 13307 additions and 16497 deletions
--- a/common/src/main/java/dev/langchain4j/model/openai/OpenAiChatModel.java
+++ b/common/src/main/java/dev/langchain4j/model/openai/OpenAiChatModel.java
@@ -4,15 +4,23 @@ import dev.ai4j.openai4j.OpenAiClient;
 import dev.ai4j.openai4j.OpenAiHttpException;
 import dev.ai4j.openai4j.chat.ChatCompletionRequest;
 import dev.ai4j.openai4j.chat.ChatCompletionResponse;
+import dev.ai4j.openai4j.chat.ResponseFormat;
+import dev.ai4j.openai4j.chat.ResponseFormatType;
 import dev.langchain4j.agent.tool.ToolSpecification;
 import dev.langchain4j.data.message.AiMessage;
 import dev.langchain4j.data.message.ChatMessage;
 import dev.langchain4j.model.Tokenizer;
+import dev.langchain4j.model.chat.Capability;
 import dev.langchain4j.model.chat.ChatLanguageModel;
 import dev.langchain4j.model.chat.TokenCountEstimator;
-import dev.langchain4j.model.chat.listener.ChatLanguageModelRequest;
-import dev.langchain4j.model.chat.listener.ChatLanguageModelResponse;
-import dev.langchain4j.model.listener.ModelListener;
+import dev.langchain4j.model.chat.listener.ChatModelErrorContext;
+import dev.langchain4j.model.chat.listener.ChatModelListener;
+import dev.langchain4j.model.chat.listener.ChatModelRequest;
+import dev.langchain4j.model.chat.listener.ChatModelRequestContext;
+import dev.langchain4j.model.chat.listener.ChatModelResponse;
+import dev.langchain4j.model.chat.listener.ChatModelResponseContext;
+import dev.langchain4j.model.chat.request.ChatRequest;
+import dev.langchain4j.model.chat.response.ChatResponse;
 import dev.langchain4j.model.openai.spi.OpenAiChatModelBuilderFactory;
 import dev.langchain4j.model.output.Response;
 import lombok.Builder;
@@ -21,11 +29,17 @@ import lombok.extern.slf4j.Slf4j;
 import java.net.Proxy;
 import java.time.Duration;
 import java.util.ArrayList;
+import java.util.HashSet;
 import java.util.List;
+import java.util.Locale;
 import java.util.Map;
+import java.util.Set;
+import java.util.concurrent.ConcurrentHashMap;

+import static dev.ai4j.openai4j.chat.ResponseFormatType.JSON_SCHEMA;
 import static dev.langchain4j.internal.RetryUtils.withRetry;
 import static dev.langchain4j.internal.Utils.getOrDefault;
+import static dev.langchain4j.model.chat.Capability.RESPONSE_FORMAT_JSON_SCHEMA;
 import static dev.langchain4j.model.openai.InternalOpenAiHelper.DEFAULT_USER_AGENT;
 import static dev.langchain4j.model.openai.InternalOpenAiHelper.OPENAI_DEMO_API_KEY;
 import static dev.langchain4j.model.openai.InternalOpenAiHelper.OPENAI_DEMO_URL;
@@ -35,6 +49,7 @@ import static dev.langchain4j.model.openai.InternalOpenAiHelper.createModelListe
 import static dev.langchain4j.model.openai.InternalOpenAiHelper.createModelListenerResponse;
 import static dev.langchain4j.model.openai.InternalOpenAiHelper.finishReasonFrom;
 import static dev.langchain4j.model.openai.InternalOpenAiHelper.toOpenAiMessages;
+import static dev.langchain4j.model.openai.InternalOpenAiHelper.toOpenAiResponseFormat;
 import static dev.langchain4j.model.openai.InternalOpenAiHelper.toTools;
 import static dev.langchain4j.model.openai.InternalOpenAiHelper.tokenUsageFrom;
 import static dev.langchain4j.model.openai.OpenAiModelName.GPT_3_5_TURBO;
@@ -62,14 +77,15 @@ public class OpenAiChatModel implements ChatLanguageModel, TokenCountEstimator {
    private final Double presencePenalty;
    private final Double frequencyPenalty;
    private final Map<String, Integer> logitBias;
-    private final String responseFormat;
+    private final ResponseFormat responseFormat;
+    private final Boolean strictJsonSchema;
    private final Integer seed;
    private final String user;
+    private final Boolean strictTools;
+    private final Boolean parallelToolCalls;
    private final Integer maxRetries;
    private final Tokenizer tokenizer;
-
-    private final List<ModelListener<ChatLanguageModelRequest, ChatLanguageModelResponse>>
-            listeners;
+    private final List<ChatModelListener> listeners;

    @Builder
    public OpenAiChatModel(
@@ -85,8 +101,11 @@ public class OpenAiChatModel implements ChatLanguageModel, TokenCountEstimator {
            Double frequencyPenalty,
            Map<String, Integer> logitBias,
            String responseFormat,
+            Boolean strictJsonSchema,
            Integer seed,
            String user,
+            Boolean strictTools,
+            Boolean parallelToolCalls,
            Duration timeout,
            Integer maxRetries,
            Proxy proxy,
@@ -94,7 +113,7 @@ public class OpenAiChatModel implements ChatLanguageModel, TokenCountEstimator {
            Boolean logResponses,
            Tokenizer tokenizer,
            Map<String, String> customHeaders,
-            List<ModelListener<ChatLanguageModelRequest, ChatLanguageModelResponse>> listeners) {
+            List<ChatModelListener> listeners) {

        baseUrl = getOrDefault(baseUrl, OPENAI_URL);
        if (OPENAI_DEMO_API_KEY.equals(apiKey)) {
@@ -127,9 +146,19 @@ public class OpenAiChatModel implements ChatLanguageModel, TokenCountEstimator {
        this.presencePenalty = presencePenalty;
        this.frequencyPenalty = frequencyPenalty;
        this.logitBias = logitBias;
-        this.responseFormat = responseFormat;
+        this.responseFormat =
+                responseFormat == null
+                        ? null
+                        : ResponseFormat.builder()
+                                .type(
+                                        ResponseFormatType.valueOf(
+                                                responseFormat.toUpperCase(Locale.ROOT)))
+                                .build();
+        this.strictJsonSchema = getOrDefault(strictJsonSchema, false);
        this.seed = seed;
        this.user = user;
+        this.strictTools = getOrDefault(strictTools, false);
+        this.parallelToolCalls = parallelToolCalls;
        this.maxRetries = getOrDefault(maxRetries, 3);
        this.tokenizer = getOrDefault(tokenizer, OpenAiTokenizer::new);
        this.listeners = listeners == null ? emptyList() : new ArrayList<>(listeners);
@@ -139,27 +168,62 @@ public class OpenAiChatModel implements ChatLanguageModel, TokenCountEstimator {
        return modelName;
    }

+    @Override
+    public Set<Capability> supportedCapabilities() {
+        Set<Capability> capabilities = new HashSet<>();
+        if (responseFormat != null && responseFormat.type() == JSON_SCHEMA) {
+            capabilities.add(RESPONSE_FORMAT_JSON_SCHEMA);
+        }
+        return capabilities;
+    }
+
    @Override
    public Response<AiMessage> generate(List<ChatMessage> messages) {
-        return generate(messages, null, null);
+        return generate(messages, null, null, this.responseFormat);
    }

    @Override
    public Response<AiMessage> generate(
            List<ChatMessage> messages, List<ToolSpecification> toolSpecifications) {
-        return generate(messages, toolSpecifications, null);
+        return generate(messages, toolSpecifications, null, this.responseFormat);
    }

    @Override
    public Response<AiMessage> generate(
            List<ChatMessage> messages, ToolSpecification toolSpecification) {
-        return generate(messages, singletonList(toolSpecification), toolSpecification);
+        return generate(
+                messages, singletonList(toolSpecification), toolSpecification, this.responseFormat);
+    }
+
+    @Override
+    public ChatResponse chat(ChatRequest request) {
+        Response<AiMessage> response =
+                generate(
+                        request.messages(),
+                        request.toolSpecifications(),
+                        null,
+                        getOrDefault(
+                                toOpenAiResponseFormat(request.responseFormat(), strictJsonSchema),
+                                this.responseFormat));
+        return ChatResponse.builder()
+                .aiMessage(response.content())
+                .tokenUsage(response.tokenUsage())
+                .finishReason(response.finishReason())
+                .build();
    }

    private Response<AiMessage> generate(
            List<ChatMessage> messages,
            List<ToolSpecification> toolSpecifications,
-            ToolSpecification toolThatMustBeExecuted) {
+            ToolSpecification toolThatMustBeExecuted,
+            ResponseFormat responseFormat) {
+
+        if (responseFormat != null
+                && responseFormat.type() == JSON_SCHEMA
+                && responseFormat.jsonSchema() == null) {
+            responseFormat = null;
+        }
+
        ChatCompletionRequest.Builder requestBuilder =
                ChatCompletionRequest.builder()
                        .model(modelName)
@@ -172,13 +236,15 @@ public class OpenAiChatModel implements ChatLanguageModel, TokenCountEstimator {
                        .logitBias(logitBias)
                        .responseFormat(responseFormat)
                        .seed(seed)
-                        .user(user);
+                        .user(user)
+                        .parallelToolCalls(parallelToolCalls);
+
        if (!(baseUrl.contains(ZHIPU))) {
            requestBuilder.temperature(temperature);
        }

        if (toolSpecifications != null && !toolSpecifications.isEmpty()) {
-            requestBuilder.tools(toTools(toolSpecifications));
+            requestBuilder.tools(toTools(toolSpecifications, strictTools));
        }
        if (toolThatMustBeExecuted != null) {
            requestBuilder.toolChoice(toolThatMustBeExecuted.name());
@@ -186,12 +252,15 @@ public class OpenAiChatModel implements ChatLanguageModel, TokenCountEstimator {

        ChatCompletionRequest request = requestBuilder.build();

-        ChatLanguageModelRequest modelListenerRequest =
+        ChatModelRequest modelListenerRequest =
                createModelListenerRequest(request, messages, toolSpecifications);
+        Map<Object, Object> attributes = new ConcurrentHashMap<>();
+        ChatModelRequestContext requestContext =
+                new ChatModelRequestContext(modelListenerRequest, attributes);
        listeners.forEach(
                listener -> {
                    try {
-                        listener.onRequest(modelListenerRequest);
+                        listener.onRequest(requestContext);
                    } catch (Exception e) {
                        log.warn("Exception while calling model listener", e);
                    }
@@ -208,13 +277,16 @@ public class OpenAiChatModel implements ChatLanguageModel, TokenCountEstimator {
                            finishReasonFrom(
                                    chatCompletionResponse.choices().get(0).finishReason()));

-            ChatLanguageModelResponse modelListenerResponse =
+            ChatModelResponse modelListenerResponse =
                    createModelListenerResponse(
                            chatCompletionResponse.id(), chatCompletionResponse.model(), response);
+            ChatModelResponseContext responseContext =
+                    new ChatModelResponseContext(
+                            modelListenerResponse, modelListenerRequest, attributes);
            listeners.forEach(
                    listener -> {
                        try {
-                            listener.onResponse(modelListenerResponse, modelListenerRequest);
+                            listener.onResponse(responseContext);
                        } catch (Exception e) {
                            log.warn("Exception while calling model listener", e);
                        }
@@ -230,14 +302,18 @@ public class OpenAiChatModel implements ChatLanguageModel, TokenCountEstimator {
                error = e;
            }

+            ChatModelErrorContext errorContext =
+                    new ChatModelErrorContext(error, modelListenerRequest, null, attributes);
+
            listeners.forEach(
                    listener -> {
                        try {
-                            listener.onError(error, null, modelListenerRequest);
+                            listener.onError(errorContext);
                        } catch (Exception e2) {
                            log.warn("Exception while calling model listener", e2);
                        }
                    });
+
            throw e;
        }
    }
@@ -270,5 +346,10 @@ public class OpenAiChatModel implements ChatLanguageModel, TokenCountEstimator {
            this.modelName = modelName;
            return this;
        }
+
+        public OpenAiChatModelBuilder modelName(OpenAiChatModelName modelName) {
+            this.modelName = modelName.toString();
+            return this;
+        }
    }
 }
--- a/common/src/main/java/dev/langchain4j/model/openai/OpenAiChatModelName.java
+++ b/common/src/main/java/dev/langchain4j/model/openai/OpenAiChatModelName.java
@@ -0,0 +1,43 @@
+package dev.langchain4j.model.openai;
+
+public enum OpenAiChatModelName {
+    GPT_3_5_TURBO("gpt-3.5-turbo"), // alias
+    @Deprecated
+    GPT_3_5_TURBO_0613("gpt-3.5-turbo-0613"),
+    GPT_3_5_TURBO_1106("gpt-3.5-turbo-1106"),
+    GPT_3_5_TURBO_0125("gpt-3.5-turbo-0125"),
+
+    GPT_3_5_TURBO_16K("gpt-3.5-turbo-16k"), // alias
+    @Deprecated
+    GPT_3_5_TURBO_16K_0613("gpt-3.5-turbo-16k-0613"),
+
+    GPT_4("gpt-4"), // alias
+    @Deprecated
+    GPT_4_0314("gpt-4-0314"),
+    GPT_4_0613("gpt-4-0613"),
+
+    GPT_4_TURBO_PREVIEW("gpt-4-turbo-preview"), // alias
+    GPT_4_1106_PREVIEW("gpt-4-1106-preview"),
+    GPT_4_0125_PREVIEW("gpt-4-0125-preview"),
+
+    GPT_4_32K("gpt-4-32k"), // alias
+    GPT_4_32K_0314("gpt-4-32k-0314"),
+    GPT_4_32K_0613("gpt-4-32k-0613"),
+
+    @Deprecated
+    GPT_4_VISION_PREVIEW("gpt-4-vision-preview"),
+
+    GPT_4_O("gpt-4o"),
+    GPT_4_O_MINI("gpt-4o-mini");
+
+    private final String stringValue;
+
+    OpenAiChatModelName(String stringValue) {
+        this.stringValue = stringValue;
+    }
+
+    @Override
+    public String toString() {
+        return stringValue;
+    }
+}
--- a/common/src/main/java/dev/langchain4j/store/embedding/BaseEmbeddingStoreFactory.java
+++ b/common/src/main/java/dev/langchain4j/store/embedding/BaseEmbeddingStoreFactory.java
@@ -14,4 +14,8 @@ public abstract class BaseEmbeddingStoreFactory implements EmbeddingStoreFactory
    }

    public abstract EmbeddingStore<TextSegment> createEmbeddingStore(String collectionName);
+
+    public Map<String, EmbeddingStore<TextSegment>> getCollectionNameToStore() {
+        return collectionNameToStore;
+    }
 }
--- a/common/src/main/java/dev/langchain4j/store/embedding/milvus/MilvusEmbeddingStore.java
+++ b/common/src/main/java/dev/langchain4j/store/embedding/milvus/MilvusEmbeddingStore.java
@@ -19,25 +19,22 @@ import io.milvus.param.dml.SearchParam;
 import io.milvus.response.SearchResultsWrapper;

 import java.util.ArrayList;
+import java.util.Collection;
 import java.util.List;

 import static dev.langchain4j.internal.Utils.getOrDefault;
+import static dev.langchain4j.internal.ValidationUtils.ensureNotEmpty;
 import static dev.langchain4j.internal.ValidationUtils.ensureNotNull;
-import static dev.langchain4j.store.embedding.milvus.CollectionOperationsExecutor.createCollection;
-import static dev.langchain4j.store.embedding.milvus.CollectionOperationsExecutor.createIndex;
-import static dev.langchain4j.store.embedding.milvus.CollectionOperationsExecutor.flush;
-import static dev.langchain4j.store.embedding.milvus.CollectionOperationsExecutor.hasCollection;
-import static dev.langchain4j.store.embedding.milvus.CollectionOperationsExecutor.insert;
-import static dev.langchain4j.store.embedding.milvus.CollectionOperationsExecutor.loadCollectionInMemory;
+import static dev.langchain4j.store.embedding.milvus.CollectionOperationsExecutor.*;
 import static dev.langchain4j.store.embedding.milvus.CollectionRequestBuilder.buildSearchRequest;
 import static dev.langchain4j.store.embedding.milvus.Generator.generateRandomIds;
-import static dev.langchain4j.store.embedding.milvus.Mapper.toEmbeddingMatches;
-import static dev.langchain4j.store.embedding.milvus.Mapper.toMetadataJsons;
-import static dev.langchain4j.store.embedding.milvus.Mapper.toScalars;
-import static dev.langchain4j.store.embedding.milvus.Mapper.toVectors;
+import static dev.langchain4j.store.embedding.milvus.Mapper.*;
+import static dev.langchain4j.store.embedding.milvus.MilvusMetadataFilterMapper.formatValues;
+import static dev.langchain4j.store.embedding.milvus.MilvusMetadataFilterMapper.map;
 import static io.milvus.common.clientenum.ConsistencyLevelEnum.EVENTUALLY;
 import static io.milvus.param.IndexType.FLAT;
 import static io.milvus.param.MetricType.COSINE;
+import static java.lang.String.format;
 import static java.util.Collections.singletonList;
 import static java.util.stream.Collectors.toList;

@@ -59,7 +56,6 @@ public class MilvusEmbeddingStore implements EmbeddingStore<TextSegment> {
    private final MetricType metricType;
    private final ConsistencyLevelEnum consistencyLevel;
    private final boolean retrieveEmbeddingsOnSearch;
-
    private final boolean autoFlushOnInsert;

    public MilvusEmbeddingStore(
@@ -83,7 +79,7 @@ public class MilvusEmbeddingStore implements EmbeddingStore<TextSegment> {
                        .withPort(getOrDefault(port, 19530))
                        .withUri(uri)
                        .withToken(token)
-                        .withAuthorization(username, password);
+                        .withAuthorization(getOrDefault(username, ""), getOrDefault(password, ""));

        if (databaseName != null) {
            connectBuilder.withDatabaseName(databaseName);
@@ -95,21 +91,26 @@ public class MilvusEmbeddingStore implements EmbeddingStore<TextSegment> {
        this.consistencyLevel = getOrDefault(consistencyLevel, EVENTUALLY);
        this.retrieveEmbeddingsOnSearch = getOrDefault(retrieveEmbeddingsOnSearch, false);
        this.autoFlushOnInsert = getOrDefault(autoFlushOnInsert, false);
-        if (!hasCollection(milvusClient, this.collectionName)) {
+
+        if (!hasCollection(this.milvusClient, this.collectionName)) {
            createCollection(
-                    milvusClient, this.collectionName, ensureNotNull(dimension, "dimension"));
+                    this.milvusClient, this.collectionName, ensureNotNull(dimension, "dimension"));
            createIndex(
-                    milvusClient,
+                    this.milvusClient,
                    this.collectionName,
                    getOrDefault(indexType, FLAT),
                    this.metricType);
        }

-        loadCollectionInMemory(milvusClient, collectionName);
+        loadCollectionInMemory(this.milvusClient, collectionName);
+    }
+
+    public static Builder builder() {
+        return new Builder();
    }

    public void dropCollection(String collectionName) {
-        CollectionOperationsExecutor.dropCollection(milvusClient, collectionName);
+        CollectionOperationsExecutor.dropCollection(this.milvusClient, collectionName);
    }

    public String add(Embedding embedding) {
@@ -189,14 +190,104 @@ public class MilvusEmbeddingStore implements EmbeddingStore<TextSegment> {
                        METADATA_FIELD_NAME, toMetadataJsons(textSegments, ids.size())));
        fields.add(new InsertParam.Field(VECTOR_FIELD_NAME, toVectors(embeddings)));

-        insert(milvusClient, collectionName, fields);
+        insert(this.milvusClient, this.collectionName, fields);
        if (autoFlushOnInsert) {
            flush(this.milvusClient, this.collectionName);
        }
    }

-    public static Builder builder() {
-        return new Builder();
+    /**
+     * Removes a single embedding from the store by ID.
+     *
+     * <p>CAUTION
+     *
+     * <ul>
+     *   <li>Deleted entities can still be retrieved immediately after the deletion if the
+     *       consistency level is set lower than {@code Strong}
+     *   <li>Entities deleted beyond the pre-specified span of time for Time Travel cannot be
+     *       retrieved again.
+     *   <li>Frequent deletion operations will impact the system performance.
+     *   <li>Before deleting entities by comlpex boolean expressions, make sure the collection has
+     *       been loaded.
+     *   <li>Deleting entities by complex boolean expressions is not an atomic operation. Therefore,
+     *       if it fails halfway through, some data may still be deleted.
+     *   <li>Deleting entities by complex boolean expressions is supported only when the consistency
+     *       is set to Bounded. For details, <a
+     *       href="https://milvus.io/docs/v2.3.x/consistency.md#Consistency-levels">see
+     *       Consistency</a>
+     * </ul>
+     *
+     * @param ids A collection of unique IDs of the embeddings to be removed.
+     * @since Milvus version 2.3.x
+     */
+    @Override
+    public void removeAll(Collection<String> ids) {
+        ensureNotEmpty(ids, "ids");
+        removeForVector(
+                this.milvusClient,
+                this.collectionName,
+                format("%s in %s", ID_FIELD_NAME, formatValues(ids)));
+    }
+
+    /**
+     * Removes all embeddings that match the specified {@link Filter} from the store.
+     *
+     * <p>CAUTION
+     *
+     * <ul>
+     *   <li>Deleted entities can still be retrieved immediately after the deletion if the
+     *       consistency level is set lower than {@code Strong}
+     *   <li>Entities deleted beyond the pre-specified span of time for Time Travel cannot be
+     *       retrieved again.
+     *   <li>Frequent deletion operations will impact the system performance.
+     *   <li>Before deleting entities by comlpex boolean expressions, make sure the collection has
+     *       been loaded.
+     *   <li>Deleting entities by complex boolean expressions is not an atomic operation. Therefore,
+     *       if it fails halfway through, some data may still be deleted.
+     *   <li>Deleting entities by complex boolean expressions is supported only when the consistency
+     *       is set to Bounded. For details, <a
+     *       href="https://milvus.io/docs/v2.3.x/consistency.md#Consistency-levels">see
+     *       Consistency</a>
+     * </ul>
+     *
+     * @param filter The filter to be applied to the {@link Metadata} of the {@link TextSegment}
+     *     during removal. Only embeddings whose {@code TextSegment}'s {@code Metadata} match the
+     *     {@code Filter} will be removed.
+     * @since Milvus version 2.3.x
+     */
+    @Override
+    public void removeAll(Filter filter) {
+        ensureNotNull(filter, "filter");
+        removeForVector(this.milvusClient, this.collectionName, map(filter));
+    }
+
+    /**
+     * Removes all embeddings from the store.
+     *
+     * <p>CAUTION
+     *
+     * <ul>
+     *   <li>Deleted entities can still be retrieved immediately after the deletion if the
+     *       consistency level is set lower than {@code Strong}
+     *   <li>Entities deleted beyond the pre-specified span of time for Time Travel cannot be
+     *       retrieved again.
+     *   <li>Frequent deletion operations will impact the system performance.
+     *   <li>Before deleting entities by comlpex boolean expressions, make sure the collection has
+     *       been loaded.
+     *   <li>Deleting entities by complex boolean expressions is not an atomic operation. Therefore,
+     *       if it fails halfway through, some data may still be deleted.
+     *   <li>Deleting entities by complex boolean expressions is supported only when the consistency
+     *       is set to Bounded. For details, <a
+     *       href="https://milvus.io/docs/v2.3.x/consistency.md#Consistency-levels">see
+     *       Consistency</a>
+     * </ul>
+     *
+     * @since Milvus version 2.3.x
+     */
+    @Override
+    public void removeAll() {
+        removeForVector(
+                this.milvusClient, this.collectionName, format("%s != \"\"", ID_FIELD_NAME));
    }

    public static class Builder {
@@ -213,8 +304,8 @@ public class MilvusEmbeddingStore implements EmbeddingStore<TextSegment> {
        private String password;
        private ConsistencyLevelEnum consistencyLevel;
        private Boolean retrieveEmbeddingsOnSearch;
-        private Boolean autoFlushOnInsert;
        private String databaseName;
+        private Boolean autoFlushOnInsert;

        /**
         * @param host The host of the self-managed Milvus instance. Default value: "localhost".