From efcf147473928e9e4a45cc4ca38b5dbcaaf8a85e Mon Sep 17 00:00:00 2001 From: Jun Zhang Date: Thu, 7 Sep 2023 18:08:43 +0800 Subject: [PATCH] =?UTF-8?q?Updated=20=E8=B6=85=E9=9F=B3=E6=95=B0=E8=AE=BE?= =?UTF-8?q?=E8=AE=A1=E6=80=9D=E8=B7=AF=20(markdown)?= MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit --- 超音数设计思路.md | 2 ++ 1 file changed, 2 insertions(+) diff --git a/超音数设计思路.md b/超音数设计思路.md index 118b973..99f0f1c 100644 --- a/超音数设计思路.md +++ b/超音数设计思路.md @@ -47,6 +47,8 @@ 当前的实现机制是,定期从semantic model中抽取名称、别名、取值来构建词典,形成内部的knowledge base。查询解析阶段,先对输入文本分词,再采用n-gram词典探测的机制。经过前期调研,中文NLP框架[HanLP](https://github.com/hankcs/HanLP)相对成熟,可以满足需要。 +Schema mapper会将所有达到匹配阈值要求的schema项及其相似度得分一并保存到info对象,传递给后续semantic parsing环节引用,最终会由parser挑选输入给LLM。 + ### 引入Semantic Corrector