From 76e978e8cd7efbe38e6c9ae84ba8399d9ba69a8e Mon Sep 17 00:00:00 2001 From: Jun Zhang Date: Wed, 22 Nov 2023 00:17:19 -0600 Subject: [PATCH] =?UTF-8?q?Updated=20=E8=B6=85=E9=9F=B3=E6=95=B0=E8=AE=BE?= =?UTF-8?q?=E8=AE=A1=E6=80=9D=E8=B7=AF=20(markdown)?= MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit --- 超音数设计思路.md | 2 +- 1 file changed, 1 insertion(+), 1 deletion(-) diff --git a/超音数设计思路.md b/超音数设计思路.md index f25dbf4..e215bc2 100644 --- a/超音数设计思路.md +++ b/超音数设计思路.md @@ -1,4 +1,4 @@ -通过自然语言界面(Natural Language Interface)访问数据是数据库上古大神们就开始畅想的情境,在学术界也一直是专门的研究方向。对我们影响比较大的两篇论文是IBM在2016年发表的[ATHENA](http://www.vldb.org/pvldb/vol9/p1209-saha.pdf)和谷歌在2017年发表的[Analyza](https://static.googleusercontent.com/media/research.google.com/zh-CN//pubs/archive/45791.pdf),但它是纯基于规则的工程实现。2017年之后,随着大规模数据集[Seq2SQL](https://arxiv.org/pdf/1709.00103.pdf)和[Spider](https://aclanthology.org/D18-1425.pdf)发布,基于AI模型的解决方案如雨后春笋般涌现,从seq2seq到slot filling,从fine-tuning到in-context learning,各种奇淫技巧不一而足。直到ChatGPT横空出世,基于prompting来实现Text-to-SQL几乎成了大家的共识。 +通过自然语言界面(Natural Language Interface)访问数据是数据库上古大神们就开始畅想的情境,在学术界也一直是专门的研究方向。对我们影响比较大的两篇论文是IBM在2016年发表的[ATHENA](http://www.vldb.org/pvldb/vol9/p1209-saha.pdf)和谷歌在2017年发表的[Analyza](https://static.googleusercontent.com/media/research.google.com/zh-CN//pubs/archive/45791.pdf),但它是纯基于规则的工程实现。2017年之后,随着大规模数据集[Seq2SQL](https://arxiv.org/pdf/1709.00103.pdf)和[Spider](https://aclanthology.org/D18-1425.pdf)发布,基于AI模型的解决方案如雨后春笋般涌现,从seq2seq到slot filling,从schema linking到intermediate representation,各种奇淫技巧不一而足。直到ChatGPT横空出世,基于prompting来实现Text-to-SQL几乎成了大家的共识。 在项目初期,我们也曾尝试通过prompt engineering让ChatGPT直接生成SQL,但经过多轮迭代,在稳定性和可靠性方面始终无法达到生产可用的期望,总的来说有如下问题: