Updated 超音数设计思路 (markdown)

Jun Zhang
2023-11-22 00:17:19 -06:00
parent 41574c5f88
commit 76e978e8cd

@@ -1,4 +1,4 @@
通过自然语言界面Natural Language Interface访问数据是数据库上古大神们就开始畅想的情境在学术界也一直是专门的研究方向。对我们影响比较大的两篇论文是IBM在2016年发表的[ATHENA](http://www.vldb.org/pvldb/vol9/p1209-saha.pdf)和谷歌在2017年发表的[Analyza](https://static.googleusercontent.com/media/research.google.com/zh-CN//pubs/archive/45791.pdf)但它是纯基于规则的工程实现。2017年之后随着大规模数据集[Seq2SQL](https://arxiv.org/pdf/1709.00103.pdf)和[Spider](https://aclanthology.org/D18-1425.pdf)发布基于AI模型的解决方案如雨后春笋般涌现从seq2seq到slot fillingfine-tuning到in-context learning各种奇淫技巧不一而足。直到ChatGPT横空出世基于prompting来实现Text-to-SQL几乎成了大家的共识。 通过自然语言界面Natural Language Interface访问数据是数据库上古大神们就开始畅想的情境在学术界也一直是专门的研究方向。对我们影响比较大的两篇论文是IBM在2016年发表的[ATHENA](http://www.vldb.org/pvldb/vol9/p1209-saha.pdf)和谷歌在2017年发表的[Analyza](https://static.googleusercontent.com/media/research.google.com/zh-CN//pubs/archive/45791.pdf)但它是纯基于规则的工程实现。2017年之后随着大规模数据集[Seq2SQL](https://arxiv.org/pdf/1709.00103.pdf)和[Spider](https://aclanthology.org/D18-1425.pdf)发布基于AI模型的解决方案如雨后春笋般涌现从seq2seq到slot fillingschema linking到intermediate representation各种奇淫技巧不一而足。直到ChatGPT横空出世基于prompting来实现Text-to-SQL几乎成了大家的共识。
在项目初期我们也曾尝试通过prompt engineering让ChatGPT直接生成SQL但经过多轮迭代在稳定性和可靠性方面始终无法达到生产可用的期望总的来说有如下问题 在项目初期我们也曾尝试通过prompt engineering让ChatGPT直接生成SQL但经过多轮迭代在稳定性和可靠性方面始终无法达到生产可用的期望总的来说有如下问题