From 39006e740a904c46e12110fc9fe9c6e0a7471e04 Mon Sep 17 00:00:00 2001 From: SunDean <1264174498@qq.com> Date: Wed, 6 Sep 2023 21:38:12 +0800 Subject: [PATCH] =?UTF-8?q?Created=20=E8=AF=AD=E4=B9=89=E6=A8=A1=E5=9E=8B?= =?UTF-8?q?=E4=BD=BF=E7=94=A8=E6=89=8B=E5=86=8C=20(markdown)?= MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit --- 语义模型使用手册.md | 191 ++++++++++++++++++++++++++++++++++++++++++++ 1 file changed, 191 insertions(+) create mode 100644 语义模型使用手册.md diff --git a/语义模型使用手册.md b/语义模型使用手册.md new file mode 100644 index 0000000..1f2e280 --- /dev/null +++ b/语义模型使用手册.md @@ -0,0 +1,191 @@ +# 语义建模 + +**简介** + +语义模型建模是使用超音数的第一步。在这个模块中, 它可以连接上你的数据库引擎, 并通过简单方便的方式来帮助你将物理数据建模为数据源、维度和指标等逻辑概念。建模完成后, 你就可以在问答中通过自然语言的方式来和你的物理数据交互啦~ + +**问题示例** + +为了帮助你更好地理解建模的过程, 我们通过一个问题示例来进行介绍: 超音数本身作为一个产品, 那么如何用语义建模来统计它的埋点访问数据呢?比如超音数在一段时间内的访问用户数是多少?这些用户的访问次数和停留时长是怎样的?这些用户来自哪些部门?这些用户看了哪些页面?分别看了多少次?等我们建模完成, 这些问题的答案也就浮出水面了。 + +### 数据库连接 +为了进行数据查询, 我们首先需要创建一个数据库连接, 创建一个数据库连接主要分为三个步骤, +1. 填写连接信息 +2. 点击测试连接, 若连接测试通过, 则可点击保存。否则, 返回步骤1 +3. 点击保存。 + +如图1-1所示, 由于超音数的埋点访问数据被存放在H2数据库中, 因此我们创建了一个H2数据库实例作为例子。除了H2数据库以外, 我们还支持MySQL, ClickHouse等多种常见数据库。 + +
+ 图1-1 数据库连接示例
+
+ 图2-1 主题域示例
+
+ 图2-2 模型示例
+
+ 图3-1 数据源创建方式
+
+ 图3-2 SQL脚本
+
+ 图3-3 数据源基本信息
+
+ 图3-4 数据源字段信息
+
+ 图3-5 数据源列表
+
+ 图4-1 维度列表
+
+ 图4-2 维度创建
+
+ 图5-1 指标列表
+
+
+### 1 指标场景
+
+指标场景指基于特定的维度, 进行指标的分析, 这会涉及到 group by 的聚合计算, 比如"按活跃区域查询播放量", 会基于维度**活跃区域**, 查看指标**播放量**在不同活跃区域的聚合数据。
+
+#### 1.1 问答可见
+
+* 如果希望在指标场景中设置特定维度/指标的可见性, 通过以下3步即可实现:
+
+1. 在左侧列表中选择需要可见的维度和指标;
+2. 点击中间的 **>** 标志, 可将其状态由不可见转变为可见;
+3. 点击底部**完成**按钮。
+
+
+
+* 如果还希望实现**维度值的联想**, 通过以下步骤即可实现:
+
+1. 对特定的维度, 勾选**维度值可见**选项;
+2. 如果有高级设置的需要, 可点击**可见维度值设置**[可选的], 高级设置可对该维度的维度值设置黑名单、白名单、sql 过滤规则等 ;
+3. 点击底部**完成**按钮。
+
+
+
+设置后, 系统会启动后台任务, 计算对应维度的维度值, 并写入到问答知识库中, 当用户输入不完整的歌手名时, 系统会根据知识库中的数据进行维度值联想。
+
+
+
+#### 1.2 默认设置
+
+指标场景可以对时间范围进行默认设置:
+
+
+
+- **时间范围:** 在指标场景时, 如果用户查询中没有指定时间范围, 如"查询流行歌手的播放量", 按上图设置后, 最终查询为"查询流行歌手的最近7天的播放量"。
+
+### 2 实体场景
+
+实体场景指仅仅查询原始明细数据, 不涉及到聚合计算, 比如"周杰伦的代表作"。
+
+#### 2.1 实体
+
+实体是指数据表中的唯一标识, 类似于主键。 一般而言, 一个主题域中只有一个实体。如维度歌手名可以作为艺人库实体的唯一标识。
+
+实体只在实体场景中存在, 指标场景不存在实体。当系统识别出当前查询是针对实体展开的, 那么就可确定当前是一个明细查询的场景。实体设置主要分为实体别名和唯一标识两部分:
+
+- **实体别名:** 可用别名来简化实体查询, 使查询更简单;
+- **唯一标识:** 一个实体的唯一标识, 一般是维度。
+
+
+
+#### 2.2 问答可见
+
+具体配置含义可参考 *1.1 指标场景问答可见*
+
+#### 2.3 默认设置
+
+- **维度/指标:** 实体场景时, 如果用户查询中没有指定维度/指标, 系统会用此处设置的维度/指标进行查询, 如输入"周杰伦", 系统会将周杰伦作为维度歌手名的筛选条件, 然后查询出设置的维度/指标数据;
+- **时间范围:** 用户可根据数据特定的时效性, 设置时间点, 如果用户明细查询中不涉及时间信息, 则会用此处配置的时间进行查询。
+
+
\ No newline at end of file