技术方案 ①

技术管线与数据模型

从录音采集到陪练看板的一条异步流水线,背后是六张可萃取、可诊断、可演练的核心数据表。
端到端技术管线
01 采集
数据接入
手机上传
微信 / 企微导入
02 存储
对象存储
OSS 音视频
原始文本归档
03 转写
ASR 转写
异步队列
语音转文字
04 结构化
区分 · 切分
说话人区分
五段流程切分
05 智能
LLM 引擎
萃取 · 诊断 · 异议标注 · 虚拟对练
RAG · 教培招生知识库
06 沉淀
知识库
金牌话术
方法论沉淀
07 应用
触达层
推送 · 陪练
经营看板
核心数据模型 · 6 实体
Session
会话
一次面咨 / 邀约 店长 · 门店 · 时点 原始音视频引用
Transcript
转写
说话人区分文本 五段流程切分 时间轴对齐
GoldenScript
金牌话术
萃取的优秀话术 按场景 / 段落归档 入库可推送学习
Diagnosis
诊断
未成交问题定位 分段评分 · 建议 驱动针对性演练
Rehearsal
演练
虚拟家长角色 沙盘对练记录 考核过关判定
Objection
异议
家长 / 孩子关注点 高频异议聚类 占比分析反哺
实体关系
Session → 转写为 → Transcript ,由其萃取 GoldenScript 、生成 Diagnosis 、提取多条 Objection Diagnosis → 驱动 → Rehearsal 闭环。