规范
逐字稿格式要求
逐字稿格式要求
文件
- 首选
.txt(UTF-8),可用.docx
角色标签(任一均可)
- 中文全称:咨询师: / 来访者:
- 中文缩写:咨: / 访:
- 英文:THERAPIST:/COUNSELOR:/CLIENT:/PATIENT:
- 单字母:T:/D:/P:/C:
必须满足的两条格式要求(重要)
1) 角色标签后必须紧跟冒号(: 或 :)。
- 冒号用于明确分隔“角色标签”和“内容”。省略冒号会导致角色与内容黏连,系统容易误判说话人。
2) 角色切换必须换行(一行只写一个说话人)。
- 当从“咨询师”切换到“来访者”(或反之)时,必须另起一行。
- 不要把多个角色的内容写在同一行,否则容易造成识别混乱。
结构
[可选时间戳] + 角色标签 + 冒号 + 内容- 同一说话者尽量保持连续段落
示例
[00:00:05] 咨:我们先从你这周的感受开始说起,可以吗?
[00:00:12] 访:这周我有两次突然的紧张……常见错误(请避免)
- 缺少冒号(错误):
咨 我们先从你这周的感受开始说起 - 不换行(错误):
咨:…… 访:……(同一行出现两个角色)